免费可商用开源GPT模型问世，50G权重直接下载，性能不输G

自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

免费可商用开源GPT模型问世，50G权重直接下载，性能不输G

3月7日萌嘟嘟投稿

　　萧箫发自凹非寺
　　量子位公众号QbitAI
　　真开源GPT模型，终于来了。
　　参数量级130亿，大小比肩最近Meta开放的LLaMA13B，但从数据集、模型权重到计算优化训练，全部开源。
　　最关键的是，可商用。
　　没错，虽然就GPT3而言，之前DeepMind、Meta等组织陆陆续续开源过几个模型，不过基本都是半遮半掩。
　　尤其最接近GPT3的MetaOPT模型，不仅权重只开放给研究者，而且不可商用：
　　这意味着之前企业就算能抄作业，抄来的也没办法直接用。
　　现在，一家名叫Cerebras的公司开源了这一系列GPT模型，业界终于有机会追赶了。模型性能如何？
　　Cerebras一共开源了7个GPT模型，参数量分别达到1。11亿、2。56亿、5。9亿、13亿、27亿、67亿和130亿。
　　据Cerebras公司表示，他们开放出来的模型不仅包含数据集，可用于研究也可商用，而且关键是预训练模型权重开放（从下图来看文件大小近50G）。
　　基于他们公开的预训练模型，大伙儿只需要用少量的数据对对模型进行微调，就能构建出效果不错的模型来。
　　除此之外，这次GPT模型的训练还额外考虑到了计算优化训练（ComputeOptimalTraining）。
　　这个方法最早由DeepMind在2022年提出，名叫Chinchilla，它认为大语言模型的语料数量和模型效果之间符合一个凸曲线，因此模型参数量和训练程度成一定比例。
　　依据这个方法，DeepMind认为，包括GPT3在内的超大参数LLM模型，有很多都是训练不足的。
　　基于此，Cerebras搞出了这一系列GPT模型，并将背后的流程进行了开源。
　　所以，CerebrasGPT系列模型性能如何呢？
　　团队将CerebrasGPT系列和LLaMA、GPT3等模型的性能进行了对比。
　　这是包括GPT3、Gopher、Chinchilla和LLaMA在内的其他GPT模型，在完成句子、问答等特定任务上表现的效果。
　　这是不同大小的CerebrasGPT模型零次学习（0shot）的效果：
　　数据对比不是特别直观，团队还将结果进行了可视化。
　　可以看出，在最终性能相差不大的情况下，CerebrasGPT的训练效率要更高一些。
　　曾开发最大AI芯片
　　其实，Cerebras的本职是一家AI芯片公司。
　　Cerebras公司由SeanLie和AndrewFeldman等人于2016年创立。
　　其中，AndrewFeldman曾创建微型服务器公司SeaMicro，并以3。34亿美元的价格出售给AMD。
　　与其他AI芯片公司不同，Cerebras开发的芯片超大，像晶圆一样（但确实是芯片）：
　　他们当年做出来过一个名叫晶圆级引擎（CerebrasWaferScaleEngine，简称WSE）的AI芯片，将逻辑运算、通讯和存储器集成到单个硅片上，一口气创下了4项世界纪录：晶体管数量最多的运算芯片：总共包含1。2万亿个晶体管。虽然三星曾造出2万亿个晶体管的芯片，却是用于存储的eUFS。芯片面积最大：尺寸约20厘米23厘米，总面积46，225平方毫米。面积和一块晶圆差不多。片上缓存最大：包含18GB的片上SRAM存储器。运算核心最多：包含40万个处理核心。
　　后来这个超大WSE又升级了二代，然后团队基于WSE2打造出了一个名叫CerebrasCS2的AI超算。
　　这次的CerebrasGPT系列模型，就是在这个CerebrasCS2的AI超算中训练出来的。对此这家公司表示：
　　虽然训练这么大体量的模型通常需要几个月时间，但我们几周就能搞定。
　　Cerebras还表示，虽然很多硬件公司都声称训练效果能接近英伟达GPU的水平，但他们还没看到任何一家亲自推动开源LLM的硬件公司，这势必不利于开源LLM的发展。
　　这波啊，这波Cerebras格局大了（手动狗头）
　　模型地址：
　　https：huggingface。cocerebrasCerebrasGPT13B
　　参考链接：
　　https：www。cerebras。netblogcerebrasgptafamilyofopencomputeefficientlargelanguagemodels
　　完
　　量子位QbitAI头条号签约
　　关注我们，第一时间获知前沿科技动态

投诉评论转载

风声征信成功举办2023年智能风控数字化发展趋势研讨会！2023年4月13日，风声征信主办的2023年智能风控数字化发展趋势研讨会在上海大酒店成功举办，本次会议重点讨论了后疫情时代企业数字化转型中的智能风控技术以及整体解决方案等话题……中国银行在一季度加大清收节奏，不过于关注季度之间的平衡视觉中国图去年，中国银行的不良贷款一升一降。截至去年12月末，中国银行不良贷款总额2316。77亿元，比上年末增加228。85亿元；不良贷款率1。32，比上年末下降0。0……家中常备的保和丸，不止消食，还能治疗这10种病大家好，我是屈医生。提起保和丸大家应该都不陌生，已经是我们寻常家中常备的消食的中成药了，但是你知道吗？保和丸它不止能够消食，还能治疗这10种病，今天去医生就给你讲清楚。第……大傻哥成奎安患病离世13年后，两房太太的选择大不相同成奎安是中国香港导演们最爱用的坏人专业户，每次都出演大反派。他曾出演过《英雄本色》、《监狱风云》、《赌神》、《江湖情》等经典电影。可现实生活中，成奎安却是一个重情重……罗布泊的馈赠新疆塔里木盆地是中国最大的内陆盆地，东西长1400千米，南北最宽处约550千米，面积56万平方千米。其地势西高东低并略向北倾，最低处海拔高程约780米，位于已经干涸的罗布泊湖盆……外媒评选2022年十大优化最佳的PC游戏外媒DSOGaming近日评选出2022年优化最好的十大游戏，一起来看一下。全文如下：2022年很怪，评出十大优化最差游戏可以说是轻而易举，但要评十大优化最佳还真是……超第二名4倍！海尔多门冰箱欧洲多国位居TOP1在全球化过程中，坚持自主创牌的海尔智家不断在各区域实现市场引领。据2月份欧洲信息显示，海尔多门冰箱在意大利、德国、西班牙等多国位居市场TOP1，且份额均超40。其中在德国，海尔……建议中老年人生活别太节俭，多吃5种高蛋白食物，身体好人一旦到了中年，身体的各个器官开始退化，稍微不注意就会引来一些小病，最重要的就是提高自身的抵抗力。只有身体健健康康的，才是这辈子最大的幸福。提高身体抵抗力不只靠锻炼，在饮……81！欧足坛疯狂一夜，26年纪录刷新，11脚射门进7球神迹！昨晚今晨的欧洲足坛好戏不断，除了西超杯国家德比、伦敦德比等重量级比赛，还打出了两场超级大比分！意甲中，亚特兰大主场82横扫萨勒尼塔纳，创造了意甲26年来单场进球纪录，法甲中，摩……每天吃一个鸡蛋，是心血管良药，还是祸根？最多吃几个？鸡蛋，可以说是家家户户的餐桌上都有，每天早上一个鸡蛋，一杯牛奶，也是很多家庭早餐的标配。但是，根据2021年心血管病中心发布的报告显示，我国心血管病患病人数已经达到了3。……免费可商用开源GPT模型问世，50G权重直接下载，性能不输G萧箫发自凹非寺量子位公众号QbitAI真开源GPT模型，终于来了。参数量级130亿，大小比肩最近Meta开放的LLaMA13B，但从数据集、模型权重到计算优化……20！亚洲第5崛起，领跑世界杯小组，完胜奥运冠军，追上中国女2022年U20女足世界杯比赛全面打响，世界排名第18、亚洲排名第5的韩国女足取得了小组赛开门红，以20完胜世界排名第7的加拿大女足。韩国女足的崛起是持续性的，她们这些年一直走……

<<<<<<－>>>>>>

智能手表怎么选？华为橙子大健康dido血压手表的硬件软件对比赵忠祥去世两年，家人为他立雕像引发网友争议不断本领不够大的时候，需要像蜗牛一样缓慢稳定的行动谷爱凌恢复美国国籍成实锤？福布斯出面佐证，新华社辟谣意大利杯0绝杀佛罗伦萨夸德拉多第91分钟造乌龙华为打车来了，北京深圳南京杭州上线，滴滴迎来强敌这凉拌菜，冬天吃太适合了，3样食材拌一拌，开胃爽口，暖身驱寒朱军胜诉，重返央视，还能主持春晚吗？败诉者将会面临什么？作为一个魔兽死忠的遗言订单暴增！供不应求！这些产品，国内国外都卖爆了！生产线满负荷联想上市推手被约谈史玉柱股权被冻结，杨柳事件更进一步？四川重庆强强联姻，迎来国家级新高铁，未来发展很强硬

《颐和园》教学反思湖北将依托电商平台发放超3000万元消费券，本周首批发放我爱家乡的雨如何才能有效预防老花眼小学语文一年级下语文园地六设计只做独一无二的自己作文750字人任何时候都有选择并能做出改变应对消费升级，七匹狼推出K254联名系列【歌词】歌手：南天群星热评聚热点网健身疼痛是该坚持还是适当休息张雨绮卷发发型图片浪漫性感尽在卷发时尚斯坦李去世是真的吗斯坦李是谁

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州