在场虚拟空间单机训练200亿参数大模型Cerebras打破新

6月18日相思宫投稿

　　转载自机器之心
　　本周，芯片创业公司Cerebras宣布了一个里程碑式的新进展：在单个计算设备中训练了超过百亿参数的NLP（自然语言处理）人工智能模型。
　　由Cerebras训练的AI模型体量达到了前所未有的200亿参数，所有这些都无需横跨多个加速器扩展工作负载。这项工作足以满足目前网络上最火的文本到图像AI生成模型OpenAI的120亿参数大模型DALLE。
　　Cerebras新工作中最重要的一点是对基础设施和软件复杂性的要求降低了。这家公司提供的芯片WaferScaleEngine2（WSE2）顾名思义，蚀刻在单个台积电7nm制程的整块晶圆上，该面积通常足以容纳数百个主流芯片具有惊人的2。6万亿个晶体管、85万个AI计算内核和40GB集成缓存，封装后功耗高达15kW。
　　接近晶圆大小的WaferScaleEngine2，面积比一个iPad还大。
　　虽然Cerebras的单机在体量上已经类似于超算了，但在单块芯片中保留多达200亿个参数的NLP模型仍然显著降低了数千个GPU的训练成本，以及相关的硬件和扩展要求，同时消除了在它们之间分割模型的技术困难。Cerebras表示，后者是NLP工作负载中最痛苦的方面之一，有时需要几个月才能完成。
　　这是一个定制化的问题，不仅对每个正在处理的神经网络，对于每个GPU的规格以及将它们联系在一起的网络都是独一无二的这些元素必须在第一次训练开始之前提前设置好，而且也不能跨系统移植。
　　Cerebras的CS2是一个独立的超级计算集群，其中包括WaferScaleEngine2芯片，所有相关的电源、内存和存储子系统。
　　200亿的参数量大概是个什么水平？在人工智能领域里，大规模预训练模型是最近各家科技公司和机构正在努力发展的方向，OpenAI的GPT3是一种NLP模型，它可以写出足以欺骗人类读者的整篇文章、做数学运算和翻译，其具有惊人的1750亿个参数。DeepMind的Gopher于去年年底推出，将参数量的纪录提高到2800亿。
　　最近一段时间，谷歌大脑甚至宣布训练了一个超过万亿参数的模型SwitchTransformer。
　　在NLP领域中，体量更大的模型被证明效果更好。但传统上，只有极少数公司拥有足够的资源和专业知识来完成分解这些大型模型，将其分散到数百或数千个图形处理单元的艰苦工作，Cerebras首席执行官、联合创始人AndrewFeldman说道。因此也只有极少数公司可以训练大型NLP模型这对于行业的其他人来说太昂贵、太耗时且无法使用。
　　现在，Cerebras的方法能够降低GPT3XL1。3B、GPTJ6B、GPT313B和GPTNeoX20B模型的应用门槛，使整个AI生态系统能够在几分钟内建立大型模型，并在单个CS2系统上训练它们。
　　然而，就像旗舰级CPU的时钟速度一样，参数量只是大模型性能的其中一项指标。最近，一些研究在减少参数的前提下已经取得了更好的结果，例如DeepMind今年4月提出的Chinchilla，只用700亿个参数就在常规情况下超过了GPT3和Gopher。
　　这类研究的目标当然是更智能的工作，而不是更努力地工作。因此Cerebras的成就比人们第一眼看到的更为重要该研究让我们相信现有的芯片制程水平能够适应日益复杂的模型，该公司表示，以特殊芯片为核心的系统具备了支撑数千亿甚至数万亿参数模型的能力。
　　在单芯片上可训练参数量的爆炸式增长需要依赖Cerebras的WeightStreaming技术。该技术可以将计算和内存占用分离，根据AI工作负载中快速增长的参数量，允许内存进行任意量级的扩展。这使得设置时间从几个月减少到几分钟，并且可以在GPTJ和GPTNeo等型号之间切换。正如研究者所说：只需要敲几次键盘。
　　Cerebras以低成本、便捷的方式向人们提供了运行大型语言模型的能力，开启了人工智能令人兴奋的新时代。它为那些不能花费数千万美元的组织提供了一个简单而廉价的，参与到大模型竞争之中的方式，Intersect360研究公司的首席研究官DanOlds说道。当CS2客户在大量数据集上训练GPT3和GPTJ级模型时，我们非常期待CS2客户的新应用和新发现。
　　参考内容：
　　https：www。tomshardware。comnewscerebrasslaysgpusbreaksrecordforlargestaimodelstrainedonasingledevice
　　https：www。cerebras。netpressreleasecerebrassystemssetsrecordforlargestaimodelsevertrainedonasingledevice

投诉评论转载

王者荣耀S27赛季推迟更新，张良公孙离新皮肤原画曝光hello大家好，我是王者小白君最近疫情真的太严重了，小伙伴们一定要做好防护工作，保护好自己。没事能不出门就不要出门啦，大家要积极配合防疫工作，让我们一起战胜疫情，加油！……在场虚拟空间单机训练200亿参数大模型Cerebras打破新转载自机器之心本周，芯片创业公司Cerebras宣布了一个里程碑式的新进展：在单个计算设备中训练了超过百亿参数的NLP（自然语言处理）人工智能模型。由Cerebra……江苏苏王长脸想变美，拒做这几件事长脸女孩最值得骄傲的事就是脸型高级又抗老。像苏王在电视上看到很多明星就是高级长脸，20多岁30多岁都基本上不会有什么改变。比如黄圣依、李沁、王丽坤等当然要说保养护理……首页点进去就能关，支付宝可一键取消自动扣款近日，有网友发现，支付宝上了个一键取消自动扣款的功能。在支付宝首页的消息盒子推送相关应用消息时，可以从该入口直接查看清晰的订阅服务列表，并选择是否一键取消。管理代扣功能浮……勇士怕是要爆炸近日，薪资专家BobbyMarks在《SportsCenter》节目里谈到了勇士休赛期可能的操作！勇士今年夏天有多名自由球员，包括别利察、达米安李、卢尼、小佩顿、小波特，……全明星名单出炉，有哪几位遗珠没能够入选让球迷感到遗憾呢？全明星的最终大名单已经出炉了，相信大家也都看过了，最终的结果和第一次地投票出来的结果还是有很多的不同的。每一次的全明星总会有很多联赛中表现都很不错的球员没有办法入选，现在……CBA顶薪先生赛季报效！旧伤再度复发，2016选秀状元或无缘在姚明大力推行改革之下，如今我们的CBA联赛越来越像大洋彼岸的美国NBA联赛了。作为全球最高水平的职业篮球联赛，健全完整的大学生球员选秀体系，是NBA可以长盛不衰的根本。……缅怀英烈，不忘初心，砥砺前行面对敌人的屠刀他们用血肉之躯撑起肩负的责任视死如归冲锋在前捍卫中华大地山河无恙他们用鲜血谱写英雄赞歌舍生取义战斗到最后一刻他们不惧生死明志报……小中医说糖尿病只要测空腹就可以了吗我国2型糖尿病的患病率为10。4，其中男性高于女性。另外发现，新诊断的2型糖尿病患者以餐后血糖升高为主，这可能与中国患者胰岛细胞功能的衰退更显著，饮食结构多以碳水化合物为……nba裁判的考核标准，几种典型的篮球规则手势在正规的篮球比赛中，常常会出现球员不满裁判判罚，与裁判沟通，理论的现象，而一般裁判也会严肃认真的给出判断，而根据国际篮联规定，裁判也是需要通过一系列的考核，获得相关证书才能上岗……改变就从2022年的4月4日开始吧今天就从不焦虑开始吧！焦虑是生活的家常便饭。焦虑只不过是对于未知前路的一种模糊不清的恐惧感，它总是指向未来，也总是在传递危险信息。改善的方法：认识的即时……JDG20V5，两把带走榜一大哥，369告诉卡萨我长大了，卡恭喜JDG两把比赛直接带走榜一大哥。这两天榜首的IG双CV5和WBG，纷纷被斩落下马，断了连胜。看到TheShy弟弟070WBG输了，V5一看急了，尤其是rooki……

<<<<<<－>>>>>>

可口造句用可口造句大全集团致客户的感谢信各月龄宝宝的推荐睡眠时间国粹传承独具匠心人到老年，不做这三件事，比锻炼身体更延年益寿专业折叠旗舰vivoXFold来了，8999元起，开启折叠屏学姐的春季穿搭白藜芦醇什么时候服用最佳长期喝白藜芦醇有副作用吗永远不要向别人解释自己如何烹饪鲜豆角矛盾的沙特阿拉伯，现代化外袍下，保守的宗教思维根深蒂固勇士逆转掘金！普尔杀死比赛，双库无解，三后卫立功，2首发毒瘤

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找