沧州三亚菏泽经济预测自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

快了一个0!Meta祭出150亿参数蛋白质大模型,碾压Alp

12月16日 牵手手投稿
  编辑:好困拉燕【新智元导读】Meta的蛋白质预测模型ESMFold来了!整整150亿参数,堪称又大又快又好。
  迄今为止规模最大的蛋白质语言模型问世了!
  一年前,DeepMind开源AlphaFold2连登Nature、Science,刷爆生物和AI学界。
  一年后,Meta带着速度快一个数量级的ESMFold来了。
  不光速度快,模型还足足有150亿个参数。
  LeCun发推称赞,这是MetaFAIR蛋白质团队的伟大新成果。
  共同一作ZemingLin透露,30亿参数的大模型在256个GPU上训练了3个星期,而ESMfold在128个GPU上用了10天。至于150亿参数的版本,目前还不清楚。
  他还表示,代码随后肯定会开源,敬请关注!
  又大又快!
  今天,我们的主角是ESMFold,一个从蛋白质个体的序列,直接进行高准确度、端对端、原子层级结构预测的模型。
  论文地址:https:www。biorxiv。orgcontent10。11012022。07。20。500902v1
  150亿个参数带来的好处不必多说通过训练,如今的大模型可以在原子大小的精度上预测蛋白质的三维结构。
  从准确度上看,ESMFold和AlphaFold2、RoseTTAFold差不多。
  但是,ESMFold推测速度要比AlphaFold2快一个数量级!
  一下说数量级可能不好理解三者之间速度的对比,看看下面这张图就懂了。
  有啥区别?
  虽说AlphaFold2和RoseTTAFold在原子分辨率结构预测问题上取得了突破性的成功,但它们也依赖于使用多序列比对(MSA)和类似的蛋白质结构模板来实现最佳性能。
  相比之下,通过利用语言模型的内部表征,ESMFold只用一个序列作为输入就能生成相应的结构预测,从而大大加快了结构预测的速度。
  研究人员发现,ESMFold对低复杂度序列的预测与当下最先进的模型相当。
  而且,结构预测的准确性与语言模型的复杂度息息相关,也就是说,当语言模型能更好地理解序列时,便可以更好地理解结构。
  目前,有数十亿结构和功能未知的蛋白质序列,其中许多来自元基因组测序。
  利用ESMFold,研究人员只需6个小时,就能折叠完成100万个元基因组序列的随机样本。
  其中很大一部分具有高置信度,并且与任何已知的结构不同(在数据库中没有记录)。
  研究人员认为,ESMFold可以帮助理解那些超出现有认知的蛋白质结构。
  此外,由于ESMFold的预测速度比现有的模型快一个数量级,因此研究人员便可借助ESMFold来协助填补快速增长的蛋白质序列数据库与进展缓慢的蛋白质结构和功能数据库之间的鸿沟。
  150亿参数的蛋白质语言模型
  接下来我们就来具体说说Meta这款全新的ESMFold。
  ESM2是一个基于Transformer的语言模型,并使用注意力机制来学习输入序列中成对氨基酸之间的相互作用模式。
  相对于上一代模型ESM1b,Meta对模型结构、训练参数进行了改进,并增加了计算资源和数据。同时,相对位置嵌入的加入,使模型能够推广到任意长度的序列。
  从结果来看,具有1。5亿个参数的ESM2模型比具有6。5亿个参数的ESM1b模型表现得更好。
  此外,在结构预测的基准上,ESM2也超过了其他的蛋白质语言模型。这种性能的提高与大型语言建模领域建立的规律是一致的。
  随着ESM2规模的增加,可以观察到语言建模的精度有很大的提高。
  端到端的单序列结构预测
  SMFold和AlphaFold2的一个关键区别是,ESMFold使用语言模型表示,消除了对明确的同源序列(以MSA的形式)作为输入的需要。
  ESMFold通过用一个处理序列的Transformer模块取代处理MSA的计算昂贵的网络模块,简化了AlphaFold2中的Evoformer。这种简化意味着ESMFold的速度大大提高,远高于基于MSA的模型。
  折叠主干的输出接下来又被一个结构模块处理,它负责输出最终的原子级结构和预测的置信度。
  研究人员将ESMFold与AlphaFold2和RoseTTAFold在CAMEO(2022年4月至2022年6月)和CASP14(2020年5月)测试集上进行比较。
  当只给单一序列输入时,ESMFold的表现要比Alphafold2好得多。
  而当使用完整的管道时,AlphaFold2在CAMEO和CASP14上分别达到了88。3和84。7。ESMFold在CAMEO上取得了与RoseTTAfold相当的准确率,其平均TM分数为82。0。
  结论
  研究人员发现,以无监督学习为目标的语言模型在一个大型的进化多样化的蛋白质序列数据库中训练,能够对蛋白质结构进行原子级的分辨率预测。
  将语言模型的参数扩大到15B,就可以系统地研究规模对蛋白质结构学习的影响。
  我们看到,蛋白质结构预测的非线性曲线是模型规模的函数,并且观察到了语言模型对序列的理解程度与结构预测之间的强烈联系。
  ESM2系列的模型是迄今为止训练的最大的蛋白质语言模型,其参数仅比最近开发的最大文本模型少一个数量级。
  而且,ESM2比以前的模型有非常大的改进,即使在150M的参数下,ESM2也比ESM1代语言模型在6。5亿的参数下捕捉到更准确的结构图。
  研究人员表示,ESMFold性能的最大驱动力是语言模型。由于语言模型的迷惑性和结构预测的准确性之间有很强的联系,他们发现当ESM2能较好地理解蛋白质序列时,就可以获得与目前最先进的模型相当的预测结果。
  ESMFold获得了准确的原子分辨率结构预测,推理时间还比AlphaFold2快了一个数量级。
  在实践中,速度的优势甚至还要更大。因为ESMFold不需要搜索和进化相关的序列来构建MSA。
  虽说有更快的方法可以减少搜索时间,但再怎么减少还是可能会很长。
  而推理时间的极大缩短带来的利好不言自明速度的提高将使绘制大型元基因组学序列数据库的结构空间成为可能。
  除了基于结构的工具来识别远端同源性和保护性之外,用ESMFold进行快速准确的结构预测,还能在大量新序列集合的结构和功能分析中发挥重要作用。
  在有限的时间内获得数以百万计的预测结构,有利于发现对天然蛋白质的广度和多样性的新认识,并能发现全新的蛋白质结构和蛋白质功能。
  作者介绍
  本文的共同一作是来自MetaAI的ZemingLin。
  据个人主页介绍,Zeming在纽约大学攻读博士学位,并在MetaAI担任研究工程师(访问),主要负责后端基础设施的工作。
  他本硕都就读于弗吉尼亚大学,在那里,他和YanjunQi大佬一同做有关机器学习应用的研究,尤其是在蛋白质结构预测方面。
  感兴趣的领域为深度学习、结构预测,以及信息生物学。
  参考资料:
  https:www。biorxiv。orgcontent10。11012022。07。20。500902v1。full。pdf
投诉 评论 转载

浪姐张俪手机屏保是自己的酷照,黑墨镜手托下巴,露出迷人的微笑浪姐张俪晒出九宫格,有两张是自己手机屏保,手机上是张俪本人的照片,乌黑亮丽的长发,戴着大黑墨镜,手托着下巴,露出迷人的微笑,这一刻感觉她好美好酷。少女心还是有的,张俪戴的……防高血压高血脂要镁食据《老人报》报道,近年来,国外科学家研究指出,人到中年以后要镁食,即要多食含镁丰富的食物。缺镁比高血压更危险专家解释说,心血管疾病,如冠心病、高血压、高血脂、心肌梗……曹晴放弃央视主持工作,不顾反对远嫁国外,被丈夫虐待吃剩饭菜可怜之人必有可恨之处这句话用给曹晴再合适不过了。面对家庭暴力已经对簿公堂却仍不选择离开;阔太梦显然早已破碎不堪却仍愿意沉迷其中。在常人看来,她的想法已经有些不正常了……给同桌的表白短信精选表白短信集锦在我们上学时代,我们会发现老师会特意安排男生和女生坐在一起,这在我们小学时候尤为明显。到了中学时候就比较少了。也许就在同桌学习的过程中,有些人就慢慢的产生了感情,但有不敢表达出……五千铁人下南洋和新天钢在印尼的拓荒路印度尼西亚,苏拉威西岛,莫洛瓦利县,地球赤道地区。中资机构在这里建设运营的青山工业园中,一座规模宏大的焦化厂正在紧锣密鼓地建设,建成后,将凭借年产500万吨焦炭的产能,成……明日方舟最新公招Tag必出黄票组合头条创作挑战赛嘿,你终于来啦!关注瑄瑄了解明日方舟最新资讯哦【公开招募】干员更新更新时间:1月17日16:00更新说明:更新后,以下干员将加入并常驻【公开招募……人体精气存在这个部位,只要养好了,每天都能精气十足精气是生命的本源,人如果缺少精气,不仅会体现在精神状态上,健康程度也会下降。古文《论衡》中提及人之所以生者,精气也。中医认为,人体精气藏于肾脏中,并有肾藏精的概念。肾脏中的精气……快了一个0!Meta祭出150亿参数蛋白质大模型,碾压Alp编辑:好困拉燕【新智元导读】Meta的蛋白质预测模型ESMFold来了!整整150亿参数,堪称又大又快又好。迄今为止规模最大的蛋白质语言模型问世了!一年前,Deep……我,2014年来到三亚闯世界,现在却要下决心离开这里,真的很头条创作挑战赛海南三亚我叫吴艳娟,安徽人,今年42岁。2014年,我从原单位辞职,独自一个人到三亚来闯世界。9年来在事业上坎坎坷坷、起起伏伏,现在我终于要下定决心离开这里。但要……多芬洁面慕斯怎么样不同款可以满足不同肤质多芬洁面慕斯怎么样多芬在国内主打的是沐浴露系列,但在日本它的洁面产品更出名一些。这次测评的就是这款日本原装进口,号称是日本保湿洁面的第一名、每7秒就会卖出一瓶的多芬氨基酸……缅甸街头的一幕当地人觉得这很正常,中国游客却表示让人尴尬全世界拥有200多个国家,每个国家都会有自己的文化特色,比如法国的阿德格角,总是会看到许多小伙伴不穿衣服。虽然让我们觉得比较尴尬,但是大他们在弘扬某一种文化。(此处已添加……万古造句用万古造句大全(181)五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。李白(182)曲阜孔庙孔林孔府普通纪念币背面主景图案为孔庙大成殿,内缘上方为孔林神道的万古长春坊,左上方为孔府大……
春游围炉煮茶必备!皮薄肉厚汁水多,沃柑已到最佳赏味期新手站长如何选购入门级SSL证书非典型小米系公司IPO素士科技和创米数联是否还有底线?WPS品牌再升级专注国内,另两款国产软件低调出国门,却遭禁令正能量人生格言网坛巨星小威爱情生活细节?皮蓬前妻与乔丹二儿子恋情幕后故事?丁威迪谈近期战绩不佳我们曾输给缺兵少将的掘金也曾输给火箭福州最美人间四月天神龟预测今日卡塔尔世界杯四场比赛不中就煲汤呀库里状态火热因上赛季夺冠带来的自信汤茶回勇我们就能争冠傻脸娜闪耀红毯太美!一身斗篷红裙好惊艳,瘦了好多重返颜值巅峰美不胜收!北京至九寨沟旅游专列4月18日发车,速览宝宝补钙的14个小妙招让补钙事半功倍菊花脑的好处,吃了菊花脑有什么效果?民族魂,永存电视剧亮剑范文500字一年级数学下册教学计划范冰冰消失的100天:步刘晓庆后尘,她还能全身而退吗?方敬诗歌《雨景》原文及赏析网红连体夫妻无腿丈夫劈腿女粉丝,独臂妻带娃离开后怎样了低血压不宜吃什么王敦之乱历史上一次非常著名的反叛暴动带出造句用带出造句大全金针菇萝卜汤的做法有哪些

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找