关系经济人类预测化学自然
中准网
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

Meta赶超AlphaFold60倍,比预测速度更重要的是什

6月18日 终离去投稿
  业内又发生了一件大事。
  据最新报道,Meta团队利用大型语言模型ESMFold,预测了超6。17亿个蛋白质结构,只花了两周时间。
  并且,这套模型的底层代码免费开放,任何人都可以使用这些预测结果。
  继AlphaFold后,这场蛋白质结构预测的军备竞赛愈发激烈
  人类为何要死磕蛋白质?多个模型同台竞技,比预测速度更重要的是什么?
  01、为什么要死磕蛋白质?
  蛋白质结构是指各种蛋白质分子的空间结构。
  根据结构特征可划分为四级,包括组成多肽链的线性氨基酸序列、螺旋和折叠、三维结构分子以及最终的蛋白质复合物分子。
  图:蛋白质的四级结构
  由线性氨基酸组成的蛋白质,只有折叠(Fold)成特定的空间结构,才具有相应的生理活性和生物学功能。比如血红蛋白,负责在机体内运输代谢物质;淀粉酶用以加速生物化学反应等
  我们常说的蛋白质结构预测,则是指从它的氨基酸序列(一级)中,预测折叠以及蛋白质的三维结构(二、三、四级)。
  这一直是自然科学面临的重大挑战。
  数十年来,众多科研机构、公司纷纷致力于攻破难题,解决方法从X射线晶体学、核磁共振波谱、低温电子显微镜(cryoEM)、冷冻电镜,一步步发展到了如今的AI模型。
  而谈到AIforScience的扛大旗者,大家首先想到的也许是DeepMind。
  2018年,蛋白质结构预测模型AlphaFold横空出世,引领了全球将人工智能用于生物学研究的一股热潮,各地的优秀研究者均投身其中。
  2021年,Nature和Science公布的年度十大科学突破中,AlphaFold2首次入选。它对大部分蛋白质结构的预测与真实结构只差一个原子的宽度,水平接近冷冻电镜等精密仪器。
  今年7月,AlphaFold2成功预测出超100万个物种的2。14亿个蛋白质结构,几乎涵盖地球上所有已知蛋白质,再次引发轰动。
  如今,又一家科技巨头卷入了蛋白质结构预测的军备竞赛。
  02、Meta成绩单:比AlphaFold快60倍
  日前,Meta通过AI技术成功预测了来自细菌、病毒和其他尚未分类的微生物中,超6亿种蛋白质的结构。
  据介绍,本次用于结构预测的语言模型拥有150亿参数,是迄今为止最大的蛋白质语言模型。这种方式基于大量文本来做训练。
  为了将其应用于蛋白质预测,AI团队负责人AlexanderRives和同事为模型输入了已知蛋白质的序列。这些序列通过20种不同氨基酸组成的链条来表达,每一种氨基酸都用一个字母来表示。
  接着模型就学会了自动完成。给它输入一部分氨基酸结构被遮蔽的蛋白质分子,它就能预测出剩余的结构。
  Rives表示,这种训练过程可以让AI模型更直观地认识蛋白质序列。
  之后,团队用宏基因组DNA数据库进行测试,这些DNA全部来自环境,包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。
  借助这种新的结构预测能力,Meta在短短两周内,用一个由大约2000个GPU组成的集群上,预测出了图谱中超6亿个宏基因组蛋白质的序列。
  图:ESMFold模型预测过程
  这个网络被命名为ESMFold。在预测速度上,它比AlphaFold快约60倍。这也表明模型可将蛋白质结构预测扩展到更大的数据库。
  另外,这套模型的底层代码是免费开放的,任何研究人员都可使用这些预测结果。
  03、比预测速度更重要的是什么?
  在如今的蛋白质结构预测领域,除了谷歌外,还涌现了诸多玩家。
  比如华盛顿大学大卫贝克实验室的RoseTTAF国内包括百度的HelixFold、深势科技的UniFold、华深智药旗下OmegaFold它们都有着差异化的工作原理及独特优势。
  图:各类蛋白质折叠预测工具统计
  而这次Meta推出的ESMFold,与AlphaFold2和RoseTTAFold相比,它在多序列输入的蛋白质结构预测的准确度上相当。
  核心优势在于,它的计算速度比AlphaFold2快一个数量级,能在更有效的时间尺度上探索蛋白质结构空间,缩小数十亿量级的序列数据库与缓慢发展的结构及功能数据库之间的差距。
  图:ESMFold与AlphaFold2的比较
  工作原理上也有区别。AlphaFold2和RoseTTAFold依赖于结构和序列匹配算法,而Meta的ESMFold则基于语言学习模型。
  具体来说,前两者使用多序列比对(MSA)和类似蛋白质的模板来实现结构预测的最佳性能;而ESMFold利用语言模型的内部表征,只用一个序列作为输入就能生成结构预测。
  首尔国立大学计算生物学家MartinSteinegger表示,AlphaFold数据库很大一部分蛋白质由几乎相同的结构组成,而宏基因组数据库包含了很多未知结构。
  不过,这些模型能否切实应用到药物研发中?又能发挥多大的作用?各界传出了质疑声。
  之前,AlphaFold2模型预测2亿个蛋白质结构后,麻省理工大学、薛定谔公司等对该模型进行了实测,结果都比预想的差了一些。
  图:AlphaFold2的一些局限
  比如在虚拟筛选上,包括难以考虑辅因子、翻译后修饰的影响,以及预测的构象不够多样等,这些都可能对基于AF2结构的筛选结果造成大的影响。
  对于此次Meta开发的ESMFold,哈佛大学进化生物学家SergeyOvchinnikov认为,有些结果可能缺乏明确参考,或是非编码DNA被误认为是蛋白质编码材料。
  他表示:看起来仍有一半以上蛋白质是我们一无所知的。
  对药物发现而言,目前仍不宜夸大这些Fold的影响。它解决的是药物发现中计算方面的问题,而这部分也难以称得上解决,至多提供了一个工具。
  不过可以确定的是:AI模型会持续迭代,多关注预测结果的准确度,激励竞争将有望降低蛋白质结构预测的成本和难度。
  未来,AI预测蛋白质还会更卷吗?大家怎么看?
  参考链接:
  https:www。nature。comarticlesd41586022035391
  https:www。biorxiv。orgcontent10。11012022。07。20。500902v1
  https:ai。facebook。comblogproteinfoldingesmfoldmetagenomics
  TheEnd
投诉 评论 转载

我国的操作系统openkylin体验openkylin7。0体验版发布几天来,今天终于从openkylin官网下载了镜像,在虚拟机里安装体验了一下,我的体验如下:openkylin采用优麒麟开发的桌面环境ukui……Meta赶超AlphaFold60倍,比预测速度更重要的是什业内又发生了一件大事。据最新报道,Meta团队利用大型语言模型ESMFold,预测了超6。17亿个蛋白质结构,只花了两周时间。并且,这套模型的底层代码免费开放,任何……敦煌静默管理,云南出现病例暑期游市场反复,本地夜游崛起根据昆明发布通报,8月11日024时,云南省新增本土确诊病例1例,系德钦县在区域协查推送人员核酸检测中发现。第一财经记者采访云南部分酒店和景区后了解到,目前大部分云南的酒……报表开发工具FastReport。Net如何在移动端生成WeFastReport。Net是一款全功能的WindowsForms、ASP。NET和MVC报表分析解决方案,使用FastReport。NET可以创建独立于应用程序的。NET报表……遇间播报东眺洱海西望苍山,探索大理风花雪月之地海纳尔云墅背靠苍山,面朝洱海,近距离感受大理绮丽秀美的自然景观,探索大理历史文化及浓郁的风土人情。大理海纳尔云墅度假酒店酒店位于苍海高尔夫国际社区,紧邻大理著名的……只要我开始改变,一切都会改变生活中,我们总是感叹:我们为什么没能成为我们想成为的人。我们没能成为我们想成为的人,是因为我们总是不去改变,只要我们开始改变,一切都会改变。我有一个朋友,性格内向,……跨境小课堂NO。31探讨跨境电商团队培训的重要性跨境小课堂NO。31探讨跨境电商团队培训的重要性在往期跨境小课堂的主题内容中,不断提及有关跨境培训的相关内容,无论是从跨境电商业务开展的载体、行业的监管配套政策、运……国外媒体妖魔化中国治安,然而反遭自家老外打脸中国真的很安全文山河观史编辑山河观史在国外最大的用户社区油管上面,关于中国的话题一直是经久不衰的,大量的用户在上面发表关于中国的看法,其中不乏老外给老外科普中国是什么样子,有一些……河北首次启动实施中科院重大科技成果转化合作专项中科院重大科技成果转化合作对接会在线上成功举办。河北省科技厅供图中新网廊坊6月27日电(邢璐宋敏涛)在6月26日至28日举行的中国2022年中国廊坊国际经济贸易洽谈会(简……比利亚雷亚尔起诉巴尔韦德殴打比利亚雷亚尔起诉费德里科巴尔韦德殴打他人。比利亚雷亚尔10日(韩国时间)在俱乐部网站上表示,亚历克斯巴埃纳在与皇马的比赛结束后在球队大巴上遭到殴打。俱乐部决定起诉嫌……51岁前世界重量级拳王,将体重降至163磅,仍然希望复出赛场有些令人难以置信,已经51岁的前世界重量级拳王克里斯伯德,在经过两年的转变之后,竟然将体重降到了163磅,并且他仍然期待着复出赛场。作为两度世界冠军得主,伯德去年就计划重……拉杜卡努法网次轮被爆扫出局!体能崩盘但别贬,2年后会是她巅峰北京时间5月25日晚上,英国球手、中国和罗马尼亚混血儿拉杜卡努止步法网第二轮。人生中首次法网正赛,早早出局,结束红土赛季的争夺。整场比赛,很合乎拉杜卡努的特点。第一盘比赛……
传统企业互联网转型互联网化四大误区与对策终年造句用终年造句大全新信息环境下的高校图书馆服务营销文化建设芯片短缺压力下,光伏逆变器生产商如何突围?什么是五险一金上海进博会四大展厅太前卫,老外争抢中国万亿市场出奇招分期付款消费正在让你变得贫穷那是因为我在你这里得不到有色金属行业2022年投资策略声东击西造句用声东击西造句大全怎么吸引买家提高点击率提高成交小儿口臭病因及食疗方法
华为因何不上市?巨头倒下乃前车之鉴,资本与坚持水火难容揭秘结婚找哪种男人比较靠谱你喜欢刘德华唱的歌曲还是演的电影?基本情况造句用基本情况造句大全好消息!中国女篮迎来接班人,15岁身高2米26,有望超越坎贝刹车软,改完了还软,是卡钳不好,还是刹车片不好?下馆子庆祝丈母娘生日,子女抢着付钱,她被夸福气好,乐开了花上有痘痘怎么办(痘痘怎么消除)绿茶的好处和坏处绿茶的冲泡方法和步骤高中成长的烦恼作文开头和结尾学会这碗油泼面,再也不用叫外卖了,吃着特别解馋,做法一看就会前年破800亿去年破900亿仲恺今年经济总量或超千亿

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州