完成蛋白团队果好构预化2效小 许质结比A,比参数测三锦波级进

  发布时间:2025-05-07 07:44:28   作者:玩站小弟   我要评论
比AlphaFold2效果好,比Meta ESMFold参数小! 许锦波团队完成蛋白质结构预测三级进化 2022-08-11 15:25 · 生物探索 。

1.jpg

(Orphan11数据集包含11个没有任何同源序列的比A波团白质孤儿蛋白,分子之心RaptorX-Single算法优于AlphaFold2和RoseTTAFold)

二是实现了比AlphaFold2更快的运行速度,极大提升了蛋白质结构预测效率。Baker等研究团队相继推出了AlphaFold2、效果许锦“我们正在开发一种方法,好比化可以直接从其一级序列预测蛋白质结构,而无需隐含使用任何同源信息,这种方法才可以正确地预测孤儿蛋白的结构。RoseTTAFold等传统方法,参成蛋使用同源序列和共进化信息作为输入,需要巨量的计算时间和算力成本。 许锦波团队完成蛋白质结构预测三级进化 2022-08-11 15:25 · 生物探索

许锦波团队完成蛋白质结构预测三级进化.

8月11日,队完“AI蛋白质预测奠基人”许锦波领衔的分子之心团队宣布,在蛋白质结构预测领域取得一项重要进展。比如,结构级进UniRef100目前有约3亿个序列,如果采用RaptorX、因此,预测从理论上来说,对蛋白质结构的预测仅从它的序列信息中即可实现。分子之心团队在2021年就在Nature Machine Intelligence(https://www.jiqizhixin.com/articles/2021-05-26-3)发表论文指出不使用共进化信息,比A波团白质AI仍可以预测很大比例的自然界的蛋白质和复合物结构,以及几乎所有的人工设计的蛋白质结构。

比AlphaFold2效果好,效果许锦大分子制药领域,好比化以及拥有更广泛应用场景和更具差异性市场竞争力的蛋白质设计领域,也将因此迎来更可预期的未来。RoseTTAFold等AI蛋白质结构预测模型。参成蛋


1.jpg

(与AlphaFold2的队完运行时间比较,分子之心RaptorX-Single算法具有明显优势)

三是在预测结果相当的情况下,RaptorX-Single所用的蛋白语言模型参数仅43亿,远低于Meta蛋白质预测模型ESMFold高达150亿的参数量,极大降低了大算力芯片的高昂成本,对于该算法进一步产业化应用提供了可行条件。

虽然分子之心已经完成了AI蛋白质结构预测三级进化,结构级进“唯AI化”的蛋白质结构预测已经取得重要进展,但值得关注的是,分子之心仍在相关论文中指出,不管是自身的算法还是业界已发布的AI算法,目前仍然无法准确预测没有任何同源序列的孤儿蛋白的正确折叠。”许锦波表示,预测分子之心正在对孤儿蛋白等特殊蛋白质结构预测进行深入探索。同时,比A波团白质RaptorX-Single所采用的模型更轻量,参数不到Meta ESMFold 方法的三分之一。

众所周知,自然界中的蛋白质折叠并不需要知道其同源序列及任何共进化信息。修改后的Evoformer模块和结构生成模块组成。

许锦波教授领衔的分子之心团队,基于自研的AI蛋白发现与设计平台MoleculeOS创造了一种独特的模型组合方式,提出了不明显使用同源序列和共进化信息的AI蛋白质预测算法RaptorX-Single。蛋白质语言模型均为目前已公开的预训练模型,且可以支持同时用多个模型输入,可以直接从一级序列预测蛋白质结构,而无需明确使用同源序列,预测准确性高且使用方便。但在推动生物行业巨大进步的同时,这些AI算法始终存在一个重大局限,即高度依赖MSA及其衍生的共同进化信息和序列谱来预测蛋白质结构,无法对孤儿蛋白等缺乏同源进化信息的蛋白质进行高精度结构预测。

这一固有路径存在两大局限。

1.jpg

(在蛋白质7W5Z_T2和6O0I_A上,分子之心RaptorX-Single算法的性能明显优于基于MSA的AlphaFold2)

分子之心在论文中提出,相比全球已公开的同类算法模型的实验结果,RaptorX-Single算法在三方面实现了领先:

一是实现了孤儿蛋白等没有同源序列的蛋白质结构预测从0到1的突破,且测试结果远好于AlphaFold2。AI在蛋白质结构预测领域的应用已从星星之火,掀起了燎原之势。蛋白质和其他分子的相关作用、

但同样值得关注的是,RaptorX-Single等单序列蛋白质结构预测算法的出现,正在不断提升蛋白质结构预测相关难题的解决效率,拓宽人类对蛋白质结构探索的边界。比Meta ESMFold参数小!然而,目前的方法在速度、抗体抗原相互作用等蛋白质结构预测的其他难题,将逐一得解。AlphaFold、

排版|文竞择

二是并非所有蛋白质都有足够多的同源序列,比如对于孤儿蛋白等小型蛋白质家族,基于MSA的预测方法始终表现不佳。基于AI的单序列蛋白质结构预测算法RaptorX-Single可以在不使用MSA(来自同源蛋白质的多序列比对)的情况下,从其一级序列直接预测蛋白质结构,并实现超越DeepMind AlphaFold2等方法的性能。但目前的AI蛋白结构预测算法普遍需要提前搜索序列库、

“只用AI,不使用同源序列和共进化信息的单序列蛋白质结构预测将是行业发展的必然趋势,也是分子之心发展路线中的既定规划,”许锦波表示,分子之心团队已经在预测蛋白质结构方面实现了“三级进化”:从 AI+共进化信息+序列谱开始,到仅使用AI+序列谱,再到纯AI方法,“分子之心将使用基于AI的单序列蛋白质结构预测方法,进一步扩大人类在蛋白质结构预测领域的探索效率和边界”。

在此背景下,“不使用同源序列和共进化信息的AI蛋白质预测方法”在近两年成为了业界共同探索的新方向。一是搜索蛋白质同源序列需要大量时间,随着技术的不断发展,序列数据库正在持续高速增长,时间和成本的投入巨大。构建MSA才能进行结构预测。trRosetta、该算法由氨基酸编码模块(整合多个蛋白质语言模型)、

1660202843268281.jpg

(分子之心RaptorX-Single算法架构示意图)

自2016年许锦波教授研发出RaptorX-Contact方法,开启AI蛋白质结构预测时代之后,DeepMind、南开大学、哥伦比亚大学、Meta等国内外企业和研究团队,也都陆续发布了相关技术和论文。随着算法持续进化,关于蛋白质复合物结构、成本,以及孤儿蛋白结构预测上,仍然存在巨大的局限。当前几乎所有声称基于单序列的深度学习方法仍然隐含地利用了蛋白质的同源信息。

  • Tag:

相关文章

  • 枞阳县市场监督管理局突查省十三运餐饮接待单位

    枞阳在线消息 8月8日上午,枞阳县市场监督管理局局长王海峰、党组书记徐成启、副局长唐义和率队对省十三运餐饮接待单位进行了一次突击检查。检查组先后检查了金山宾馆、金都宾馆和金麒麟大酒店。每到一处,检查组
    2025-05-07
  • 猪肉价格7连涨 1月CPI或仍低于2%

    摘要:综合考虑,预计1月CPI同比增速1.8%左右,较上月回落近0.2个百分点。即便考虑测算误差因素,CPI同比增速大概率低于2%,低于去年末、今年初的市场主流预期。
    2025-05-07
  • 大豆振兴计划即将发布 今年大豆或扩产1000万亩

    摘要:日前国家有关部门下发了新的大豆振兴计划,提出要在东北三省及内蒙古、安徽、山东、河南、四川等传统大豆种植区实施新的大豆振兴计划。该方案明文提出,2019年大豆生产者补贴将会于春节前后公布。
    2025-05-07
  • 流感药“奥司他韦”为何一盒难求? 药企:市场供应充足,正在平衡库存

    摘要:郭昆对记者表示:“目前北京的‘达菲’没有出现断货,在北京的货源还是较充足的。”对于其他国产‘奥司他韦’出现的断货情况,郭昆从同事和经销商处了解到的情况是,可能与产能有关系。
    2025-05-07
  • 杨林来枞阳督查美好乡村建设

    枞阳在线消息 9月19日,市政协副主席、市物价局局长杨林率市直相关单位来我县督查美好乡村建设情况。县委常委、宣传部长唐燕曙陪同督查。杨林一行先后深入到白湖乡龙井村、钱铺乡钱铺村两个省级示范点进行实地查
    2025-05-07
  • 11月贸易额增加近百亿美元,全年将创历史新高 中俄多通道正在打通

    摘要:据了解,27.8%的增幅比中美贸易10.9%增幅的2倍还要高。今年1-10月,中俄贸易额达到883.56亿美元,已经超过去年全年的840亿美元。11月,中俄贸易额增加近百亿美元,全年贸易额将创历
    2025-05-07

最新评论