谷歌母公司DeepMind与EMBL
7月28日,谷歌母公司Alphabet其人工智能公司DeepMind公司与欧洲生物信息研究所(EMBL-EBI)的合作团队公布了生物学领域的一项重大飞跃。他们使用人工智能(AI)系统AlphaFold预测超过100万个物种的2.地球上几乎所有已知的蛋白质都有14亿个蛋白质结构。这一突破将加快新药的发展,为基础科学带来新的革命。
2020年底,当人们对AlphaFold印象还停留在打败全人类围棋高手的时候。AI该系统在生物学领域的出现带来了新的惊喜。AlphaFold蛋白质折叠问题已经成功地解决了生物学问题,可以根据蛋白质氨基酸序列预测蛋白质的三维结构。
仅仅半年后,DeepMind和EMBL-EBI合作在《自然》论文中发表AlphaFold蛋白结构数据库的预测。该数据库涵盖人类和20种常见模式生物的35万个蛋白质结构.准确预测5%的人类蛋白质结构——在此之前,科学界分析的蛋白质结构只覆盖17%的人类蛋白质序列氨基酸。人工智能预测蛋白质结构领域的一系列突破,也被《科学》评为2021年的年度科学突破。
现在,DeepMind与EMBL-EBI更进一步的合作团队。AlphaFold对蛋白质结构的预测不再局限于人类与模式生物,而是拓展至涵盖了动植物、细菌等的100万个物种,预测的蛋白质结构数量也提升了数百倍。
这个数据库涵盖了整个蛋白质宇宙,我们进入了数字生物学的新时代。DeepMind首席执行官Demis Hassabis博士点评道。
诺贝尔化学奖早在1972年就获得了Christian Anfinsen在诺贝尔颁奖典礼上,医生提出蛋白质氨基酸结构应能完全决定其三维结构。但由于氨基酸可能形成的蛋白质构象是天文数字,因此很难通过计算预测蛋白质结构。用传统的实验手段(如X射线晶体学)来解决这个问题,时间消耗和价格都是惊人的。
对于今天公布的全新数据,DeepMind与EMBL-EBI该团队表示,在2亿多蛋白质结构预测中,约35%的结构精度高,达到实验手段获得的结构精度;80%的结构可靠性足以用于许多后续分析。
但是,目前AlphaFold还有改进的空间。伦敦大学Tomek Wlodarski 医生提出,如何开发模型来预测蛋白质的折叠,而不仅仅是最终结构,而是研究团队下一步要解决的问题。
DeepMind科学团队主管Pushmeet Kohli医生还指出,他们在这个阶段正在进步AlphaFold我们试图理解这些蛋白质的行为,以及它们如何与其他蛋白质相互作用。
一年前《自然》论文发表时,研究小组免费向研究人员公开AlphaFold源代码和数据库。目前,来自190个国家和地区的50多万学者访问了数据库。这些数据已应用于疟疾疫苗开发、抗生素耐药性和塑料污染,并帮助研发人员加快新药的研发。
这一次,该团队再次免费披露了最新的数据库,通过数据库下载了2亿多种蛋白质结构。新药开发领域的专家表示,这个庞大的数据库可以让研究人员投入更多的精力来确认蛋白质结构的细节,这是许多靶向药物成功的关键。Exscientia结构生物信息学副总监Chris Radoux医生接受行业媒体Endpoints News采访中说:我们不再需要问‘蛋白质结构在哪里?相反,回答‘我们的蛋白质结构有多有用?’的问题。他补充道:这个数据库允许我们扩大成药基因组的范围,大大增加了科学家在创新药物过程中发现的选项。”
DeepMind首席执行官Demis Hassabis博士表示,AlphaFold让我们一窥未来,看看计算和计算AI生物学技术的无限潜力。在最基本的层面上,生物学被认为是一种信息处理系统,但它非常复杂。AI解决生物动态复杂性的关键可能是技术。DeepMind团队很高兴看到,AI它有望成为人类科学发现和理解生命基本原理最有力的工具之一。