“从今天起,预测几乎所有已知蛋白质的结构,都如同使用搜索引擎一样简单。”
7月28日,DeepMind公司与欧洲生物信息研究所(EMBL-EBI)的合作团队公布了生物学领域的一项重大飞跃。他们利用人工智能(AI)系统AlphaFold预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。这一突破将加速新药开发,并为基础科学带来全新革命。
▲AlphaFold能够预测出几乎所有已知蛋白质的结构(图片来源:DeepMind;参考资料[1])
2020年年底,当人们对AlphaFold的印象还停留在那个打败全人类的围棋高手时,这个AI系统在生物学领域的亮相带来了新的惊喜。当时,AlphaFold成功破解了生物学持续50年的重大难题——蛋白质折叠问题,能够根据蛋白质的氨基酸序列预测蛋白质的三维结构。
仅仅半年后,DeepMind和EMBL-EBI合作,在一篇《自然》论文中发布了由AlphaFold预测的蛋白结构数据库。这个数据库涵盖了人类和20种常用模式生物的35万个蛋白质结构,并且对98.5%的人类蛋白质结构进行了准确预测——要知道在此之前,科学界解析的蛋白质结构只覆盖了人类蛋白序列17%的氨基酸。人工智能预测蛋白质结构领域的一系列突破,也被《科学》评选为2021年的年度科学突破。
现在,DeepMind与EMBL-EBI的合作团队更进一步。AlphaFold对蛋白质结构的预测不再局限于人类与模式生物,而是拓展至涵盖了动植物、细菌等的100万个物种,预测的蛋白质结构数量也提升了数百倍。
▲AlphaFold预测的蛋白质结构,涵盖了大量动植物及微生物物种(图片来源:DeepMind;参考资料[1])
“这个数据库涵盖了整个蛋白质宇宙,我们迈入了数字生物学的全新时代。”DeepMind的CEO Demis Hassabis博士点评道。
▲在此前发表的研究中,AlphaFold预测的部分蛋白质结构(图片来源:DeepMind;参考资料[1])
参考资料:
[1] AlphaFold reveals the structure of the protein universe. Retrieved July 28, 2022 from https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
[2] ‘The entire protein universe’: AI predicts shape of nearly every known protein. Retrieved July 28, 2022 from https://www.nature.com/articles/d41586-022-02083-2
[3] ‘The entire protein universe’: AI predicts shape of nearly every known protein. Retrieved July 28, 2022 from https://www.newscientist.com/article/2330866-deepminds-protein-folding-ai-cracks-biologys-biggest-problem/
(药明康德团队编辑)