AI在生物界的突破应用:DeepMind神经网络新算法准确预测蛋白质空间结构

继谷歌旗下的DeepMind公司开发的AlphaGo在国际围棋竞赛中取得了超越人类的表现后,Deepmind近日将人工智能技术应用到了生物领域,成为推动科学发展的一项重要技术。近期,Deepmind公司宣布正式推出AlphaFold系统,能够快速准确地预测并生成蛋白质的空间结构。这项技术在推出当日便引发了生物学的轩然大波。想要理解这项新技术,需要从以下几个方面进行深入了解。

一、预测蛋白质结构的困难

蛋白质是一种复杂的大分子聚合物,在生物中起到了生命活动承担者的重要作用,例如肌肉收缩的几乎每一种生命活动都可以归因于蛋白质的作用和变化。每种蛋白质的功能都由其独特的空间结构而决定。在生物体中,不同氨基酸经过脱水缩合形成肽链,而多条肽链经过在空间中的盘区和折叠后形成复杂的空间结构。然而,由于我们的DNA中只包含氨基酸残基的序列信息,因此通过基因信息根本无法构建蛋白质的3D模型,这就是所谓的“蛋白质折叠问题”。当蛋白质越大,其结构就越复杂,预测和构建蛋白质的空间结构就更加困难。如果想要列举出所有氨基酸排列组成蛋白质的可能性,这项任务所需要的时间甚至要长过我们所处宇宙已经存在的时间。

蛋白质结构 

二、预测蛋白质结构的重要性

如今世界上许多严重的疾病都被认为是由错误折叠的蛋白质而引起的,如阿尔兹海默症、帕金森和囊性纤维化等。因而能够预测蛋白质的结构不仅有助于科学家们理解这种物质在人体的基本作用,更能够帮助医学界发展出对于上述疾病的新型诊疗方法,这对全人类都是一项有益的事业。

不仅如此,了解蛋白质的空间结构甚至也能够解决环境问题。通过理解蛋白质的折叠,科学家们能够研究出更加高效的生物降解酶,而这种酶则能够用更加环保的方式降解塑料、石油一类的污染物以达到保护环境的目的。而科学家们现在已经开始改造细菌使其能够分泌降解废物的生物降解酶。

三、AI带来的改变

由于了解蛋白质的空间结构有着如此重要的意义,人们做出了很多努力去完善预测蛋白质结构这项技术。在过去的五十年中,科学家们已经可以使用包括低温电子显微镜、核磁共振和X射线晶体学在内的各项技术在实验室中来确定蛋白质的结构。此外,每两年举行一次的国际蛋白质结构预测竞赛(CASP)也聚集了全世界顶尖的研究人员以更新预测蛋白质结构的技术。但是,利用上述每一项技术预测一个蛋白质的结构可能就会花费数百万美元,而且结果并不精确。这就是为什么科学家们转而将目光投向了人工智能这一领域。

虽然困难重重,但是多年积攒下来丰富的基因数据库使得人工智能的深度学习在预测蛋白质这一领域能够发挥它的威力。在此基础上,AlphaFold诞生了。DeepMind团队的所有研究都基于AlphaFold深度学习的神经网络,以预测蛋白质的两种物理性质:氨基酸对之间的距离、氨基酸形成的化学键之间的键角。研究人员首先设计了一个神经网络以预测蛋白质每对氨基酸之间距离的分布情况。然后,研究人员将这些数值转化为评分,来对蛋白质结构的精确程度进行评估。同时,研究人员还另外训练了一个神经网络,利用这些距离数值来评估预测结构与真实结构的接近程度。

此外,科学家们还使用了两种方法使得研究团队能够在蛋白质图谱中找到和预测结构相匹配的结构。第一种方法是使用深度学习神经网不断生成新的蛋白质片段替换一段旧的蛋白质结构,这样蛋白质的评分就能够被不断提高。另外,研究人员还使用了一种名为“梯度下降”的在机器人学习中常用的数学手段,使得蛋白质结构的精确程度不断提高。

虽然还有很长的路要走,但是能够看到人工智能在预测蛋白质结构方面的实际应用已经是一个令人振奋的消息。同时我们也了解到了这项技术在降低研究成本和增加研究准确性与速度方面无穷的潜力,有望在改善环境和治愈疾病方面起到非常大的帮助。

THE END
分享
二维码

< <上一篇

下一篇>>