Science封面:新型AI技术有望破解RNA结构预测难题
时间:2021-08-30 10:31:36 热度:37.1℃ 作者:网络
作者:曼话
确定生物分子的三维结构是现代生物学中最大的挑战之一。传统上,制药公司和研究机构经常需要花费数百万美元来确定一个分子的结构,然而即便投入如此之大,也经常遭遇失败。
近两年,人工智能(AI)技术在生物大分子结构预测方面的应用越来越受关注。其中,谷歌旗下DeepMind的新一代AlphaFold系统在基于氨基酸序列精确预测蛋白质的3D结构方面取得的突破令业界震撼,其准确性可与使用冷冻电镜、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。
蛋白质对生命至关重要,理解它们的三维结构是理解其功能的关键。然而,迄今为止,只有17%的人类蛋白质组经实验技术确定了结构。在7月22日发表于Nature杂志上的一篇论文中[1],DeepMind与合作者发布了由新一代AlphaFold预测的蛋白结构数据库(AlphaFold Protein Structure Database)。该数据库包含了AlphaFold系统预测的约35万个蛋白结构,覆盖包括人类以及20种生物学研究中常用模式生物,其中,在人类蛋白质组方面,AI对98.5%的(20 296种)人类蛋白的结构做出了预测。
除了AlphaFold,由华盛顿大学的研究团队开发的另一名为RoseTTAFold的系统在预测蛋白结构方面也取得了重要进展。同样在7月发表于Science杂志上的一篇论文显示,RoseTTAFold系统突破了AlphaFold的一个重要局限:不仅可用于预测单一蛋白质的结构,还可以用于预测蛋白复合体的构象[2]。这些成果都被认为是生命科学领域的重大突破,对于促进新药研发可能具有不可估量的意义。
在AI技术解决蛋白结构解析领域几十年来重大挑战的同时,来自斯坦福大学的科学家们也将AI技术应用到了RNA结构预测上。他们的研究成果于8月27日最新发表在Science杂志上,并登上了当期杂志的封面[3]。
RNA分子通常折叠成复杂的三维形状,这对它们的功能至关重要,但也因此很难通过实验手段来确定RNA的结构。由于已知的RNA结构很少,因此用算法来预测这类生物大分子的结构也非常具有挑战性。