0


2024 诺贝尔化学奖 | 蛋白质结构研究与人工智能

注:本文为几篇关于 2024 年诺贝尔化学奖蛋白质结构研究的相关合集。


2024 年诺贝尔化学奖揭晓,3 人共同获奖,表彰他们破解了蛋白质复杂结构的密码

原创 生物学报 生物学报 2024 年 10 月 09 日 17:59 湖北 标题已修改

图片

生物学报

撰文:王 萌

排版:武钰婷

2024 年诺贝尔化学奖一半授予David Baker,“因计算蛋白质设计”,另一半共同授予Demis HassabisJohn M. Jumper,“因蛋白质结构预测

2024 年诺贝尔化学奖是关于蛋白质,生命巧妙的化学工具大卫・贝克成功地构建了全新的蛋白质,这几乎是不可能的壮举。 Demis Hassabis 和 John Jumper 开发了一种人工智能模型来解决 50 年前的问题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。

生命的多样性证明了蛋白质作为化学工具的惊人能力。它们控制并驱动所有化学反应,这些化学反应共同构成了生命的基础。蛋白质还充当激素、信号物质、抗体和不同组织的组成部分。

“今年获得认可的发现之一涉及壮观蛋白质的构建。另一个是关于实现 50 年来的梦想:根据氨基酸序列预测蛋白质结构。这两项发现都开启了巨大的可能性。” 诺贝尔化学委员会主席海纳・林克 (Heiner Linke) 说道。

蛋白质通常由 20 种不同的氨基酸组成,堪称生命的基石。 2003 年,David Baker 成功地利用这些模块设计了一种不同于任何其他蛋白质的新蛋白质。从那时起,他的研究小组创造了一种又一种富有想象力的蛋白质,包括可用作药物、疫苗、纳米材料和微型传感器的蛋白质。

第二个发现涉及蛋白质结构的预测。在蛋白质中,氨基酸以长串连接在一起,折叠起来形成三维结构,这对蛋白质的功能至关重要。自 20 世纪 70 年代以来,研究人员一直试图根据氨基酸序列预测蛋白质结构,但这非常困难。然而,四年前,出现了惊人的突破。

2020 年,Demis Hassabis 和 John Jumper 提出了一种名为 AlphaFold2 的 AI 模型。在它的帮助下,他们已经能够预测研究人员已识别的几乎所有 2 亿种蛋白质的结构。自取得突破以来,AlphaFold2 已被来自 190 个国家的超过 200 万人使用。在众多的科学应用中,研究人员现在可以更好地了解抗生素耐药性并创建可以分解塑料的酶的图像。

没有蛋白质,生命就不可能存在。我们现在可以预测蛋白质结构并设计我们自己的蛋白质,这为人类带来了最大的利益。

以下是近 10 年来获奖者名单及其主要成就:

2023 年 —— 美国麻省理工学院教授蒙吉・G・巴文迪 (Moungi G. Bawendi)、美国哥伦比亚大学教授路易斯・E・布鲁斯 (Louis E. Brus) 和美国纳米晶体科技公司科学家阿列克谢・伊基莫夫 (Alexey I. Ekimov),以表彰他们在 “发现和合成量子点” 方面的贡献。

2022 年 —— 美国科学家 Carolyn R. Bertozzi、丹麦科学家 Morten Meldal 和美国科学家 K. Barry Sharpless,以表彰他们 “在点击化学和生物正交化学方面的发展”。

2021 年 —— 德国和美国科学家 Benjamin List 和 David W.C. MacMillan 获奖,获奖理由是 “在不对称有机催化方面的发展”。

2020 年 —— 法国和美国科学家 Emmanuelle Charpentier、Jennifer A. Doudna 获奖,获奖理由是 “开发出一种基因组编辑方法”。

2019 年 —— 美国和日本 3 位科学家 John B Goodenough、M. Stanley Whittlingham、Akira Yoshino 获奖,获奖理由是 “在锂离子电池的发展方面作出的贡献”。

2018 年 —— 美国科学家 Frances H. Arnoid 获奖,获奖理由是 “研究酶的定向进化”;另外两位获奖者是美国的 George P. Smith 和英国的 Sir Gregory P. Winter,获奖理由是 “研究缩氨酸和抗体的噬菌体展示技术”。

2017 年 —— 瑞士、美国和英国 3 位科学家 Jacques Dubochet、Joachim Frank 和 Richard Henderson 获奖,获奖理由是 “研发出冷冻电镜,用于溶液中生物分子结构的高分辨率测定”。

2016 年 —— 法国、美国、荷兰 3 位科学家 Jean-Pierre Sauvage、J. Fraser Stoddart 和 Bernard L. Feringa 获奖,获奖理由是 “分子机器的设计与合成”。

2015 年 —— 瑞典、美国、土耳其 3 位科学家 Tomas Lindahl、Paul Modrich 和 Aziz Sancar 获奖,获奖理由是 “DNA 修复的机制研究”。

2014 年 —— 诺贝尔化学奖授予了美国科学家埃里克・贝齐格、威廉・莫纳和德国科学家斯特凡・黑尔,以表彰他们为发展超分辨率荧光显微镜所作的贡献。

2013 年 —— 诺贝尔化学奖授予美国科学家马丁・卡普拉斯、迈克尔・莱维特和阿里耶・瓦谢勒,以表彰他们在开发多尺度複杂化学系统模型方面所做的贡献。

2012 年 —— 美国科学家罗伯特・莱夫科维茨和布莱恩・克比尔卡因 “G 蛋白偶联受体研究” 获诺贝尔化学奖。

2011 年 —— 以色列科学家达尼埃尔・谢赫特曼因准晶体的发现而获得 2011 年的诺贝尔化学奖。

2010 年 —— 美国德拉威尔大学的 Richard F. Heck、普渡大学的 Ei-ichi Negishi 以及日本北海道大学的 Akira Suzuki,他们发明了新的连接碳原子的方法,获得 2010 年诺贝尔化学奖。



2024 年诺贝尔化学奖揭晓!揭开蛋白质折叠的秘密

原创 雷永青 蝌蚪五线谱 2024 年 10 月 11 日 16:01 北京

当地时间 10 月 8 日,瑞典皇家科学院宣布,将 2024 年诺贝尔化学奖授予三位科学家,一半奖金授予戴维・贝克(David Baker),以表彰他在 “计算蛋白质设计” 方面的贡献,并将另一半奖金授予德米斯・哈萨比斯(Demis Hassabis)和约翰・江珀(John M. Jumper),以表彰他们在 “蛋白质结构预测” 方面的贡献。

图片

三位科学家简介

戴维・贝克 1962 年出生于美国华盛顿州西雅图,目前是华盛顿大学的生物化学教授,同时也是蛋白质设计研究所的所长。他在计算生物学领域有着深入的研究,特别是在蛋白质折叠和设计方面。

德米斯・哈萨比斯 1976 年出生于英国伦敦,2009 年在英国伦敦大学学院获得博士学位。目前他是 DeepMind 的联合创始人兼首席执行官,他在认知神经科学和人工智能领域有着广泛的研究,领导了 AlphaFold 算法的开发。

约翰・江珀 1985 年出生于美国阿肯色州小石城,2017 年获得美国伊利诺伊州芝加哥大学博士学位。目前他是 DeepMind 的高级研究科学家,他在人工智能和机器学习领域有着显著的贡献,尤其是在蛋白质结构预测方面。

图片

插图:化学家们长久以来一直梦想着完全理解和掌握生命的化学工具 —— 蛋白质。现在,这个梦想已经触手可及。德米斯・哈萨比斯(Demis Hassabis)和约翰・江珀(John M. Jumper)成功利用人工智能预测了几乎所有已知蛋白质的结构。戴维・贝克(David Baker)学会了如何掌握生命的构建块并创造全新的蛋白质。

蛋白质的研究历史

普通公众要理解今年诺贝尔化学奖的科学成就,蝌蚪君认为有必要先梳理一下蛋白质的研究历史。

1838 年,荷兰化学家莫伊尔德首次提出 “蛋白质” 这一术语,并对其化学性质进行了初步研究。

1902 年,俄国科学家米尔・费舍尔(Emil Fischer)发现了肽和肽键,认为蛋白质是由氨基酸通过肽键连接而成的,他于 1902 年被授予诺贝尔化学奖。

1912 年,波兰化学家弗雷德里克・桑格(Frederick Sanger)完成了第一个蛋白质的完整氨基酸序列测定,即胰岛素的 B 链,这标志着蛋白质序列分析的诞生。他于 1958 年被授予诺贝尔化学奖。

20 世纪 50 年代末,英国生物物理学家约翰・肯德鲁(John Kendrew)和马克斯・佩鲁茨(Max Perutz)成功地使用了一种称为 X 射线晶体学的方法,展示了蛋白质的首个三维模型。为了表彰这一发现,他们于 1962 年被授予诺贝尔化学奖。

1961 年,美国科学家克里斯蒂安・安芬森(Christian Anfinsen)做出了另一个早期发现。他利用各种化学技巧,成功地使一个现有蛋白质展开,然后再次自行折叠,蛋白质每次都呈现出完全相同的形状。他得出结论,蛋白质的三维结构完全由蛋白质中的氨基酸序列决定。他于 1972 年被授予诺贝尔化学奖。

上世纪 70 年代,科学家们开始研究和揭示基因序列与蛋白质序列之间的关系。美国人赛勒斯・莱文塔尔(Cyrus Levinthal)在 1969 年就通过计算出得出结论,蛋白质如何折叠的所有信息都存在于氨基酸序列中。

上世纪 80 年代开始,生物信息学开始兴起,为大量蛋白质的氨基酸序列的分析和比较提供了工具。

2001 年,人类基因组草图完成,为蛋白质的氨基酸序列研究提供了大量数据。

图片

插图:一个蛋白质可以由几十个氨基酸到几千个氨基酸组成。氨基酸链折叠成一个三维结构,这个结构对于蛋白质的功能是决定性的。

三位科学家的具体贡献

时间标尺继续下划,就到了 2024 年诺贝尔化学奖的区间。下文就重点讲解此次获奖的三位科学家各自的贡献:

戴维・贝克(David Baker)在 “计算蛋白质设计” 方面到底作出了哪些贡献呢?

首先,我们先要搞清楚什么是蛋白质折叠? 蛋白质是由 20 种不同的氨基酸通过肽键连接而成的长链。而这些长链在空间中是折叠成复杂的三维结构的,所以氨基酸的排列顺序其实就决定了蛋白质最终的三维结构,然而尽管科学家们知道蛋白质的氨基酸序列,但他们无法计算得知这些序列会如何折叠成特定的三维结构。由于蛋白质结构的复杂性,预测其折叠方式不仅需要巨大的计算能力,还需要对于这个物理化学过程有更为深刻的了解。

尽管缺乏足够的理论支持,但是戴维・贝克采取了 “近似” 的策略,构建了一个复杂的 “虚能量函数”,并在 2003 年成功地开发了蛋白质结构预测软件 Rosetta。该软件虽然不能准确计算蛋白质折叠过程中的能量变化,但是仍旧能在相当一部分蛋白质上比较准确地计算得到折叠后可能采取的三维结构。

除了计算手段之外,生物学家们主要还是依靠实验手段来测定蛋白质的真实三维结构,方法包括 X 射线晶体学、冷冻电子显微镜或核磁共振等。不过这些传统方法需要耗费大量的时间、金钱与科研劳动,而且还不能保证成功率。

相比之下,戴维・贝克等多个团队的结构预测算法只依赖于计算,速度更快,但准确率尚无法保证。

就在研究蛋白质结构预测的过程中,戴维・贝克也对蛋白质设计产生了浓厚的兴趣,采用纯粹的计算策略,尝试从头设计全新的蛋白质,在自然界中不存在的蛋白质。以下是他的研究步骤:

第一步:贝克依赖于他们开发的 Rosetta 蛋白质结构预测算法,可以预测氨基酸序列在形成蛋白质时可能采取的三维结构。

第二步:利用这个工具,他们针对随机生成的一系列氨基酸序列进行结构预测,这些序列都是在自然界中未被观察到的。如果预测结果显示出合理的蛋白质结构,那么这条氨基酸序列就会被保留下来,反之则抛弃该序列。

第三步:他们合成了那些成功折叠的氨基酸序列所对应的编码基因序列,并在实验室中制造出相应的蛋白质。然后,他们使用实验手段(如 X 射线晶体学)来测定这些新蛋白质的结构。

第四步:一旦新蛋白质的结构被确定,他们就继续研究了这些蛋白质的可能功能和应用。

戴维・贝克以及其他研究者之所以要设计新的蛋白质,是为了获得具有特定功能或性质的蛋白质,从而让这些蛋白质可用作药物、疫苗、纳米材料和微型传感器等。另外,设计蛋白质的过程本身也增进了人类对蛋白质如何从线性序列折叠成复杂三维结构的理解,同时展示了计算模型在生物化学研究中的强大潜力。

时间标尺又往前推一步,到了德米斯・哈萨比斯(Demis Hassabis)和约翰・江珀(John M. Jumper)的时代,他们在 “蛋白质结构预测” 方面又作出了哪些贡献呢?

先说一个大家耳熟能详的,AlphaGo。对,就是 2016 年和 2017 年分别击败了世界围棋冠军李世石和柯洁的人工智能模型。其实 AlphaFold 和 AlphaGo 都是由 DeepMind 公司开发的独立产品。AlphaGo 问世于 2016 年,它的使命是使用深度神经网络来学习围棋的策略和决策,而 AlphaFold,它的使命非常明确,帮助人类使用深度学习方法来预测蛋白质的三维结构。

AlphaFold 问世于 2018 年,就参加了一个国际学术比赛 —— 蛋白质折叠预测比赛(Critical Assessment of protein Structure Prediction,简称 CASP),并取得了不俗的成绩,立刻引起了领域内的关注。CASP 从 1994 年开始,每两年举办一次,是蛋白质结构预测领域最重要的国际性赛事,参赛团队需要使用计算方法预测给定蛋白质序列的三维结构。

到了 2020 年,德米斯・哈萨比斯和约翰・江珀共同领导了对 AI 模型做了根本改革的第二代的 AlphaFold2,再去参加第十四届 CASP 比赛时,以压倒性优势取得了冠军,这犹如一声炸雷,颠覆了科学界对于 AI 的认识。相对于 Rosetta 等此前的结构预测算法,AlphaFold2 得到的预测结构与实验测定的真实蛋白质结构有着非常高的一致性。

图片

插图:使用 Baker 程序 Rosetta 开发的蛋白质

AlphaFold2 的技术特点是使用了一种基于深度学习的方法,特别是注意力机制和神经网络,用于预测蛋白质的氨基酸对之间的距离,并据此构建蛋白质的三维结构。它的成功震撼了科学界,被誉为生物信息学和结构生物学领域的一个划时代里程碑。它展现了人工智能在攻克长期悬而未决的生物学难题上所蕴含的巨大潜力。

虽然这些预测结构在局部仍有不准确的地方,但是 AlphaFold2 整体上作为一种快速高效的计算工具,已经计算了所有人类蛋白质的结构。DeepMind 公司还开放了 AlphaFold2 的源代码,任何人都可以访问,这个 AI 模型已经成为研究人员的金矿。

图片

插图:AlphaFold2 在刚性球状蛋白质以外的结构预测方面有着强大功能,但仍存在重要局限

迅速推进!就在科学界为 AlphaFold2 欢呼之时,DeepMind 研究团队领头人约翰・江珀却表示,AlphaFold2 仍然有局限,因为它不能同时具备预测蛋白质结构及其配件结构的能力。而这些无法准确预测的部分,往往可能是科学家最为看重的难中之难。

图片

插图:7R6R - DNA 结合蛋白:AlphaFold 3 对一个分子复合体的预测展现了蛋白质(蓝色)与 DNA 双螺旋(粉色)的结合,其预测结果与通过繁复实验得到的真实分子结构(灰色)高度吻合

在历经两年多的艰苦攻关后,DeepMind 团队于 2024 年推出了 AlphaFold3。这一先进系统采用了深度生成中的扩散模型为核心,从而能够以史无前例的精确度成功预测了包括蛋白质、DNA、RNA、配体在内的大部分生命分子的结构和相互作用。

这一突破不仅超越了蛋白质结构的单一预测,更使得人类能够以前所未有的精确度洞察所有生命分子之间的构造及其相互作用,开启了生物学研究的新篇章。

图片

插图:8AW3 - RNA 修饰蛋白:AlphaFold 3 对一个包含蛋白质(蓝色)、一条 RNA(紫色)和两个离子(黄色)的分子复合体的预测与真实结构(灰色)非常吻合

AlphaFold 的工作原理极为复杂,涉及的计算量浩如烟海。它融合了生物信息学、计算生物学和机器学习的最新研究成果。尽管面临巨大挑战,AlphaFold 仍以前所未有的精确度和速度实现了蛋白质结构的预测,为科研和药物开发领域贡献了强大的新工具。

到此,我们要把戴维・贝克重新请上舞台。随着第一代 AlphaFold 逼近了 Rosetta 的预测水平,不可能不引起 Rosetta 开发者戴维・贝克的关注。于是贝克和他的研究团队开始尝试在他们传统的蛋白质设计算法中也加入 AI 技术。

在 2003 年,贝克团队成功建立了一种同样基于扩散模型的蛋白质设计 AI 算法,名为 RFdiffusion,能够在很短的时间内直接得到可能的全新蛋白质结构。无论是从计算量上来看,还是从成功率上来看,都远远超过他自己此前的蛋白质设计流程。

就在刚刚过去的 10 月 9 日,贝克团队多年来的蛋白质设计成果,以及三代 AlphaFold 所取得的成就,让三位科学家共同荣获了今年的诺贝尔化学奖。这不仅体现了科技进步的迅猛,也展现了诺贝尔奖对科学突破的敏锐响应,两者均令世界瞩目。

蛋白质折叠的秘密

为了让普通公众更好地理解蛋白质结构预测的成就和相关知识,我们可以将细胞、组织、蛋白质的结构和功能,以及构成它们的肽键和氨基酸序列,比喻成一个繁忙的建筑工地:

想象一个庞大的建设项目,这个项目代表我们的生物体,而细胞则是这个项目中的一个个小工地,组织则是由这些小工地联合而成的更大规模的建筑群。

氨基酸: 氨基酸就像是工地上的原材料,如砖块、钢筋、水泥等。每种原材料都有其特定的属性和用途。

图片

插图:蛋白质可以包含从数十个氨基酸到数千个氨基酸的所有氨基酸

肽键: 肽键是将这些原材料连接起来的 “焊接点” 或 “粘合剂”。就像焊接钢筋或涂抹水泥,肽键将氨基酸紧密地连接起来,形成坚固的链条。

氨基酸序列: 氨基酸序列是施工图纸,它详细规定了原材料的排列顺序。不同的排列顺序会决定最终建筑的结构和功能,正如不同的氨基酸序列决定了蛋白质的结构和功能。

蛋白质的结构:

一级结构:氨基酸序列,就像按照图纸排列的建筑材料。

二级结构:蛋白质链的局部折叠,如同搭建好的框架结构,如墙壁和梁柱。

三级结构:蛋白质链进一步折叠成复杂的三维形状,就像整个建筑的结构,包括楼层、房间和楼梯。

四级结构:对于由多个肽链组成的蛋白质,四级结构是指这些肽链如何相互作用并组装成一个完整的复合体,就像一个由多个建筑组成的综合体。

图片

插图:蛋白质的四级结构示意图

蛋白质的功能: 蛋白质的功能就像是建筑的不同部分所承担的角色。有的蛋白质是结构支柱,如同建筑中的梁柱;有的蛋白质是催化剂,如同工程师使用的工具,加速化学反应;有的蛋白质是信号传递者,如同通信系统,确保工地内外信息的流通。

细胞: 细胞就像是整个建筑工地,它包含了所有必要的结构和功能单元,如蛋白质、核酸、脂质等,它们共同协作,完成生命活动的各项任务。

组织: 组织则是由许多相似的细胞组成的建筑群,每个细胞都按照其特定的功能进行组织和排列,就像一个城市中的住宅区、商业区和工业区。

通过这个比喻,我们可以看到,氨基酸是构建生命的基础单元,肽键是连接这些单元的纽带,氨基酸序列是指导构建的蓝图,蛋白质的结构和功能是构成细胞和组织的基石,而细胞和组织的协同工作则支撑起了整个生物体的生命活动。

蛋白质构成了生命的基础,其结构之谜隐藏于复杂的折叠之中。揭开这一谜团,我们得以更深入地理解生命的运作机制。如今,借助人工智能的力量,我们能够预测蛋白质结构并设计创新型的蛋白质,这一技术突破正在为人类带来了巨大的福祉和利益。

成果价值与应用前景

为了更全面深度地认识三位科学家在蛋白质三维结构预测和蛋白质设计领域的研究成果,以及在医学和生物学上应用前景,蝌蚪君特别连线采访了结构生物学与人工智能生物学家,北京航空航天大学医学科学与工程学院叶盛教授。

叶盛教授坦言,今年诺贝尔化学奖授予这一领域,确实与他的研究方向不谋而合。“我们的研究正是沿着戴维・贝克的道路前进,我们团队最近也取得了一些重要成果,目前正在撰写相关论文。”

图片

插图:叶盛 2000 年本科毕业于清华大学自动化系,2007 年于清华大学基础医学院取得生物学博士学位,在美国从事博士后研究工作之后,于 2010 年回国进入中国科学院生物物理研究所工作。2019 年,叶盛进入北京航空航天大学从事蛋白质科学研究。

随着 AI 技术突飞猛进的发展,叶盛教授的团队近年来开始将 AI 算法应用于生物学问题的解决,开创性地运用扩散模型等深度生成模型实现了蛋白质的快速从头设计,为人工蛋白质在医药等领域的应用提供了新的解决方案。以下是叶盛教授评价诺奖三位得主的研究成果的价值:

为科学研究提供了一种新的范式

传统的科学研究往往是由数据出发,总结规律与公式,实现对任意情况的计算。但是像蛋白质折叠这种复杂问题,我们既缺乏足够的数据,也始终没有找到公式。而 AI 可以在不知道公式的情况下(模型的不可解释性),仅依靠对于现有数据的学习,就掌握其中的规律,完成相应的预测或数据生成。

深入探索生命奥秘

虽然当前 AI 的模型是不可解释的,让我们也无法得知其中的具体规律,但是通过利用这些技术不断预测结构、设计蛋白,也能够帮助我们进一步揭示蛋白质三维结构背后的奥秘,为早日建立通用的法则或公式奠定基础,最终推动了我们对生命本质的理解。

建立生物学研究新工具

这些研究成果为科学家们提供了强大的新工具,让很多此前无法计算的问题变得可以迅速得到答案,因此在生物学、化学、医学、化工材料学等多个领域都能发挥巨大作用。

图片

对疾病治疗的具体帮助

有助于深入理解疾病根源: 预测蛋白质结构能够帮助我们理解细胞内外蛋白质的结构与功能的关系,从而有助于我们对于疾病的研究。比如相当一部分神经退行性疾病都与蛋白质的折叠错误有关,而这些蛋白质的不同折叠此前一直都是结构研究的难点,现在却可以在 AI 算法的帮助下得到快速解决。

加速药物开发和生物技术革新: 这项技术虽然还不能直接设计得到药物,但是却能够在多个方向上助力药物研发,比如加速药物靶点蛋白的结构研究等等,同时也可以在设计多肽药物、蛋白药物等新型生物药方面大显身手。

助力疫苗开发: 安全性更强的亚单位疫苗本身就是来自病毒的蛋白质分子,但是还需要进行一定的改造设计。AI 算法加持的蛋白质结构预测和设计都对这类亚单位疫苗的研发有着显著的助推作用。

降低药物成本: 当前药物价格中有一大部分的成本是来自药物漫长的研发周期之中的投入。而 AI 算法能够帮助药企有效地缩短研发周期,降低研发成本,最终导致药物价格的下降,惠及我们每一个普通人。

此前,我们曾试图进行蛋白质设计,这是一项极为艰巨的任务。试想,要设计一个由数千甚至数万个原子组成的分子,这在当时超出了人类的知识范畴和能力极限。然而,随着基于深度学习的新一轮人工智能技术的出现,我们终于获得了实现这一目标的能力。

“虽然我们仍旧无法解释这个模型背后的具体原理和规则,但是我们可以通过采样,去生成我们想要的设计。”

叶盛教授补充说:“基于 AI 的蛋白质设计真的就是一种新质生产力。我觉得今年诺贝尔化学奖给到这个方向,也是给了我们一个非常非常重要的提示:在生物技术领域和健康医药领域,这是未来发展的一个大趋势。对于社会大众来说,这项技术创新将给我们的医疗健康问题带来实惠。同时它也让大家看到,诺贝尔奖其实离我们并不遥远。”

撰稿:雷永青,科技媒体人

中国科普作家协会会员,北京科学技术普及创作协会会员

审稿:叶盛,结构生物学与人工智能生物学家

北京航空航天大学医学科学与工程学院教授、中国科普作家协会理事



2024 化学诺奖接力青睐 AI,蛋白质结构预测新工具获一半奖项

原创 郭贝一、郭晓强 返朴 2024 年 10 月 09 日 18:18 北京

10 月 9 日,欧洲中部时间 11 时 45 分(北京时间 17 时 45 分),瑞典皇家科学院决定将 2024 年诺贝尔化学奖的一半授予大卫・贝克(David Baker),以表彰他在 “计算蛋白质设计” 方面的贡献,并将另一半授予戴密斯・哈萨比斯(Demis Hassabis)和约翰・M・詹伯(John M. Jumper),以表彰他们在 “蛋白质结构预测” 方面的贡献。

图片

David Baker,1962 年出生于美国华盛顿州西雅图。1989 年获美国加州大学伯克利分校博士学位。现为美国华盛顿大学西雅图分校教授。

图片

Demis Hassabis,1976 年出生于英国伦敦。2009 年获得英国伦敦大学学院博士学位。Google DeepMind 首席执行官。

图片

John M. Jumper,1985 年出生于美国阿肯色州小石城。2017 年获得美国伊利诺伊州芝加哥大学博士学位。Google DeepMind 高级研究科学家。

诺贝尔奖官方表示,2024 年诺贝尔化学奖的主题是蛋白质 —— 生命中巧妙的化学工具。大卫・贝克成功完成了几乎不可能的任务,构建了大量全新的蛋白质。德米斯・哈萨比斯和约翰・朱姆珀开发了一种人工智能模型,解决了一个 50 年来的难题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。

生命的多样性证明了蛋白质作为化学工具的惊人能力。它们控制并驱动所有化学反应,这些反应共同构成了生命的基础。蛋白质还作为激素、信号物质、抗体以及不同组织的构建模块发挥作用。

“今年获得认可的发现之一是关于构建非凡的蛋白质;另一个则实现了一个 50 年来的梦想:从氨基酸序列预测蛋白质结构。这两项发现为未来开辟了广阔的可能性,” 诺贝尔化学委员会主席 Heiner Linke 说道。

蛋白质通常由 20 种不同的氨基酸组成,这些氨基酸可以被视为生命的构建模块。2003 年,大卫・贝克成功利用这些模块设计出一种与任何其他蛋白质不同的新蛋白质。从那时起,他的研究团队创造了一个又一个富有想象力的蛋白质,包括可用于药物、疫苗、纳米材料和微小传感器的蛋白质。

下文全面介绍基于 AI 的蛋白质预测工具 ——alphafold 的发展过程。

撰文 | 郭贝一、郭晓强

来源 | 《科学》杂志

基于神经网络原理构建的人工智能工具 AlphaFold 实现对蛋白质三维结构的精准预测,解决困扰生命科学 60 年的难题。这一突破推动基础研究快速发展的同时,还有望在新药研发和疾病治疗等多个领域发挥重要作用。

蛋白质是生命活动的物质基础,亦可看作生命的存在形式。蛋白质拥有广泛的生物学功能,包括结构组分(胶原蛋白)、催化功能(酶)、调节作用(激素)、物质运输(血红蛋白)、机械收缩(肌动蛋白)、机体免疫(抗体)等,进而参与几乎所有生命过程,如分子水平的 DNA 复制和转录、蛋白质翻译、物质与能量代谢等,以及细胞层面的精卵融合、细胞增殖和分化、细胞凋亡和坏死、细胞衰老和细胞通信等,其重要性不言而喻。

尽管蛋白质种类多样,但它们都是由 20 种基本氨基酸组成,区别在于不同的氨基酸排列顺序,这一特征称为一级结构,亦称初级结构,但这种线性结构需经过充分折叠形成空间三维结构,亦称高级结构。结构决定功能是许多学科的基本原则,生命科学也不例外,因此蛋白质结构研究在生命科学领域占据举足轻重的位置 [1]。

蛋白质结构研究

1819 年,构成蛋白质的第一种氨基酸亮氨酸分离成功,1936 年最后一个氨基酸苏氨酸成功鉴定,前后跨越 100 多年,这说明了蛋白质研究的艰巨性。

1953 年,英国生物化学家桑格(F.Sanger)借助新出现的各种氨基酸和多肽分离方法和自己创造的氨基酸显色反应,确定了胰岛素两条多肽链的氨基酸序列,1955 年又确定二硫键位置,获得 1958 年诺贝尔化学奖。

1957 年,英国生物化学家肯德鲁(J.C. Kendrew)借助 X - 射线晶体衍射技术首次确定肌红蛋白三维结构,两年后他的同事佩鲁茨(M.F. Perutz)确定血红蛋白三维结构,两人分享 1962 年诺贝尔化学奖。通过这两项诺贝尔奖也可看出蛋白质结构研究的重要性,从成果取得到获奖只有 3-5 年。与此对应,作为分子生物学里程碑成果的 DNA 双螺旋结构解析则等待了 9 年(如提前认可,富兰克林的悲剧可能就可避免)。

蛋白质结构研究一直是诺贝尔化学奖青睐的对象,至今已颁发十余次奖项,既包括重要蛋白(或复合物)的解析,也包括新技术或新方法的突破,因此该领域长期来看是生命科学前沿和焦点。

蛋白质结构研究与诺贝尔化学奖
年度获奖人获奖成果1958桑格(F.Sanger)胰岛素一级结构1962佩鲁茨(M.F. Perutz)
肯德鲁(J.C. Kendrew)球蛋白(血红蛋白和肌红蛋白)三维结构1972安芬森(C.B. Anfinsen)
摩尔(S. Moore)
斯坦(W.H. Stein)一级结构决定高级结构 < br > 核糖核酸酶一级结构1982克卢格(A.Klug)晶体电子显微镜发展1988戴森霍弗(J. Deisenhofer)
胡贝尔(R. Huber)
米歇尔(H. Michel)光合反应中心的三维结构1997沃克(J.E. Walker)ATP 酶三维结构2002芬恩(J.B. Fenn)
田中耕一(Koichi Tanaka)
维特里希(K. Wüthrich)质谱法测蛋白质一级结构 < br > 磁共振波谱研究蛋白质高级结构2003麦金农(R. MacKinnon)钾离子通道三维结构2006科恩伯格(R. D. Kornberg)真核生物的转录结构2009拉马克里斯南(V. Ramakrishnan)
施泰茨(T. A. Steitz)
尤纳斯(A. Yonath)核糖体三维结构2012科比尔卡(B. Kobilka)G - 蛋白偶联受体结构2017杜博歇(J. Dubochet)
弗兰克(J. Frank)
亨德森(R. Henderson)研究蛋白质高级结构的冷冻电镜开发
随着许多蛋白质结构被解析,科学界考虑将这些信息进行存档以便利科研人员使用。1971 年,在美国冷泉港实验室举办的一次蛋白质晶体学研讨会上,由布鲁克海文国家实验室汉密尔顿(W. Hamilton)倡导建立蛋白质数据库(Protein Data Bank, PDB),最初只包含 7 种蛋白质结构信息,是生命科学领域第一个开放获取的数字资源。磁共振波谱和冷冻电镜等新技术的发明和完善,大大加快了蛋白质结构解析的步伐,PDB 内信息也得到了快速增长,2014 年突破了 10 万种。然而这一数量相比已知的上亿种蛋白质显得微不足道,因此研究人员开始尝试用理论方法直接由初级结构获取高级结构信息 [2]。

蛋白质结构预测

1961 年,美国生物化学家安芬森(C.B. Anfinsen)借助核糖核酸酶变性 - 复性实验得出结论:蛋白质初级结构决定高级结构(安芬森定律)。安芬森定律清晰地说明蛋白质空间结构并非随机形成,而是根植于氨基酸的线性顺序,该定律成为蛋白质结构预测的理论基础。安芬森在 1972 年诺贝尔奖获奖感言中提出一个愿景:将来有一天仅从氨基酸序列就能预测任何蛋白质三维结构。从蛋白质初级结构预测高级结构的过程较为复杂,是结构生物学和理论生物学领域最具挑战性的课题,它吸引了众多科研人员前赴后继尝试解决这一难题。

蛋白质结构预测主要有两种策略,基于模板建模(template-based modeling, TBM)和无模板建模(template-free modeling, FM)[3]。TBM 又称同源建模,它利用新蛋白质初级结构与 PDB 中已有三维结构蛋白质的氨基酸序列比对结果为基础构建模型,并进一步完善,准确性取决于新蛋白质和 PDB 中蛋白质的进化距离,如果 PDB 缺乏新蛋白类似结构域的已知结构,则无法生成准确模型。FM 又称从头计算方法,利用能量函数计算氨基酸空间相互作用,最终从所有可能结构中选取最佳形式,依靠分子动力学模拟获得蛋白质折叠方式,该法对小分子量蛋白质结构预测还算准确,但随着蛋白质复杂性增加逐渐变得无能为力。

1994 年,美国计算生物学家莫尔特(J. Moult)和菲德利斯(K. Fidelis)为推动蛋白质结构预测领域的快速发展,启动了蛋白质结构预测关键评估(Critical Assessment of Structure Prediction, CASP)活动,这是两年举办一次的竞赛或选拔赛,旨在评选蛋白质结构建模中的最新和最佳技术。组织者向参与者提供目标蛋白质的氨基酸序列,据此预测蛋白质结构,与此同时还采取实验方法获取蛋白质结构,最终将二者进行对比获得全局距离测试(global distance test, GDT)评分。为保证结果客观性,整个过程为双盲,即参与者和评审员互不知晓。GDT 是百分制,用于评判结构预测的精准度,超过 90 分则非常理想,达到实验数据级别。在第一届竞赛中,对在已知数据库有类似模板的蛋白质的理论预测尚算完美,但对无模板的则堪称灾难,GDT 得分只有 20 分。即使到 2016 年第 12 届竞赛也只升高到 40 分,与预期还有极大差距,以至莫尔特悲观地认为,有生之年这个问题可能都难以解决,但不久人工智能(artificial intelligence, AI)技术的加入,问题得到了完美的答案。

人工智能发展

智能,又称智力,是人类所特有的复杂认知能力并在此基础上进行学习形成概念、理解和应用逻辑以及推理等。AI 则是利用计算机或机器人模拟人类智能完成一系列复杂任务的过程,如推理等。

1950 年,英国数学家图灵(A.M. Turing)在论文 “计算机和智能” 中首次讨论建造智能机器和测试智能的方式,赋予机器借鉴人脑信息加工、理性设计和科学决策的能力,奠定了 AI 的理论基础。1956 年,在美国达特茅斯举办的学术会议上,麦卡锡(J. McCarthy)首次提出 AI 一词,并相信将来会制造出像人类思考和推理的机器。在随后的时间里,AI 取得了一系列重要进展,特别是进入 21 世纪以来更是突飞猛进,智能水平日趋强大,这里重点介绍机器学习(machine learning, ML)。

机器学习是人工智能的分支,主要基于数据进行算法开发和研究,通过学习已有数据而推广到新数据,从而可在无明确指令情况下执行任务,进一步发展出更高级的深度学习(deep learning, DL),可在尽量减少人工干预的前提下实现对非结构化数据(如文本或图像)的学习,在视觉加工、语言处理和语音识别等领域得到了广泛应用。

深度学习的研究历史可追溯到 1943 年,美国神经生理学家麦卡洛克 (W. S. McCulloch) 和年轻逻辑学家皮茨(W. H. Pitts)构建出第一个基于模拟人脑的神经网络(neural network)模型,它可以基于神经元的活动特性进行简单的逻辑运算。神经网络由多层结构组成,包含输入层、一个或多个隐藏层和输出层。只有三层的称为基本神经网络,三层以上的为深度神经网络,是深度学习的基础。

经过后续发展和完善,神经网络逐渐成为诸多 AI 设计的基础,人们开始尝试应用于蛋白质结构预测。比如 2016 年出现的循环几何网络 (recurrent geometric network, RGN) 和后续发展的神经能量模型和优化(neural energy modeling and optimization, NEMO)等,这些方法取得了初步成功。

天才少年

哈萨比斯(D. Hassabis)出生于英国伦敦,童年就展现出过人天赋。4 岁时,哈萨比斯就能熟练掌握国际象棋技巧并战胜父亲和叔叔,13 岁成为国际象棋大师,并在国际比赛中与成年人对弈。哈萨比斯还表现出与年龄不相称的逻辑运算天赋,8 岁时应用电脑进行游戏编程,随着年龄增长,他决定将计算机应用于更高级的智力比拼,因此希望从事人工智能方面的工作。17 岁时,他设计并编程了销量数百万、屡获殊荣的游戏《主题公园》。

1994 年,哈萨比斯进入剑桥大学学习,3 年后以年级第一名的成绩获得计算机学士学位。1998 年,哈萨比斯创立电子游戏公司 Elixir Studios,先后创作出《共和国:革命》、《邪恶天才》等多款畅销游戏。

图片

哈萨比斯和江珀 [4]

2005 年,哈萨比斯在游戏领域证明自己的能力后,决定研究人脑机制以证明 AI 的巨大潜力,因此重返学术界,进入伦敦大学学院攻读认知神经科学博士学位,主要研究记忆和健忘的分子机制。哈萨比斯发现大脑海马区损伤会导致健忘症,并减弱联想功能和情景记忆,这项成果被《科学》周刊列为 2007 年十大科学突破之一。2009 年,哈萨比斯获得博士学位后,前往美国哈佛大学和麻省理工学院开展博士后研究,进一步充实自己的知识。

2010 年,哈萨比斯等人在伦敦创立人工智能公司 Deepmind,将公司使命定义为解决 “智能问题”,继而使用人工智能 “解决其他一切问题”。哈萨比斯担任公司首席执行官(CEO),将自己在神经科学和机器学习方面的知识与计算机科学相结合,致力于构建新型人工智能机器。DeepMind 的快速发展引起科技巨头谷歌的注意,并于 2014 年以超过 65 亿美元价格被谷歌收购,哈萨比斯仍担任 DeepMind 的 CEO。

哈萨比斯认为围棋是机器学习的理想挑战目标,他们开发成功 AlphaGo,在 2015 年以 50 比分击败欧洲围棋冠军,第二年再以 41 比分击败世界冠军李世石(Lee Sedol),证明了 AlphaGo 的强大能力。AlphaGo 的成功也荣膺 2016 年《科学》周刊评选的年度十大进展之一。

人机对战的巨大成功促使哈萨比斯决定进一步挑战自身,这次不再关注游戏,而是生物学问题。哈萨比斯利用 AI 解决生物学问题的想法由来已久,但苦于找不到理想切入点而迟迟未能启动,蛋白质结构预测无疑是一个最佳选择。DeepMind 为此成立了一个开展蛋白质结构预测的小团队,由于蛋白质空间结构的形成主要通过折叠(fold)方式完成,该团队开发的人工智能系统被命名为 AlphaFold。

AlphaFold 的首次突破

AlphaFold 采用深度学习基础上的 FM 预测策略, 共三个系统。首先是建模系统, 利用神经网络和强大运算能力基于能量最低原理预测蛋白质内各氨基酸残基之间的空间距离, 产生一系列结构片段(类似二级结构), 初步组装出三维结构;其次是优化系统, 对建模结构进行再计算的重复操作以提升精确度;最后是输出系统,产生最终三维结构。

2018 年,AlphaFold 参与了第 13 届 CASP 竞赛,牛刀初试就技压群雄,毫无争议地荣膺冠军宝座,复杂蛋白 GDT 平均达到 60 分,成功预测出给定的 43 种蛋白质中的 25 种,第二名仅预测出 3 种 [6]。这项成就使哈萨比斯的工作第三次荣膺《科学》周刊评选的年度十大进展之一。

AlphaFold 尽管较传统方法有较大突破,但仍存在诸多不足,如预测结果精确度尚待提高,距离 90 分以上(完美预测)仍有较大差距;预测结构平均分辨率为 0.66 纳米(大于 0.3 纳米仅显示蛋白质链轮廓),与实验方法所得最佳分辨率 0.1 纳米(原子半径尺度,这种程度下可清晰展示单个原子位置)也存在上升空间。

DeepMind 公司决定改进 AlphaFold 系统,但经过 6 个月尝试后却远远未达预期,不得不开始重新调整思路,首先进行人事变动。

江珀(J.M. Jumper)出生于美国阿肯色州小石城,2007 年在范德比尔特大学获得理学学位,随后在奖学金资助下进入剑桥大学攻读理论凝聚态物理学博士学位,但不久发现对此并无太大兴趣,因此选择退学并加入一家从事蛋白质结构计算机模拟的公司,工作中逐渐对理论生物学产生浓厚兴趣。2011 年,江珀重新回到学校,进入芝加哥大学跟随著名理论化学家弗里德 (K.F. Freed) 和索斯尼克(T.R. Sosnick)攻读理论化学博士,将机器学习策略用于蛋白质动力学研究。2017 年,江珀毕业获得博士学位,获悉 Deepmind 公司正在开展蛋白质结构预测方面研究,投递申请后很快得到答复,当年 10 月加入公司,成为蛋白质结构预测小组的重要成员。

在 AlphaFold 迟迟未能取得进一步突破之时,哈萨比斯意识到江珀在蛋白质物理和机器学习方面跨学科背景的重要性,他们进行了深入交流,最终达成共识,采用新思路改进原有设计。2018 年 7 月,江珀被提拔为 AlphaFold 项目主管,全面负责总体工作。

AlphaFold2 再度完善

江珀带领年轻团队对 AlphaFold 最初版本进行了重新梳理,在此基础上展开全面调整和改进,对每个细节给予挖掘以期达到尽善尽美。比如,他们引入空间立体结构和进化理念、整合已有蛋白质结构的详细信息如原子半径和键角等、完善机器有效学习策略以利于从有限数据中提取最大信息,特别是抛弃传统算法的束缚,更强调空间靠近而非线性相邻等。没有任何一种改进对最终结果有决定性影响,但正是这些奇妙新想法的完美结合,才最终实现真正意义的突破。

AlphaFold 改进系统(亦称 AlphaFold2)分为三个操作进程。第一进程,通过查询多个蛋白质的氨基酸序列数据库构建输入序列的多序列比对集(multisequence alignment, MSA)(MSA 表征)。MSA 的基本逻辑是同一功能蛋白质由于进化缘故,氨基酸序列会出现较大差异(如人肌红蛋白和鸽子肌红蛋白只有 25% 的氨基酸序列相同),但基本结构高度相似,据此作为结构预测的基础。同时,通过查询蛋白质三维结构数据库构建输入序列各氨基酸空间相互关系的矩阵(成对表征)。第二进程,上述两组信息(进化信息和空间信息)在一个编码器(evoformer)上进行处理,得出一个粗略的结构假设,然后返回最初状态进行测试和完善(该过程称为迭代),要求结构假设同时满足 MSA 表征和成对表征,且二者之间相互交流,共同纠正和改进最初假设结构的不足。第三进程是输出蛋白质三维结构。

图片

AlphaFold2 基于神经网络的深度学习模型 [7]

深度学习过程中,研究者使用 PDB 中已有的 17 万种蛋白质结构信息进行训练。AlphaFold2 反复将预测结果与真实结构进行对比,使二者之间逐渐接近,最终使系统吸收并完全掌握蛋白质折叠原理。AlphaFold2 还能对预测结构给出可信程度,类似于考试估分,数值越高意味着与真正结构差距越小。AlphaFold2 成功的另一因素是 DeepMind 强大的运算能力,这是绝大多数学术团体和小公司都难以达到的目标。

2020 年,AlphaFold2 在第 14 届 CASP 竞赛上进一步大杀四方,在给定预测蛋白质中 GDT 平均得分 92.4,远超所有竞争对手;对高难度蛋白预测 GDT 平均得分 87,比第二名高出 25 分。2021 年 7 月 15 日,详细描述 AlphaFold2 内容的论文在《自然》周刊在线发表 [7],至今引用近万次。Deepmind 不久还公布算法供全球研究人员免费使用。这项成就被《科学》周刊评选为 2021 年度十大科学突破之首,蛋白结构预测也成为《自然 - 方法学》2021 年度方法 [8]。

AlphaFold2 的发展和应用

AlphaFold2 解决了蛋白质结构预测问题,目前虽无法做到尽善尽美,但大多数情况下对非结构解析专业的普通研究者而言已经足够。尤为重要的是,当研究人员获得感兴趣蛋白质序列时能够在几天甚至几小时内获得完美结构信息,而不再需要数月甚至数年时间和数百万美元的花费,对生命科学研究而言,就是难以置信的突破。

当然,AlphaFold2 有不足之处,比如,对内在无序结构(它们在相分离等多个过程发挥重要作用)的预测效果较差。因为最初的设计目标是对单个蛋白质结构进行预测,但蛋白质发挥作用时往往是以复合物或小分子结合状态存在,为此,Deepmind 公司和其他研究团队又开发出其他版本作为补充,如 AlphaFold Multimer 和 RosettaTTAFold 等。

AlphaFold2 已展示出强大的蛋白质结构预测能力,2021 年完成人类所有蛋白质的结构预测;2022 年 7 月,获得 2 亿多种蛋白质的预测结构,并已进入数据库供免费使用 [9,10]。Deepmind 公司最近推出 AlphaFold3 版本,可高准确度和高精度预测蛋白质复合物、蛋白质 - 核酸、蛋白质与小分子配体等三维结构 [11],进一步加大适用范围。

在基础研究领域,原来研究新蛋白功能需要依赖于 X - 射线衍射或冷冻电镜,高昂的费用和技术门槛使大多数实验室望而却步,目前该问题得到了有效解决。联合 AlphaFold2 和冷冻电镜成功解析核孔复合物结构这一成果对理解细胞核内外物质进出机制具有重要意义。

在应用研究领域,现代药物研发很大程度上依赖于蛋白质结构信息,但诸多感兴趣药物靶点蛋白尚未用实验方法解析出来,结构预测的突破无疑解决了这一瓶颈,必将极大推动新药研发进程。蛋白质人工设计如抗体和疫苗筛选是一个重要领域,传统方法是先设计出多种组合后,通过实验进行反复验证,过程繁琐耗时,但通过蛋白质结构预测则会大大缩短研究周期。

深远影响

蛋白质结构预测的突破可归因于天时、地利和人和的共同结果。天时上,高速发展的人工智能和层出不穷的新方法是 AlphaFold 的理论基础,PDB 中快速增加的蛋白质结构是深度学习的材料基础;地利上,背靠谷歌公司强大的运算能力;人和上,公司聚集了一批富有朝气和探索精神的年轻人,以及哈萨比斯与江珀卓越的领导才能和创新能力,成功也就水到渠成。

近年来,AI 在如火如荼地快速发展,取得一系列重大突破,如 ChatGPT、Sora 等,其智能程度逐渐提升,正在改变着人类的生活方式和科研的研究模式。AlphaFold 无疑是优秀代表之一,可看作是 AI 发展的一个缩影。

AlphaFold 解决了困扰生命科学多年的一个重大难题,并有望为其他生物学问题解决提供借鉴。大数据已成为当前科学发展的重要特征,如基因组测序结果和海量论文等,借助 AI 工具解决生命科学问题已成为一个重要方向。AlphaFold 成功的另一层意义在于激励年轻人要敢于挑战自我。

AlphaFold2 的成功也为哈萨比斯和江珀两位科学家带来众多科学荣誉。他们先后分享威利生物医学科学奖 (2022 年)、生命科学突破奖(2023 年)、 盖尔德纳国际奖(2023 年)、拉斯克基础医学研究奖(2023 年)等 [12],也将是近几年诺贝尔自然科学类奖的热门人选。

致谢:本文获得周耀旗老师重要建议,在此表示诚挚的感谢。

参考文献

[1] Sklar J. QnAs with Demis Hassabis and John M. Jumper: Winners of the 2023 Albert Lasker Basic Medical Research Award. Proc Natl Acad Sci USA 2023, 120 (39):e2313816120.

[2] Rothman JE. Starting at Go: Protein structure prediction succumbs to machine learning. Proc Natl Acad Sci USA, 2023, 120 (39):e2311128120.

[3] Kuhlman B, Bradley P. Advances in protein structure prediction and design. Nat Rev Mol Cell Biol, 2019, 20 (11):681-697.

[4] Zhou Y, Litfin T, Zhan J. 3 = 1 + 2: how the divide conquered de novo protein structure prediction and what is next? Natl Sci Rev, 2023, 10 (12):nwad259…

[5] Jumper J, Hassabis D. The Protein Structure Prediction Revolution and Its Implications for Medicine: 2023 Albert Lasker Basic Medical Research Award. JAMA. 2023, 330 (15):1425-1426.

[6] Senior AW, Evans R, Jumper J, et al. Improved protein structure prediction using potentials from deep learning.Nature. 2020, 577 (7792):706-710.

[7] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature, 2021, 596 (7873):583-589.

[8] Marx V. Method of the Year: protein structure prediction. Nat Methods, 2022, 19 (1):5-10.

[9] Thornton JM, Laskowski RA, Borkakoti N. AlphaFold heralds a data-driven revolution in biology and medicine. Nat Med, 2021, 27 (10):1666-1669.

[10] Borkakoti N, Thornton JM. AlphaFold2 protein structure prediction: Implications for drug discovery. Curr Opin Struct Bio, 2023, 78: 102526.

[11] Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 630 (8016): 493-500.

[12] Sosnick TR. AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award. J Clin Invest, 2023, 133 (19):e174915.


标签: 科研

本文转载自: https://blog.csdn.net/u013669912/article/details/142915324
版权归原作者 斐夷所非 所有, 如有侵权,请联系我们删除。

“2024 诺贝尔化学奖 | 蛋白质结构研究与人工智能”的评论:

还没有评论