中文内容
AlphaFold:五年影响力
Demis Hassabis、John Jumper、Pushmeet Kohli 和 Anna Koivuniemi 代表 AlphaFold 团队
五年前,AlphaFold 2 解决了蛋白质结构预测问题,开辟了生物学研究的新途径,并为我们提供了第一个重要证明:AI 可以成为推动科学进步的强大工具。
蛋白质是驱动活细胞中每一个过程的复杂微观机器。它们由独特的长链氨基酸组成,会精确折叠成三维结构,而这种结构在很大程度上决定了蛋白质的功能——因此,了解其形状对于药物发现和理解疾病至关重要。
如果蛋白质错误折叠,就可能失去功能并导致疾病,例如阿尔茨海默病和帕金森病。数十年来,确定这些结构一直是一项艰巨任务,往往需要一年或更长时间的昂贵且繁复的实验工作。
在 2020 年的 CASP 14(Critical Assessment of protein Structure Prediction,蛋白质结构预测关键评估)竞赛中,AlphaFold 2 仅根据蛋白质的氨基酸序列,就以惊人的准确度预测了其结构——这一成就被广泛誉为解决了生物学领域这一长达 50 年的重大挑战。但这一突破真正而持久的影响,是在我们把 AlphaFold 交到研究界手中之后才显现出来的。
全球发现引擎
2021 年,我们与 EMBL-EBI 合作推出 AlphaFold Protein Database,这是 AlphaFold 成为全球采用的科学工具的转折点。一年后,我们发布了 AlphaFold 2 对超过 2 亿个蛋白质结构的预测,完成了若以实验方式解决将需要数亿年才能完成的工作。
免费开放的 AlphaFold Protein Database 以前所未有的规模加速了科学进展。它已被 190 多个国家的 300 多万名研究人员使用,其中包括低收入和中等收入国家的 100 多万名用户。超过 30% 的 AlphaFold 相关研究聚焦于更好地理解疾病,造福人类福祉。
这项工作深远的科学和社会价值在 2024 年获得诺贝尔化学奖认可。
现实世界的变革
AlphaFold 已成为科学家应对世界上一些最紧迫问题的标准工具,涵盖从保护生物学到心脏健康等领域。
培育更健康、更强壮的蜜蜂
欧洲科学家使用 AlphaFold 了解蜜蜂中的一种关键免疫蛋白 Vitellogenin(Vg)。这些结构洞见如今正被应用于濒危蜜蜂种群的保护工作,并指导开发 AI 辅助育种项目,以培育更健康、更具韧性的传粉昆虫。
揭示心脏病背后的关键蛋白
由“坏胆固醇”(LDL)引起的动脉粥样硬化是全球死亡的首要原因。数十年来,LDL 中核心蛋白载脂蛋白 B100(apolipoprotein B100,apoB100)的结构一直难以解析。AlphaFold 2 最终帮助揭示了其复杂的笼状形态。这一期待已久的蓝图为药物研究人员提供了设计新型预防性心脏疗法所需的原子级细节。
革新研究
AlphaFold 也在改变科学研究——拓宽获取渠道、加快研究周期,并大幅降低成本。
扩大获取渠道
土耳其本科生 Alper 和 Taner Karagöl 在疫情期间利用在线 AlphaFold 教程自学结构生物学——此前没有相关训练。如今,他们已经发表了 15 篇研究论文。
提高发现速度
苏黎世大学和 Sainsbury Lab 的分子与细胞植物生理学教授 Cyril Zipfel 看到研究周期大幅缩短。他们将 AlphaFold 与比较基因组学结合使用,以更好地理解植物如何感知环境变化,为培育更具韧性的作物铺平道路。
AlphaFold 已被 35,000 多篇论文引用,另有 200,000 多篇论文在其方法学中纳入了 AlphaFold 2 的相关要素。它还在提升产出研究工作的质量。
Innovation Growth Lab 对 AlphaFold 2 影响进行的一项独立分析表明,使用 AlphaFold 2 的研究人员提交的新型实验蛋白质结构数量增加了 40% 以上。这些蛋白质结构更有可能不同于已知结构,从而鼓励探索科学中的未知领域。此外,与 AlphaFold 2 相关的研究被临床文章引用的可能性是结构生物学典型工作的两倍,并且被专利引用的可能性也显著更高。
数字生物学新时代
AlphaFold 影响力最令人兴奋的例子之一是 Isomorphic Labs——这是一家 AI 药物发现公司,成立于 2021 年,当时这一突破性模型已被证明强大到足以应用于合理药物设计。此后,Isomorphic Labs 开发了一个统一的药物设计引擎,以大幅改变其设计新药的方式并加快科学发现,目标是有朝一日解决所有疾病。
我们与 Isomorphic Labs 共同开发了 AlphaFold 3,它提供了前所未有的细胞视图,我们预计这将推动药物发现流程的变革,并开启“数字生物学”时代。
该模型旨在预测所有生命分子的结构和相互作用——不仅包括蛋白质,还包括 DNA、RNA 和配体(构成大多数药物的小分子)。它还可以生成整个分子复合物的联合三维结构,从而整体观察潜在药物分子如何与其靶蛋白结合,或蛋白质如何与遗传物质相互作用。
AlphaFold Server 正在帮助全球非商业研究人员利用这项技术,加快他们提出并检验新假设的能力。迄今为止,它已为全球数千名研究人员生成了超过 800 万个折叠结果——即结构和相互作用预测。
AI 赋能科学的未来
受 AlphaFold 启发,我们开发了新一代模型,用于解决生物学领域的各种问题。AlphaMissense 和 AlphaGenome 使用 AI 评估疾病背后的遗传突变。我们的 AlphaProteo 模型可以设计新型高强度蛋白结合体,靶向多种分子——包括与癌症和糖尿病相关的分子。这些模型正在加深我们对复杂疾病的理解,并最终推动新疗法的开发。
生物学是我们的第一个前沿领域,但我们将 AlphaFold 视为 AI 如何以数字速度加速整个科学领域的模板。从聚变和地球科学到整体科学发现,我们正在追寻下一个类似 AlphaFold 的突破。我们期待继续与全球科学界合作,赋能各地研究人员应对人类面临的最大挑战。