如CGI一般的分子动力学,让科学家看到了3D渲染后的分子运动「影片」

唯物论有句经典名言:世界是物质的,物质是运动的,运动是有规律的。这不仅是在描述人类所生活其中的宏观世界,也道出了微观世界的本质。得益于理论发展、实验和计算技术的飞跃,人们对种种宏观自然科学现象的解释已经越来越向微观粒子世界探求。

比如我们已经普遍认识到,当物质从固态向液态和气态转变,是分子运动速度加快、分子间相互作用力减弱的过程;药物进入人体后带来疾病的治愈,是药物分子与蛋白质等生物大分子之间发生相互作用的结果。这种观察方式在生命科学相关领域尤其深入人心,生命的维持有赖于分子运动,要揭示各种生物分子的功能,就必须捕捉到它们的三维构象动态分布,而不仅仅是单一结构的静态描绘。

这一范式的兴起和发展,离不开一种强大的、基于计算的研究工具,那就是分子动力学(Molecular Dynamics,MD)。

如何在计算机上看见动起来的粒子

分子动力学诞生于上世纪50年代末,由两位计算物理学家Berni Alder和Tom Wainwright提出。

它是一种基于经典牛顿力学的分子模拟方法,能够计算出分子体系随时间的演化性质,利用这种方法,可以基于当前分子体系的位置、速度和动能等信息输入,来预测一定时间后该体系的位置、速度和动能,获取分子体系中各种粒子(如分子、原子、离子等)的运动轨迹,从而得到体系的统计性质,比如可能的构型、热力学参数、分子在溶液中的扩散行为、平衡态性质等。

显然,利用分子动力学模拟能够获取的信息量,直接上升了一个维度,所以它的出现很快就在许多科学领域带来了变革性的进展。研究人员可以使用MD来模拟计算药物与靶标蛋白的作用机制,为药物设计和新药的发现提供宝贵的线索;在材料科学中,MD被用于分析材料的结构、相变过程、生长和界面现象,为预测材料性能和优化材料设计提供科学依据,尤其在电子元件、催化剂等的研发中发挥着重要作用。同时,凝聚态物理领域的超导体、磁性材料等凝聚态系统的结构、相变和动力学,也需要借助MD来研究。

可以说,分子动力学方法的核心价值,就是为这些领域的微观粒子研究提供了一个三维且动态的观察窗口,与静态的平面结构相比,一段动起来的“蛋白质影片”给人呈现的信息无疑更加直观、清晰且丰富。

这也是最近备受瞩目的Alphafold 3不能完全代替分子动力学的原因。

今年5月,谷歌子公司DeepMind推出的AlphaFold 3模型登上Nature头版,在生物学和AI界引起了极大关注,它能够以前所未有的原子精度预测出几乎生物分子的结构和相互作用,被认为是计算结构生物学发展的一大里程碑,将加速生物医学上的突破。

image.png

AlphaFold 3对感冒病毒Spike蛋白(蓝色)的静态结构预测,灰色部分为预测结果。

但显而易见,Alphafold也有它无法完成的任务,正如AlphaFold 3的作者所承认,它只能做生物分子3D结构的静态预测,而不能刻画对溶液中生物分子系统的动力学行为,对复杂的「蛋白质-蛋白质」或「蛋白质-小分子」相互作用的捕捉能力很有限,此外,它还有深度学习模型所固有的黑盒性质,可能会产生一定幻觉,导致其预测准确性降低。

许多应用Alphafold做分子结构预测的研究都表明,分子动力学模拟始终发挥着不可替代的作用。比如2023年发表在《Journal of Chemical Information and Modeling》期刊上的一项研究,使用Alphafold 2对嗅觉受体的结构进行的预测只能得到单一结构,并不能捕捉该受体可能的多种构象状态,而且仍必须依赖分子动力学模拟对模型预测做精细的调整和验证。

作者在论文中强调,MD模拟是检验模型预测结构的稳定性的关键。

分子动力学的“动态3D特效”

MD捕捉分子动态性的能力带给自然科学的价值之大,其实可以类比电脑生成图像技术(Computer-generated imagery,CGI)出现后,为电影、游戏、虚拟现实等领域带去的革命性影响。

同样是基于计算机,MD模拟微观粒子的运动,CGI则以3D建模的方式复刻宏观世界的事物,以及进一步创造出不存在的虚拟物,给人以假乱真的视觉效果。

在CGI技术出现以前,电影的制作只能完全基于物理现实去安排人物角色和场景,难以将无限的创意变为现实,电影的造梦特质大打折扣。此外,传统影视拍摄中的许多复杂场景,都不得不通过物理装置和实景建造来呈现,所以投入成本高,制作周期长。

而CGI的出现带来了一场电影行业的革命。一方面,电影和视频游戏可以打破物理现实的限制创造虚拟的角色和场景。比如《指环王》中的兽人士兵,这些灵动的角色和复杂的虚拟场景都是出自CGI的“魔法”。另一方面,CGI也使电影行业更加工业化,大大降低了制作成本。比如说要完成一个成千上万人的人群全景的拍摄,使用CGI要划算得多;对于动画影片的制作,基于计算机的CGI也有着比传统人工画纸更高的生产效率。

image.png

电影《阿凡达》

MD方法对于自然科学研究有着相似的影响力:降本增效,同时提供更有信息量的“观看”体验。

在没有MD的时代,科学家面临的首先是研究手段的局限。要研究物质的微观粒子,不外乎理论计算和实验两种方式。但从理论到实验其实存在一定的鸿沟,往往要反复多次试验,才能获得可靠的结论,而且过程中的不可控性较强。拿材料研发来说,很长一段时间都依赖“原始”的试错法,人力物力的消耗大,研发周期很长,失败风险也不小。

而分子动力学所基于的计算模拟,如今已经成为理论和实验之外的第三大研究工具,对许多科学研究的效率提升和成本降低做出了很大贡献。

MD让我们能够先在计算机上模拟粒子的化学和物理过程,获取微观层面的动力学信息,从而提供理论支持,而且还能严格控制变量,避免实验中的潜在不确定因素,指导更好的实验设计。比如通过模拟材料分子的动力学行为,可以预测材料的宏观性能,以及合理推测实验数据走势,实验的成本就可以节省许多。此外,MD还大大突破了传统实验的环境限制,在超高压、超高温和强电场这些严酷条件下,MD模拟就派上用场了。

其次,在不做分子动力学模拟的情况下,人们对分子和原子的观察只能局限于静态影像,信息量有限。比如在做药物设计时,研究人员就很难看清蛋白质的动态结构,以及药物分子接近其目标受体时是如何运动的。

MD就好比电影中的CGI技术,为蛋白质分子结构加上了“动态3D效果”。无论是冷冻电镜拍摄的蛋白质分子结构“高清照片”,还是AI模型预测的蛋白质三维静态结构,都无法取代分子动力学拍摄出来的蛋白质分子结构运动“电影”。毕竟,蛋白质一次折叠的信息,就需要至少十亿张“照片”才能描述。

计算加速引擎:算得更快,看得更多

在发展历程上,分子动力学与CGI还有另外一个不得不提的相似之处,那就是二者都曾经历硬件算力方面的制约。

1990年代中期,人们对于使用计算机来制作整部数字电影的能力仍抱有怀疑,直到全3D动画电影《玩具总动员》的出现给了人们信心,但受到当时电脑的计算能力限制,这部影片的每一帧都需要花费4到13个小时。

尤其是其中的渲染技术,对计算资源的要求极高,这事实上推动了后来GPU的诞生。

GPU的全称是“图形处理器”(Graphics Processing Unit)”,由英伟达于1999年发布,它最初的设计目的就是为了加速3D图形的渲染。CGI技术发端于计算机图形学(Computer Graphics,CG),研究如何在计算机中表示、计算和处理图形,尤其是要对三维事件的点阵通过矩阵变化投影到二维平面(即光栅化),这需要大量的矩阵计算,而GPU就提供了并行计算的能力,比CPU更快。如今,GPU已经从最开始应用于3D渲染、视频游戏、艺术设计,到成为人工智能大模型高度依赖的算力引擎。

分子动力学在经历数十年的计算资源瓶颈后,也终于在2007年迎来了它的超强算力引擎——安腾超级计算机(Anton)。

美国D. E. Shaw研究所设计安腾的目的,就是专门为了加速分子动力学模拟计算。

很长一段时间内,MD模拟都难以对体系做较长时间尺度的计算,举个例子,为了“拍摄”到包含百万个原子的蛋白质分子运动“电影”,计算机必须进行以飞秒为时间尺度的连续运算,每一次计算的对象是100万原子间的相互作用力,以预测每个原子在下一飞秒的位置、速度和能量状态。仅仅1微秒长的“电影”,就需完成高达4亿至8亿次计算。如此庞大的计算量,即便是全球顶尖的超级计算集群,每天也只能做纳秒级别的模拟计算,极大地限制了科研进程。

安腾的横空出世,革命性地破解了MD模拟的计算难题。为了提升计算效率,安腾在软硬件方面做了全面的定制化,它采用ASIC(Application Specific Integrated Circuit)专用芯片架构,尽可能减少了数据的传输,在芯片上分区域、分精度计算不同任务,同时还开发了匹配的动力学模拟软件Desmond。

最新的第三代安腾计算分子动力学模拟任务的速度,已经比现有通用型超级计算机快了100倍以上,可以在10个小时内完成过去一整年才能算完的任务。

image.png

RLY-4008 与 抑制剂 FGFR2 的复合晶体结构

更振奋人心的是,安腾超算在药物研发领域实现了震惊世界的落地应用,美国的Relay公司就是在安腾的计算支持下,在2016年成功确认了一款治疗胆管癌的FGFR2抑制RLY-4008的结构,一举成为制药行业的领头羊。

这里也顺便一提,正如英伟达的顶级图形显卡在今天一卡难求,安腾超算也成了一个卡脖子的存在,全球仅有的几台机器位于美国D. E. Shaw 研究所和匹兹堡超算中心,其他机构都需要研究提案才能申请使用,在分子动力学模拟专用超算的自主研发上,我们任重道远,而且不容懈怠。

因为可以预见的是,分子动力学在基础科学研究中的价值,及其在产业应用方面的潜力,还大有探索空间。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )