自由能计算四十年:生物分子过程中的方法、基准测试与应用
本文信息
- 标题:Free-Energy Calculations of Biomolecular Processes: Methods Development, Benchmarking, and Applications
- 作者:Zoe Cournia,Christophe Chipot
- 发表时间:2026年3月19日
- 文章类型:特刊导言(Special Issue Preface)
- 引用格式:Cournia, Z.; Chipot, C. Free-Energy Calculations of Biomolecular Processes: Methods Development, Benchmarking, and Applications. J. Phys. Chem. B 2026, 130, 2947-2950. https://doi.org/10.1021/acs.jpcb.6c00969
- 特刊信息:Published as part of The Journal of Physical Chemistry B special issue “Applications of Free-Energy Calculations to Biomolecular Processes”.
- 特刊链接:https://pubs.acs.org/page/vsi/applications_free_energy?ref=vi_collection
摘要
去年是开创性自由能微扰计算发表四十周年。1985年,Jorgensen关于甲醇和乙烷相对水合自由能的研究,为分子模拟开启了一个新的阶段。此后,自由能计算逐步发展为分子动力学最有力的应用之一,能够在原子层面解析结合、溶剂化和分子识别等与药物发现密切相关的过程。经过理论、算法和算力的持续进步,自由能模拟已经从早期的探索性尝试,发展为具有定量预测能力的工具。本文回顾了这一领域的理论主线,并概述了蛋白-配体识别、核酸、酶催化、膜环境中的渗透与扰动、方法学开发、基准测试以及机器学习融合中的代表性研究。自由能计算正在推动生物分子建模从“描述结构”走向“解释过程”。
核心结论
- 自由能计算已经进入成熟阶段:相对和绝对结合自由能计算是目前量化分子相互作用最严格的方法之一。
- 应用范围持续扩展:该方法不再局限于蛋白-配体结合,还已深入核酸识别、酶催化、膜渗透和翻译后修饰等问题。
- 方法学与基准测试同等重要:系统准备、热力学路径、集合变量、采样策略和适用域定义,决定了计算究竟停留在定性解释,还是走向定量预测。
- 机器学习正在进入自由能工作流:从集合变量学习到Δ-机器学习势,再到主动学习驱动的化学空间搜索,AI正成为重要助力。
背景
自由能计算的发展,有一个非常清晰的历史坐标。1985年,Jorgensen关于甲醇和乙烷相对水合自由能的自由能微扰(FEP)研究,首次对这一类思想给出了定量验证。紧接着,McCammon及其合作者将FEP与分子动力学结合,用于离子和底物相对结合自由能的计算,使分子模拟开始真正具备化学和生物热力学预测能力。随后,这一思路又扩展到酶-抑制剂体系和化学反应,为今天常见的QM/MM自由能计算奠定了基础。
从理论上看,今天看似繁多的自由能算法,实际都建立在少数几个共同原则之上。无论采用直方图方法、微扰方法、热力学积分(TI)这类梯度方法,还是Jarzynski恒等式所对应的非平衡方案,核心目标都没有改变:通过代表性采样,估计两个状态之间的可逆功。对应到技术路线,一类方法更偏几何变换,例如通过空间坐标变化得到平均力势;另一类更偏炼金术变换,即通过修改势能函数连接不同化学状态。这两条路线都离不开分层采样和增强采样。
过去四十年里,自由能方法已能预测一系列实验可测量量,包括结合亲和力、分配系数、溶解度、pKa变化以及反应自由能。今天的关键问题已经不再只是“能不能算”,而是“能否稳定、可靠、可重复地算准”。这也解释了为什么方法开发和系统基准测试在这篇特刊中占据同样重要的位置。该特刊由 Journal of Chemical Information and Modeling 与 The Journal of Physical Chemistry B 在 2024 年征稿后联合组织,共汇集了来自世界各地 27 个研究组的工作。
关键科学问题
- 如何用统一框架理解不同自由能算法:FEP、TI、伞形采样、元动力学和非平衡方法形式不同,但都服务于同一个热力学目标。
- 如何让自由能计算真正可预测:准确采样、合理热力学路径、可靠力场和明确适用域,缺一不可。
- 复杂体系的关键瓶颈是什么:金属位点、慢构象变化、膜环境和共价反应,仍是当前最具挑战性的应用场景。
- 机器学习如何真正帮助自由能模拟:问题不只是“能不能加AI”,而是“如何在不牺牲物理可解释性的前提下提高效率和迁移性”。
研究内容
正文基本分为四部分:
Introduction、Applications、Methods Development and Benchmarking、Concluding Remarks。下面按这个顺序梳理主要内容。
引言:四十年后,自由能方法到底走到了哪一步
引言首先回到1985年的FEP里程碑工作,并指出自由能计算已经从早期“采样严重受限但概念非常重要”的方法,发展为可定量预测的工具。今天,尤其是相对和绝对结合自由能计算,已经成为量化分子相互作用最严格的路径之一。虽然它们仍然过于昂贵,暂时不适合大规模虚拟筛选,但在先导优化中已经越来越实用,而且随着计算成本继续下降,其应用范围还会进一步扩大。
不同方法背后依托的是共同的统计力学原则:
- 需要对相关构型进行准确采样
- 需要在两个状态之间构建一致的热力学路径
- 无论是几何路径还是炼金术路径,本质上都在估计可逆功
FEP、TI、伞形采样和元动力学看起来形式不同,但它们都依赖两个共同前提:代表性采样,以及连接状态的合理热力学路径。
应用:自由能计算正在覆盖哪些生物分子过程
应用部分分成四块:蛋白-配体识别与药物发现、核酸与蛋白-核酸识别、酶催化与突变、生物技术应用,以及膜环境中的渗透与膜扰动。
蛋白-配体识别与药物发现
这是自由能计算最成熟、也最接近药物研发实践的一块。代表性工作包括:
- Singh等人:对激酶突变如何影响抑制剂结合进行了前瞻性基准测试。基于物理的方法、Rosetta和机器学习方法在耐药/敏感分类上精度相近,说明结构基础方法已开始接近精准肿瘤学场景的实际需求。
- Bittner等人:通过马肝醇脱氢酶在深共熔溶剂中的MD和自由能计算,说明这类溶剂会收缩活性位点并降低其柔性,从而削弱底物结合。深共熔溶剂是一类由两种或多种组分混合形成的低熔点溶剂体系,常因强相互作用而呈现不同于普通有机溶剂的性质。这项研究表明,深共熔溶剂组成会直接影响酶活性,并为设计更兼容的生物催化溶剂提供依据。
- Elola等人:研究了短干扰RNA与3-氨丙基三乙氧基硅烷功能化二氧化硅纳米颗粒的结合。其结合过程基本无能垒,而且表面接枝密度越高,结合越强;但较低覆盖度虽然结合较弱,却可能更有利于细胞内释放。
- Barron和Vilseck:用λ-动力学自由能计算和MD解释了胰岛素A3位点微小突变为何会显著削弱受体结合,展示了单原子尺度变化如何通过自由能微扰改变生物学功能。
- Wang等人:把元动力学和伞形采样结合起来,研究高同源性CDK之间的药物选择性,结论是选择性并不只编码在静态结合模式里,也编码在结合路径上的瞬态中间状态中。
- Gusev等人:将主动学习和相对结合自由能计算结合,用于LRRK2 WDR结构域的命中优化,展示了在减少模拟次数的同时高效搜索大化学空间的可能性。
- Xiong等人:结合经典MD与QM/MM自由能计算,预测了SARS-CoV-2 3CL蛋白酶及其耐药突变体对共价抑制剂的响应,指出耐药性来自非共价结合与共价反应能学的协同变化。
- Azimi和Gallicchio:提出
receptor hopping和receptor swapping两种方案,用于直接或间接计算不同受体之间的配体选择性自由能,并在主-客体体系和蛋白酶靶点上得到与实验及传统方法一致的结果。 - Tandarić 和 Gutiérrez-de-Terán:用FEP比较A2BAR部分激动剂BAY60-6583的不同结合模式,并结合突变数据筛选出更符合生理实际的结合构象。
核酸与蛋白-核酸识别
在核酸体系中,自由能方法不仅能研究“是否结合”,还可以研究柔性、弯曲和识别路径。
- Fakharzadeh等人:量化了A-DNA、B-DNA和Z-DNA的弯曲自由能,指出DNA弯曲能高度依赖构型、序列和错配,错配还能显著软化双螺旋并促进扭结形成。
- Kumari等人:将深度学习集合变量和OPES结合,实现RNA-肽结合与解离的可逆采样,展示了机器学习CV在复杂识别过程中的优势。
- Singh等人:通过长时间尺度MD和增强采样,解释了RNA伴侣蛋白ProQ的识别机制,指出其对sRNA的识别与蛋白凹面上的静电驱动结合密切相关。
- Kumar等人:研究了配体如何通过别构效应重塑自由能景观,从而稳定或破坏受体-DNA相互作用并最终调控基因表达。
酶催化、突变与生物技术应用
这部分工作把自由能方法进一步推进到反应机理、突变效应和蛋白调控层面。
- Vidossich等人:通过原子级MD和QM/MM自由能计算解析真菌角质酶水解脂肪族聚酯的机制,指出酰化是限速步骤,且四面体中间体的稳定对酶促塑料降解效率至关重要。
- Jäckering等人:结合QM/MM自由能模拟和自适应 string method,揭示保守“摆动”色氨酸及附近突变如何调控PET水解,说明酶活性不只取决于底物是否结合,也取决于动态芳香重排是否能稳定过渡态。
- Di Geronimo等人:用QM/MM元动力学研究溶酶体甘露糖苷酶突变,指出即便远离活性位点的突变,也能通过改变底物构象和催化几何,把反应能垒显著抬高。
- Jitonnom等人:用QM/MM MD和伞形采样研究GH51 α-L-阿拉伯呋喃糖苷酶,发现供体-受体选择性来源于催化三联体内部精细调谐的静电和质子化平衡。
- Dasari和Kalyaanamoorthy:通过经典MD、结合自由能和副本交换模拟研究Tau蛋白,指出磷酸化和O-GlcNAc糖基化并不是简单的“开/关”调控,而是通过重塑构象系综和结合自由能来改变蛋白-蛋白相互作用。
膜环境中的渗透与膜扰动
这一节围绕两类更具体的问题展开:分子如何穿过膜屏障,以及小分子如何扰动有序膜结构。膜环境在这里不再只是背景,而是直接参与自由能调控的因素。
- Deylami等人:通过MD和渗透自由能剖面研究革兰氏阴性菌外膜,指出抗生素渗透受强氢键、离子介导作用、离子配位和水化造成的自由能垒控制。
- Sittiwanichai等人:通过MD和伞形采样分析局麻药对有序膜的扰动,说明局麻药破坏脂筏样膜结构的关键并不只是电荷,而是其跨膜自由能剖面中编码的立体和疏水效应。
方法学发展与基准测试:自由能计算能否真正可信,取决于这里
方法开发和基准测试决定了自由能计算能否成为可靠工具。
- Jorgensen和Tirado-Rives:用蒙特卡洛FEP计算20个芳烃在水和环己烷中的溶剂化自由能,与实验高度一致,并揭示了与分子大小和表面积相关的明显规律。
- Rick和Summa:比较了不同势能模型在配体结合自由能上的表现,发现自由能本身的预测很准,但焓和熵的分解更难;通过调节色散相互作用后,一致性进一步提升。
- Güven等人:针对丝氨酸和金属-β-内酰胺酶的相对结合自由能计算做基准测试,重点检验锌配位建模,表明金属位点仍是相对结合自由能预测中的薄弱环节。
- Schoenmaker等人:提出
IMERGE-FEP,自动生成中间分子,把大扰动拆成更小、更相似的步骤,以改善炼金术自由能计算的收敛性。 - Giese等人:把图神经网络中的
MACE引入范围校正的Δ-机器学习势,改善QM/MM模拟,得到的AM1/d + MACE模型对自由能面再现和迁移性都优于对照模型。这里的Δ-机器学习势,通常指不直接学习完整势能面,而是学习低级方法与高级方法之间的差值,再把这部分修正加回基线势能中。
- Ohadi等人:对
FEP+做了大规模基准测试,指出输入构象和晶体水位置是预测精度的关键决定因素;有时简单的最大公共子结构对齐加适当保留水分子,反而优于更复杂的姿势生成流程。 - Rivel等人:提出
Full-Path和Rapid两个膜孔形成集合变量,用于同时描述孔成核和扩张,并证明其能减少滞后、得到一致线张力并重现实验趋势。 - Serrano-Morrás等人:提出基于DUck拉伸MD得到的准结合态自由能
ΔGQB,作为相对结合自由能和活性悬崖的快速预测指标,在明确适用域内可作为高通量替代方案。
真正决定自由能方法能否走向广泛应用的,不只是“算力够不够”,还包括:
- 体系准备是否合理
- 集合变量是否物理上有意义
- 采样是否充分
- 报告中是否清楚说明精度和适用域
方法学严谨性决定应用价值。自由能计算能否成为可靠预测工具,关键并不只是有没有成功案例,还取决于系统准备、集合变量、适用域定义和误差报告是否足够扎实。
结语:自由能正在成为解释生物分子过程的共同语言
这些工作共同标志着生物分子建模的一次转向。研究重点正在从“结构长什么样”转向“为什么会发生某个生物过程、突变如何改变它,以及这些改变能否被预测和工程化利用”。
自由能方法的重要性,不只是来自算力增长,也来自方法学严谨性和概念清晰度的同步提高。机器学习在这里也不是替代自由能计算,而是进入工作流的多个环节,包括集合变量学习、QM/MM势能改进、主动学习驱动的化学空间搜索,以及自由能预测和分析。未来,自由能计算将越来越多地进入前瞻性应用,例如耐药靶点药物设计、酶理性改造、调控机制解析,以及复杂生物环境中涌现行为的预测。
关键结论与批判性总结
作为共同的热力学语言
- 这篇特刊导言最有价值的地方,在于把自由能计算重新界定为一种解释生物分子过程的热力学语言,而不只是分子模拟中的一个技术模块。
- 从蛋白识别、核酸调控到酶催化,以及膜环境中的渗透与膜扰动,导言展示了自由能方法已经具有明显的跨体系统一性。
预测成功依赖什么
- 体系准备、热力学路径、采样策略,以及精度和适用域的明确定义,是预测成功反复出现的前提条件。
- 这也意味着方法开发和基准测试并不是附属工作,而是决定自由能方法究竟停留在定性解释还是进入定量发现的基础。
这篇导言本身的边界
- 作为导言,它的目标是全景梳理而不是深入比较,因此很多研究只能点到为止,无法展开讨论具体误差来源、收敛难点和失败案例。
- 文中对机器学习的讨论是积极而谨慎的,但仍然停留在趋势总结层面,没有深入比较不同AI路线在自由能工作流中的优势与代价。
从回顾性解释走向前瞻性应用
- 自由能方法正在从回顾性解释走向前瞻性应用。
- 这类前景包括:针对耐药靶点的药物设计、酶的理性工程改造、调控机制解析,以及复杂生物分子环境中涌现行为的预测。