短短10微秒就够了？MM/PBSA结合自由能计算的采样陷阱

本文信息

标题: Sampling Challenges of MM/PBSA Binding Energy Calculations
作者: Xiaozhe Xu, Fan Zhou, Liangzhen Zheng, Sheng Wang, Daixi Li, Xiangda Peng
接收时间: 2025年10月
单位: 中国上海应用技术大学生物热能科学与技术研究所、上海泽利生物技术公司、中国深圳先进技术研究院
引用格式: Xu, X., Zhou, F., Zheng, L., Wang, S., Li, D., & Peng, X. (2015). Sampling Challenges of MM/PBSA Binding Energy Calculations. Journal of Physical Chemistry B, 119(37), 12071-12079. https://doi.org/10.1021/acs.jpcb.5c04908

摘要

MM/PBSA（分子力学/泊松-玻尔兹曼表面积）是预测蛋白质-配体结合自由能的常用方法。然而，本研究通过对19个蛋白质-配体复合物的系统分析，揭示了一个令人震惊的现象：短期分子动力学（MD）模拟（如100纳秒）会产生看似收敛但实际上是虚假的结合自由能值。这些值常常与更长期模拟（如微秒级）的结果不一致，反映出系统中存在缓慢的构象转变被早期模拟所错过。通过PCA分析和增强采样方法（IaMD和OPES），研究证明了足够的采样才是获得可靠结合自由能的基础。

核心结论

虚假收敛陷阱：短期MD模拟（100 ns）显示的平台期不代表真正的热力学收敛，而是陷入了局部最小值
多微秒采样必需：至少需要3×10微秒的重复模拟才能捕捉蛋白质和配体的关键构象转变
增强采样作为补充：IaMD和OPES可加速采样，但不是万能解决方案，仍需与常规MD相结合
配体适应性至关重要：PCA分析显示许多配体在100 ns内仍未充分探索其可用的构象空间
动力学信息丰富：不同的氢键、π-π相互作用和水桥在不同采样阶段出现和消失，反映出系统的动态本质

🔍 重要勘误：原文MM/PBSA采样参数存在计算错误，实际分析的是从10 μs轨迹中每10 ns取一帧的1000帧数据，而非每10 ps取一帧。这不影响核心结论但确保方法学描述准确。

背景

MM/PBSA已成为计算蛋白质-配体结合自由能的标准方法，广泛应用于药物发现、虚拟筛选和结合机制研究。该方法通过分解策略计算结合自由能：

\[\Delta G_{\text{bind}} = \Delta G_{\text{complex}} - \Delta G_{\text{protein}} - \Delta G_{\text{ligand}}\]

其中各项包括范德华相互作用、静电相互作用、极性溶剂化能和非极性溶剂化能等贡献。

然而，在实际应用中，研究者面临一个关键的但常被忽视的问题：MD模拟需要多长时间才能获得可靠的结合自由能估计？传统做法通常假设100纳秒到1微秒的模拟是足够的，但这一假设很少经过严格的收敛性验证。

实际上，生物大分子系统中存在多个时间尺度的动力学过程：

纳秒级：侧链和环的局部重排
微秒级：二级结构元件的重新定向、结合袋的适应性重塑
毫秒及以上：蛋白质的全局构象转变

当我们在这些多尺度变化中进行MM/PBSA计算时，采样不足导致的偏差可能远大于其他误差来源（如力场精度、隐溶剂模型近似等）。

关键科学问题

本研究旨在回答几个根本性的问题：

100纳秒的MD模拟是否足以获得准确的结合自由能？ 这个时间长度真的代表热力学平衡还是只是一个局部的虚假平台？
什么样的构象变化会影响结合自由能的收敛？ 是配体的旋转、蛋白质结合袋的扩张，还是其他的动力学事件？
增强采样技术（如IaMD和OPES）能否有效加速收敛？ 这些方法的加速因子如何，它们的结果是否可靠？
如何定量评估采样的充分性？ 除了观察能量曲线的平台化，还有哪些指标可以证明系统已达到充分采样？

创新点

系统性的收敛性研究：首次在多个代表性蛋白质-配体系统（4个靶点的19个复合物）上系统调查MM/PBSA的采样充分性
多层面的分析：不仅分析全局的结合自由能，还通过PCA、RMSD、氢键统计等深层次方法剖析构象动力学
增强采样的比较评估：详细对比了IaMD和OPES在加速收敛中的性能，并分析了其局限性
时间依赖的相互作用分析：首次系统统计了不同相互作用类型（氢键、π-π、盐桥、水桥）在不同采样时间的占有度变化
实践指导：为用户提供了明确的采样时间建议和质量控制策略

研究内容

研究对象与方法设计

本研究分析了四个重要靶点的19个蛋白质-配体复合物：PLPRO系列（冠状病毒主蛋白酶，4个复合物）、HIF2A系列（缺氧诱导因子，5个复合物）、TNKS2系列（PARP家族蛋白，5个复合物）、cMET系列（酪氨酸激酶，5个复合物）。

fig1 图1：本研究的四种蛋白质及其小分子配体

图中内容：

绿色：各靶点蛋白的整体结构
绿色球棍模型：对应的小分子配体

具体包括：

plpro系列：4个不同配体（JW9、JWX、WUK、XB5）
hif2a系列：5个抑制剂（compounds 234、57、252、164）
tnks2系列：5个化合物（3b、5a、5e、5m、7）
cmet系列：5个配体（CHEMBL3402752等）

这些体系涵盖了中等规模蛋白-配体复合物的多样性，为MM/PBSA采样充分性的系统评估提供了有代表性的基准集合。

所有模拟使用AMBER 14力场，每个系统进行三条10微秒的独立MD轨迹，共采样30微秒。采用滑动平均（50 ps窗口）和累积平均方法评估收敛性，结合PCA、RMSD和相互作用占有度分析构象动力学。详细的方法学流程见下图：

graph TB
    subgraph S1["1.体系选择"]
        direction LR
        A["四大靶点<br/>19个复合物<br/>3×10 μs轨迹"]
    end

    subgraph S2["2.MD模拟与采样"]
        direction LR
        B["AMBER 14力场<br/>298 K, 2 fs步长"] --> C["1 ns保存一帧<br/>均匀抽取1,000帧"]
    end

    subgraph S3["3.多层次评估"]
        direction LR
        D["滑动平均<br/>累积平均"] --> E["PCA覆盖率<br/>RMSD演化"] --> F["相互作用时间演化"]
    end

    S1 --> S2 --> S3

    style A fill:#e1f5ff
    style C fill:#fff9c4
    style F fill:#ffe0b2

核心发现：虚假收敛的揭示

发现1：100纳秒并非真正的收敛点

fig2

图2：10微秒MD模拟后计算的MM/PBSA结合自由能

左侧面板：原始能量随时间变化（实线为滑动平均，浅色噪声曲线为原始数据）
中间面板：数据分布直方图
右侧面板：关键累积平均曲线
蓝色、橙色、绿色三条曲线分别代表三条独立的MD轨迹

关键发现：

tnks2系列：最佳收敛性，10 μs时轨迹差异仅0.1-1.1 kcal/mol
plpro/hif2a系列：配体依赖性收敛
- 收敛良好：plpro-8eua/8uob，hif2a-4/22/39（差异<1.2 kcal/mol）
- 收敛困难：plpro-7sdr/7sqe，hif2a-25/29（轨迹差异7.5-8.3 kcal/mol）
cmet系列：最具挑战性，最大轨迹差异达12.9 kcal/mol（cmet-11）
核心问题：短期模拟（100 ns）的平台期是虚假收敛表征，配体在100 ns内仅探索完整相空间24-46%，到10 μs才增至60-70%。

发现2：蛋白质和配体的构象适应是长期过程

fig3

图3：不同系统的受体RMSD、配体RMSD和主要构象

左侧面板：受体主链RMSD随时间变化
中间面板：配体重原子RMSD
右侧面板：代表性构象结构快照
三种颜色的点分别代表三条独立的模拟轨迹
绿色表示系统的初始构象

关键发现：

(A) 受体RMSD：500 ns内达到平台期（2-4 Å），但结合位点局部RMSD在10 μs过程中仍持续波动
(B) 配体RMSD：整体趋于平稳，但旋转异构体转变持续发生，后期仍有新构象出现
(C) 三阶段适应过程：
- 阶段I（0-100 ns）：快速初始吸附，RMSD迅速下降
- 阶段II（100 ns-1 μs）：侧链二级定位，结合位点重新组织
- 阶段III（1-10 μs）：稀有构象采样，隐溶剂效应充分建立

核心结论：全局RMSD平台化≠完全采样，阶段III（1-10 μs）对结合自由能影响最大。

fig4

图4：plpro-7sdr系统的结合自由能与构象动力学耦合机制

图4A：三条轨迹的结合自由能与主成分PC2投影的关联分析
图4B：Representative conformations，主要相互作用网络的动态变化

关键发现：

PC2与结合自由能高度相关：Pearson相关系数达0.73
关键相互作用残基：E166、Y170、Y267
构象状态差异：
- 高能态（ΔG≈-23 kcal/mol）：Y267盖子打开，π-π堆叠中断
- 低能态（ΔG≈-40 kcal/mol）：Y267关闭，形成三残基相互作用网络

核心结论：100 ns内可能仅采样到单个稳定态，而10 μs才能充分采样多个亚稳态及其间的转变过程。

发现3：关键相互作用的动态出现与消失

研究者对氢键、盐桥、π-π相互作用和水桥进行了统计分析：

时间依赖出现模式：某些关键相互作用在短期模拟中根本不会出现
典型案例：plpro-8eua系统中的Q267-配体H-bond（Table S1）
- 100 ns时：未被检测
- 1 μs时：占有度跃升至15.3%
- 10 μs时：达到59.7%，能量贡献从无跳变至-42 kcal/mol
系统性偏差：静电主导的系统采样不足会选择性遗漏关键H-bond或盐桥，导致结合自由能被系统性高估3-5 kcal/mol

发现4：PCA空间的不完整探索

figs8

PCA分析显示配体构象空间覆盖率：

100 ns覆盖率：22-52%（plpro：22-31%，tnks2：48-52%）
10 μs覆盖率：54-74%（仍低于100%充分采样阈值）
增长倍数：采样困难系统2.3-2.7倍，采样容易系统1.4-1.5倍

核心结论：即使10 μs后，配体仍未充分探索构象空间（最大覆盖率74%），直接挑战”短时间采样足够”的观点。

增强采样方法的评估

鉴于常规MD存在采样不足的问题，研究者评估了两种增强采样技术：IaMD 和 OPES。这两种方法在原理和实现上有显著差异。关于它们的详细数学原理、算法机制和参数设置，请参考 📄 附录：IaMD 和 OPES 的原理与实现。本节主要讨论这两种方法在本研究中的实际应用效果和局限性。

IaMD与OPES的比较分析

fig8

图8：IaMD和OPES模拟的累积加权平均结合自由能。蓝色、橙色、绿色三条线条分别代表三条独立的轨迹；灰色实线是无偏模拟1 μs时的轨迹；灰色虚线是无偏模拟1 μs时的平均能量；黑色虚线是增强模拟的平均能量；红色虚线是无偏模拟10 μs时的平均能量

IaMD（加速MD，Accelerated MD）：通过修改势能表面来加快构象空间探索，核心是集成多个不同加速参数的aMD子项，通过重新加权恢复物理信息。

plpro-7sdr系统：
- cMD：10 μs内显著漂移（-25到-35 kcal/mol）
- IaMD：1 μs快速”平衡”，但与cMD最终值偏离2-3 kcal/mol
- 问题：加速项作用于配体二面角，难以捕捉全局蛋白质重排
hif2a-25系统：
- IaMD相对更优，收敛速度可比
- 仍有±1 kcal/mol系统偏差，重加权修正有局限
tnks2-5系统：
- 最易收敛系统
- 所有方法~200-300 ns后趋于相似，差异<0.5 kcal/mol

OPES（On-the-Fly Probability Enhanced Sampling）：基于集合变量（CV），通过动态构建自适应偏置势引导系统朝目标概率分布采样。与IaMD根本区别在于依赖于关键CV的选择。

IaMD系统依赖性：采样容易系统（tnks2-5）与常规MD一致；采样困难系统（plpro-7sdr）仍有明显偏差
OPES通常优于IaMD：加权结果更接近cMD 10 μs结果，但对全局重排改进有限
共同局限：
- 全局蛋白重排系统中，增强采样加速错误的构象空间探索
- 计算成本高：OPES需求更高资源，每个λ窗口需频繁更新偏差函数
- 高维灵活配体（cmet系列6+旋转键）仍难以充分覆盖

结论：增强采样是加速补充，非替代品。结构稳定系统可加速初期收敛，但蛋白质柔性、多态性强烈系统仍需充足常规MD（>3-5 μs）。

能量分量的系列差异

不同蛋白质系列受不同相互作用主导：

plpro系列：静电相互作用（eel）占绝对主导，与ΔG相关系数达0.8
hif2a系列：以范德华相互作用（vdW）为主
tnks2系列：两者贡献相对均衡
cmet系列：因大型灵活配体呈现多态性

影响：采样不足选择性地遗漏某类相互作用。plpro系统中，关键H-bond或盐桥>3 μs形成时，100 ns模拟会遗漏静电贡献，导致结合自由能系统性高估3-5 kcal/mol。范德华相互作用时间尺度短，在短模拟中相对完整。

全局约束对采样的影响

研究者对比了有无全局RMSD约束的结果：

约束加速收敛：100-300 ns内快速趋于平台期，无约束需3-10 μs
但导致系统性偏差：1.0-1.8 kcal/mol，改变结合位点动态平衡

关键发现：蛋白质主链全局重排具有微秒量级时间常数，采样不足不仅来自配体，更来自蛋白质背景下的配体适应过程。柔性蛋白质系统需充足无约束采样才能准确估计结合亲和力。

关键发现总结与机制

采样不足的三重表现

能量平台的虚假性：100 ns时看似稳定实则被困在局部最小值
构象空间的不完整探索：配体在100 ns内仅探索完整相空间20-50%
相互作用的时间依赖性：关键相互作用（氢键、盐桥等）在后期才频繁出现

蛋白质与配体的多步骤适应机制

基于以上结果，研究者提出了一个多阶段的结合和适应过程：

graph LR
    A["阶段I<br/>(0-100 ns)<br/>快速初始吸附"] --> B["阶段II<br/>(100 ns-1 μs)<br/>侧链二级定位"]
    B --> C["阶段III<br/>(1-10 μs)<br/>稀有构象采样"]
    C --> D["热力学平衡"]

    A -->|静电相互作用驱动<br/>结合位点初级调整| A
    B -->|旋转异构体转变<br/>隐溶剂重新组织| B
    C -->|多个亚稳态<br/>相对稳定性建立| C

    style A fill:#e1f5ff
    style B fill:#fff9c4
    style C fill:#ffe0b2
    style D fill:#c8e6c9

📄 相关附录：

关键结论与批判性总结

主要贡献

范式转变：将MM/PBSA从黑盒方法转变为需要明确采样策略的方法论
定量化的采样需求：提供明确微秒级采样建议，而非模糊的足够长
增强采样的客观评估：首次系统展示IaMD和OPES的优局限，设定现实期望
关键相互作用的时间演化：详细的氢键、盐桥和水桥分析揭示结合过程复杂性

本研究的局限性、实践意义评估和深层反思请见附录。

对分子模拟社区的呼吁

这项研究的一个隐含但重要的信息是：科学诚实比计算便利更重要

如果一个研究因为计算资源限制无法进行足够长的MD，应该明确说明这一点，而非让读者误以为“足够采样”
审稿人在评审含有MM/PBSA结果的论文时，应该养成习惯：不仅看最终的数字，还要看累积平均曲线、多条轨迹的一致性、关键相互作用的时间演化

未来方向

基于本研究，几个有价值的后续研究方向包括：

力场与采样时间的系统关联：在多个常用力场（AMBER、CHARMM、OPLS）上重复类似研究，建立针对不同力场的采样时间建议表
显溶剂MD与隐溶剂MM/PBSA的对应关系：用全原子显溶剂MD与隐溶剂MM/PBSA的结果对比，量化两者的偏差与采样时间的关系
基于机器学习的收敛性预测：利用早期轨迹的RMSD、能量波动、PCA信息，用ML模型预测后期的收敛行为，从而优化采样策略
高通量虚拟筛选中的采样优化：在数百个化合物的筛选中，如何在精度与效率间找到最优平衡点

Q&A

Q1: 我一定要跑10微秒MD吗？太耗时了

A1: 取决于目标。排序任务可用短采样；定量预测（1-2 kcal/mol精度）建议3×3-5 μs。先用100 ns筛选，对候选进行完整采样也可行。

Q2: 我的能量曲线已100% 平坦，这不是收敛吗？

A2: 不一定。平坦曲线只代表局部收敛。验证方法：(1) 多条独立轨迹是否一致；(2) PCA覆盖率接近100%？；(3) 关键相互作用占有度还在变化吗？

Q3: IaMD vs OPES，我应该用哪个？

A3: 黄金标准是3×1-10 μs常规MD。平衡方案是IaMD初期加速+cMD精细化。快速筛选用100 ns cMD+IaMD但标记为初步值。OPES成本高，不推荐。

Q4: 不同蛋白质采样需求差异大吗？

A4: 是的。柔性蛋白（激酶等）需微秒采样；刚性蛋白可1-3 μs。配体灵活性也重要。启发式规则：蛋白>400 aa或配体>6旋转键，预期需微秒采样。

Q5: 我应该改变MM/PBSA工作流程吗？

A5: 应该。改进包括：(1) 报告多条轨迹+离散度；(2) 明确采样长度；(3) 绘制累积平均图；(4) 高精度预测用3-5 μs；(5) 方法部分说明收敛验证。

小编锐评：

结论很有警示意义，采样是永恒的问题，你难以知道什么时候能采够。所以和实验对不上的时候，请多跑跑吧。

虽然图画得略丑，但逻辑还算可以的，从各种角度说这个问题，虽然我没看所有的图，但可以仔细品品。

AI太辣鸡了，半天写不到一块去，太浪费时间了。仔细看一篇文章能写1000多行Markdown。以后还是精简点，直击要害，把握关键结论和逻辑，切忌陷入细节。

Mendelevium

Contact

短短10微秒就够了？MM/PBSA结合自由能计算的采样陷阱

本文信息

摘要

核心结论

背景

关键科学问题

创新点

研究内容

研究对象与方法设计

核心发现：虚假收敛的揭示

发现1：100纳秒并非真正的收敛点

发现2：蛋白质和配体的构象适应是长期过程

发现3：关键相互作用的动态出现与消失

发现4：PCA空间的不完整探索

增强采样方法的评估

IaMD与OPES的比较分析

能量分量的系列差异

全局约束对采样的影响

关键发现总结与机制

采样不足的三重表现

蛋白质与配体的多步骤适应机制

关键结论与批判性总结

主要贡献

对分子模拟社区的呼吁

未来方向

Q&A