PETase反应机理研究附录：技术细节与补充数据

本附录提供主文档的技术细节补充，包括QM/MM模拟的具体参数、伞形采样实现细节、反应路径的完整分析数据，以及与实验数据的详细对比。

一、计算方法与技术细节

1.1 初始结构建模流程

晶体结构准备：

起始结构：PDB ID 5XH3（分辨率1.30 Å），包含R103G/S131A双突变体与HEMT配体的复合物
突变还原：使用PyMOL的诱变工具将Arg103Gly和Ser131Ala还原为野生型残基
底物替换：将HEMT配体替换为PET二聚体底物

质子化状态确定：

使用PROPKA 3.0预测pKa值，参考生理pH 7.0
His75（预测pKa 3.29）和His208（预测pKa 5.29）均在δ-氮上质子化
质子化状态的最终确定通过目视检查每个残基的环境和与相邻残基/溶剂分子形成的最可能氢键网络

系统平衡与结构选择：

50 ns经典MD模拟平衡系统，期间监测催化残基间的距离
根据活性位点残基的RMSD对MD轨迹进行聚类
从最高占据簇中选取代表性结构作为QM/MM模拟的起点

催化三联体的形成：

Ser131-His208之间的氢键在代表性结构中距离为2.12 Å（Hγ-Nε）
His208-Asp177之间的氢键距离为1.94 Å（Hδ-Oδ）
这些氢键在经典MD模拟中自然形成并保持稳定，无需人为约束
选择的代表性结构中，催化三联体已经处于反应就绪构象

1.2 几何优化流程

PETase:底物复合物的几何优化分五个连续步骤进行：

优化水分子、抗衡离子和氢，其余系统用50 kcal·mol⁻¹·Å⁻²谐振势固定
优化PET二聚体底物，其余系统用50 kcal·mol⁻¹·Å⁻²位置约束
优化（还原的）Arg103和Ser131残基，其余系统用50 kcal·mol⁻¹·Å⁻²约束
放松蛋白质侧链，其余系统用50 kcal·mol⁻¹·Å⁻²约束
完全优化，不施加任何约束

1.3 QM/MM分区与边界处理

QM区域组成（146个原子）：

完整的Ser131
Met132的侧链和部分骨架
Tyr58的骨架和部分侧链
Gly57和Ala180的部分骨架
PET二聚体底物
Trp156、Asp177、Ser178、Ile179、His208的侧链

边界处理方法：

使用Link Atom方法处理QM/MM边界
Link atoms为氢原子，用于饱和QM区域的悬挂键
长程库仑作用通过GEEP方法（静电势的高斯展开）处理

QM区域的电荷和自旋：

总电荷：−2（主要来自Asp177的羧基）
自旋多重度：单重态（所有电子配对）

注意事项：

Link atoms应放在非极性C-C键上，避免放在极化的C-N或C-O键上
QM区域应包含反应中电子密度显著变化的所有原子
本研究的QM区域（146原子）比早期研究（约70原子）更大，提供了更高精度

1.4 伞形采样实现细节

反应坐标的定义：

酰化反应：$\mathrm{RC}{\mathrm{acyl}} = d{\mathrm{break}} - d_{\mathrm{nuc}}$
- $d_{\mathrm{nuc}}$：Ser131-Oγ到底物羰基碳C4¹的距离（亲核攻击）
- $d_{\mathrm{break}}$：底物酯键C4¹-O$_{\mathrm{oxi}}$的距离（键断裂）
去酰化反应：$\mathrm{RC}{\mathrm{deacyl}} = d{\mathrm{break2}} - d_{\mathrm{water}}$
- $d_{\mathrm{water}}$：水分子O$_{\mathrm{wat}}$到C4¹的距离
- $d_{\mathrm{break2}}$：酰基-Ser131键Oγ-C4¹的距离

Steered MD参数：

谐振势力常数：50 kcal·mol⁻¹·Å⁻²
目标增长速率：0.002 Å·fs⁻¹
模拟时间：酰化和去酰化各3 ps
Steered MD轨迹用于生成伞形采样初始结构，窗口线性间隔0.1 Å

伞形采样参数：

窗口数量：酰化47个窗口，去酰化44个窗口
窗口间隔：0.1 Å
谐振势力常数：50或100 kcal·mol⁻¹·Å⁻²以确保窗口充分重叠
每窗口模拟时间：15 ps（NVT系综，300 K，CSVR控温器）
时间步长：1 fs
总采样时间：约1.4 ns（0.7 ns酰化 + 0.7 ns去酰化）

软件实现：

伞形采样直接在CP2K软件包中实现，无需额外的增强采样插件
CP2K内置了COLVAR（集体变量）模块和约束动力学功能
与GROMACS+PLUMED方案不同，CP2K的QM/MM伞形采样将DFT计算与偏置势完全集成，避免了软件接口问题

1.5 WHAM自由能分析

WHAM分析参数：

Bootstrap数据集：100个
收敛阈值：0.0001
组数（bins）：窗口数的两倍
温度：300 K

误差估计：

统计误差通过bootstrap方法估计为0.02-0.07 kcal·mol⁻¹
PBE/AMBER方法的系统误差约为3 kcal·mol⁻¹
能量报告精度：1位小数（kcal·mol⁻¹）
距离报告精度：2位小数（Å）

二、技术问答

Q1：反应坐标的选择理由

问题：为什么选择$d_{\mathrm{break}} - d_{\mathrm{nuc}}$形式的反应坐标而不是直接约束质子转移？

回答：

选择这种反应坐标有以下方法学优势：

机理无偏性：
- 这种坐标可以同时评估反应的同步性和四面体中间体的形成
- 不预先假定质子转移的顺序或是否形成稳定中间体
- 类似的表示方法已在其他水解酶研究中使用
化学直觉：
- 酯水解的慢步骤通常是重原子骨架的重排（C-O键的形成/断裂）
- 质子转移通常是快事件，可以在重原子重排的大框架下自发发生
- 如果约束质子转移，可能人为扭曲真实的反应路径
计算效率：
- 单一的一维反应坐标减少了伞形采样的窗口数量
- 如果同时约束多个距离，需要更复杂的二维或三维伞形采样
与实验一致：
- 计算得到的活化能（20.0 kcal·mol⁻¹）与实验值（18.0-18.6 kcal·mol⁻¹）吻合
- 这验证了反应坐标选择的合理性

Q2：质子转移的协同性

问题：在Umbrella Sampling中，只对反应坐标（CV）施加偏置力吗？其他质子转移是如何发生的？

回答：

是的，只对定义的反应坐标施加偏置力。

质子转移是协同自发发生的：

反应坐标不直接约束Ser131→His208或His208→离去基团的质子转移
这些质子转移作为协同事件自发发生，因为：
1. 当Ser131的Oγ接近底物羰基碳时，其酸性增加
2. His208的Nε自然成为质子受体
3. 当底物酯键断裂时，离去基团的氧（O$_{\mathrm{oxi}}$）变得负电，自动从His208夺取质子

从数据可见协同性（SI表S2）：

在反应物R状态：Ser131 Oγ-Hγ = 1.02 Å，Hγ-His208 Nε = 1.76 Å
在TS1附近：Ser131 Oγ-Hγ = 2.15 Å（质子已离开），Hγ-His208 Nε = 1.26 Å（质子已转移）
这种质子转移先于亲核攻击完成，但整个过程是协同且异步的

Q3：His208-Asp177相互作用

问题：远端His208与Asp177之间的质子转移是自发的吗？还是也需要被约束？

回答：

His208-Asp177之间的相互作用在整个反应过程中保持稳定，这个位置的质子转移是部分自发的。

氢键动态变化（SI表S2和S3）：

酰化R状态：His208 NHδ-Asp177 Oδ = 1.62 ± 0.15 Å（强氢键）
酰化TS1：His208 NHδ-Asp177 Oδ = 1.39 ± 0.24 Å（更短，说明Asp177在稳定质子化His208）
酰化INT1：His208 NHδ-Asp177 Oδ = 1.63 ± 0.15 Å（恢复）

Asp177的催化作用：

Asp177不直接参与质子转移反应
但它通过盐桥/氢键稳定质子化的His208（带正电）
在TS1时，His208 Nε接受Ser131的质子后变为正电，Asp177的负电荷稳定这种电荷分离
这种稳定作用不需要显式约束，是静电相互作用的自然结果

关键结论：

反应坐标只约束重原子间的距离（C-O键的形成和断裂）
所有质子转移事件都是协同自发发生的
这种方法的优势是不预设机理，让系统自然探索反应路径
Asp177的作用是静电稳定，而非直接参与化学转化

Q4：泛函选择

问题：为什么选择PBE泛函而不是其他DFT方法（如杂化泛函M06-2X）？

回答：

PBE是广义梯度近似（GGA）泛函，计算成本相对较低，适合大规模QM/MM动力学模拟
对于酶催化反应，PBE已被证明能够提供与实验一致的能垒预测
本研究的QM区域包含146个原子，若使用杂化泛函（如M06-2X或B3LYP），伞形采样的计算成本将难以承受
计算结果（20.0 kcal·mol⁻¹）与实验值（18.0-18.6 kcal·mol⁻¹）的良好一致性验证了PBE方法的可靠性
PBE方法的预期系统误差约为3 kcal·mol⁻¹，在可接受范围内

三、反应路径的完整分析

3.1 酰化反应的拐点分析

酰化反应自由能曲线的梯度分析揭示了反应路径上的关键拐点（SI图S7）。除了主要的R、TS1和INT1状态外，还识别出五个拐点（IP1-IP5）：

IP1（RC = -0.7 Å）：Ser131开始显著去质子化的点
IP2（RC = -0.2 Å）：接近TS1，质子转移基本完成
IP3（RC = +0.7 Å）：TS1后，酯键开始快速断裂
IP4（RC = +1.9 Å）：酯键基本断裂，MHET开始获得质子
IP5（RC = +2.4 Å）：接近INT1，MHET完全质子化

关键距离变化（SI表S2）：

Ser131 OHγ-His208 Nε距离在IP2时达到最小（1.16 ± 0.14 Å），随后在TS1拉伸
O$_{\mathrm{oxi}}$-Ser131 OHγ距离在IP2到TS1急剧减小，证实质子向离去基团的转移
氧阴离子孔氢键角度在IP1到TS1区间变得最线性

3.2 去酰化反应的拐点分析

去酰化反应的梯度分析（SI图S8）识别出四个拐点：

IP1（RC = -0.9 Å）：水分子开始去质子化
IP2（RC = +0.1 Å）：TS2后，水质子几乎完全转移到His208
IP3（RC = +0.5 Å）：Ser131-底物键开始快速断裂
IP4（RC = +1.3 Å）：Ser131开始从His208获得质子

关键距离变化（SI表S3）：

水的H${\mathrm{wat}}$-O${\mathrm{wat}}$键在TS2处显著伸长（1.46 ± 0.46 Å），证实去质子化
Ser131 Oγ-C4¹键在IP3到IP4区间快速增加，对应酰基-酶键断裂
H$_{\mathrm{wat}}$-Ser131 Oγ距离在IP3到P持续减小，对应Ser131再质子化

3.3 体系稳定性

50 ns经典MD模拟用于平衡PETase:PET二聚体复合物：

蛋白质骨架的RMSD在整个模拟过程中保持稳定，平均RMSD为0.75 ± 0.07 Å
活性位点残基的RMSD更低（0.56 ± 0.04 Å），表明活性位点结构紧凑且稳定
伞形采样窗口的密度分布（SI图S4和S5）显示了良好的重叠，确保WHAM分析的可靠性

四、底物结合与相互作用

4.1 底物结合模式

Han等人解析了R103G/S131A双突变体与1-（2-羟乙基）4-甲基对苯二甲酸酯（HEMT）和对硝基苯酚（pNP）的复合物结构。在前者中，配体结合在一个沟槽中，包括Tyr58、Trp130、Ala131、Met132、Trp156、Ile179和His208。Trp156在底物结合中发挥关键作用，通过π-π堆积相互作用稳定底物，而其他残基与HEMT提供不稳定的疏水相互作用。Tyr58和Met132的骨架NH基团与HEMT酯的羰基形成氢键，类似于氧阴离子孔排列。

4.2 结合子位点

Joo等人用2-羟乙基-（单羟乙基对苯二甲酸酯）₄，2HE-(MHET)₄（由四个MHET单元组成）进行了对接计算，识别出约40 Å的结合裂隙，分为两个结合子位点I和II：

子位点I：通过Trp156与MHET第一个苯基之间的π-π相互作用实现底物结合，Met132和Ile179通过在子位点底部提供疏水表面帮助结合
子位点II：更表面，通过疏水相互作用容纳MHET的其余部分

4.3 结合残基分析

目视检查PETase与PET二聚体的相互作用显示，残基Thr59、Ala60、Trp130、Trp156、Ile179、Ser207和Ser209似乎有助于聚合物与酶的结合（SI图S6）。这些相互作用主要是范德华类型，芳香部分之间的相互作用和其他疏水接触在大部分MD模拟中保持。

五、突变设计的详细分析

5.1 电荷流动分析方法

速率限制步骤（酰化）的电荷分布分析基于以下原理：

从R到TS1，Ser131从中性变为负离子（O⁻），His208从中性变为阳离子（NH⁺）
O4¹从部分负电荷变为更负的氧阴离子
这种电荷分离和重新分布是TS1不稳定性的主要来源

5.2 带电残基的定量评估

研究识别了活性位点10 Å内的所有带电残基，并计算了它们的电荷中心到两个关键位点的距离：

正电荷中心（His208 Hε）
负电荷中心（O4¹）

对每个残基，计算了到两个中心的距离差$\Delta d = d(\mathrm{O4}^1) - d(\mathrm{His208})$：

对于负电荷残基：$\Delta d < 0$（更靠近O4¹）会增加势垒，$\Delta d > 0$会降低势垒
对于正电荷残基：$\Delta d > 0$（更靠近O4¹）会降低势垒，$\Delta d < 0$会增加势垒

5.3 三个关键Asp残基的详细分析

Asp83：

距离：O4¹ 18.0 Å，His208 Hε 14.0 Å，$\Delta d = +4.0$ Å
位置：β2-β3连接环
特点：远离底物结合口袋，突变不太可能影响底物识别
建议突变：D83N（保持氢键能力但消除负电荷）或D83K（引入正电荷进一步稳定TS1）

Asp89：

距离：O4¹ 14.5 Å，His208 Hε 14.0 Å，$\Delta d = +0.5$ Å
位置：β3表面
特点：与Asp83相邻，可能协同影响局部静电环境
建议突变：D89N或D89Q

Asp157：

距离：O4¹ 11.0 Å，His208 Hε 11.0 Å，$\Delta d = 0$ Å
位置：β7-α4环
特点：距离活性位点最近的三个之一，但仍在柔性区域
建议突变：D157N（保守突变）或D157S（更小的极性残基）

5.4 突变的潜在协同效应

单独突变每个残基预计降低势垒约1-2 kcal·mol⁻¹，但同时突变多个可能产生协同效应：

D83N/D89N双突变：消除β2-β3区域的两个负电荷，可能降低势垒2-4 kcal·mol⁻¹
D83N/D89N/D157N三突变：全面优化活性位点周围的静电环境，理论上可降低势垒4-6 kcal·mol⁻¹，将$k_{\mathrm{cat}}$提高10³-10⁴倍

六、实验数据对比

6.1 动力学参数

Yoshida等人报告的PETase对BHET的动力学参数：

$K_{\mathrm{M}}$ = 0.4 mM
$k_{\mathrm{cat}}$ = 0.08 s⁻¹（30°C）
$k_{\mathrm{cat}}/K_{\mathrm{M}}$ = 200 M⁻¹s⁻¹

从$k_{\mathrm{cat}}$通过过渡态理论估算的自由能势垒：

\[\Delta G^{\ddagger} = -RT \ln\frac{k_{\mathrm{cat}} h}{k_{\mathrm{B}} T}\]

在303 K时： $\Delta G^{\ddagger} = -0.603 \times 303 \ln\frac{0.08 \times 6.626 \times 10^{-34}}{1.381 \times 10^{-23} \times 303} = 18.6 \text{ kcal} \cdot \mathrm{mol}^{-1}$

Chen等人报告的PETase对高结晶PET的活化能为18.0 kcal·mol⁻¹，与本研究的20.0 kcal·mol⁻¹非常接近，差异在PBE方法的预期误差范围内。

6.2 突变实验数据

Han等人的定点诱变实验：

S131A：活性几乎完全丧失（<1%野生型）
H208A：活性显著降低（<5%野生型）
D177A：活性中等降低（约20%野生型）

这些结果证实了Ser131-His208-Asp177催化三联体的身份，与本研究的机理一致。本研究建议的Asp83/Asp89/Asp157突变位点尚未有实验报道，需要未来的实验验证。

七、补充说明

本附录提供的技术细节和补充数据旨在帮助读者深入理解PETase催化机理研究的计算方法学和结果分析。完整的Supporting Information（包括所有表格和图表）可在原文出版商网站获取：https://pubs.acs.org/doi/10.1021/acscatal.1c03700

Mendelevium

Contact