PETase反应机理研究附录:技术细节与补充数据
本附录提供主文档的技术细节补充,包括QM/MM模拟的具体参数、伞形采样实现细节、反应路径的完整分析数据,以及与实验数据的详细对比。
一、计算方法与技术细节
1.1 初始结构建模流程
晶体结构准备:
- 起始结构:PDB ID 5XH3(分辨率1.30 Å),包含R103G/S131A双突变体与HEMT配体的复合物
- 突变还原:使用PyMOL的诱变工具将Arg103Gly和Ser131Ala还原为野生型残基
- 底物替换:将HEMT配体替换为PET二聚体底物
质子化状态确定:
- 使用PROPKA 3.0预测pKa值,参考生理pH 7.0
- His75(预测pKa 3.29)和His208(预测pKa 5.29)均在δ-氮上质子化
- 质子化状态的最终确定通过目视检查每个残基的环境和与相邻残基/溶剂分子形成的最可能氢键网络
系统平衡与结构选择:
- 50 ns经典MD模拟平衡系统,期间监测催化残基间的距离
- 根据活性位点残基的RMSD对MD轨迹进行聚类
- 从最高占据簇中选取代表性结构作为QM/MM模拟的起点
催化三联体的形成:
- Ser131-His208之间的氢键在代表性结构中距离为2.12 Å(Hγ-Nε)
- His208-Asp177之间的氢键距离为1.94 Å(Hδ-Oδ)
- 这些氢键在经典MD模拟中自然形成并保持稳定,无需人为约束
- 选择的代表性结构中,催化三联体已经处于反应就绪构象
1.2 几何优化流程
PETase:底物复合物的几何优化分五个连续步骤进行:
- 优化水分子、抗衡离子和氢,其余系统用50 kcal·mol⁻¹·Å⁻²谐振势固定
- 优化PET二聚体底物,其余系统用50 kcal·mol⁻¹·Å⁻²位置约束
- 优化(还原的)Arg103和Ser131残基,其余系统用50 kcal·mol⁻¹·Å⁻²约束
- 放松蛋白质侧链,其余系统用50 kcal·mol⁻¹·Å⁻²约束
- 完全优化,不施加任何约束
1.3 QM/MM分区与边界处理
QM区域组成(146个原子):
- 完整的Ser131
- Met132的侧链和部分骨架
- Tyr58的骨架和部分侧链
- Gly57和Ala180的部分骨架
- PET二聚体底物
- Trp156、Asp177、Ser178、Ile179、His208的侧链
边界处理方法:
- 使用Link Atom方法处理QM/MM边界
- Link atoms为氢原子,用于饱和QM区域的悬挂键
- 长程库仑作用通过GEEP方法(静电势的高斯展开)处理
QM区域的电荷和自旋:
- 总电荷:−2(主要来自Asp177的羧基)
- 自旋多重度:单重态(所有电子配对)
注意事项:
- Link atoms应放在非极性C-C键上,避免放在极化的C-N或C-O键上
- QM区域应包含反应中电子密度显著变化的所有原子
- 本研究的QM区域(146原子)比早期研究(约70原子)更大,提供了更高精度
1.4 伞形采样实现细节
反应坐标的定义:
- 酰化反应:$\mathrm{RC}{\mathrm{acyl}} = d{\mathrm{break}} - d_{\mathrm{nuc}}$
- $d_{\mathrm{nuc}}$:Ser131-Oγ到底物羰基碳C4¹的距离(亲核攻击)
- $d_{\mathrm{break}}$:底物酯键C4¹-O$_{\mathrm{oxi}}$的距离(键断裂)
- 去酰化反应:$\mathrm{RC}{\mathrm{deacyl}} = d{\mathrm{break2}} - d_{\mathrm{water}}$
- $d_{\mathrm{water}}$:水分子O$_{\mathrm{wat}}$到C4¹的距离
- $d_{\mathrm{break2}}$:酰基-Ser131键Oγ-C4¹的距离
Steered MD参数:
- 谐振势力常数:50 kcal·mol⁻¹·Å⁻²
- 目标增长速率:0.002 Å·fs⁻¹
- 模拟时间:酰化和去酰化各3 ps
- Steered MD轨迹用于生成伞形采样初始结构,窗口线性间隔0.1 Å
伞形采样参数:
- 窗口数量:酰化47个窗口,去酰化44个窗口
- 窗口间隔:0.1 Å
- 谐振势力常数:50或100 kcal·mol⁻¹·Å⁻²以确保窗口充分重叠
- 每窗口模拟时间:15 ps(NVT系综,300 K,CSVR控温器)
- 时间步长:1 fs
- 总采样时间:约1.4 ns(0.7 ns酰化 + 0.7 ns去酰化)
软件实现:
- 伞形采样直接在CP2K软件包中实现,无需额外的增强采样插件
- CP2K内置了COLVAR(集体变量)模块和约束动力学功能
- 与GROMACS+PLUMED方案不同,CP2K的QM/MM伞形采样将DFT计算与偏置势完全集成,避免了软件接口问题
1.5 WHAM自由能分析
WHAM分析参数:
- Bootstrap数据集:100个
- 收敛阈值:0.0001
- 组数(bins):窗口数的两倍
- 温度:300 K
误差估计:
- 统计误差通过bootstrap方法估计为0.02-0.07 kcal·mol⁻¹
- PBE/AMBER方法的系统误差约为3 kcal·mol⁻¹
- 能量报告精度:1位小数(kcal·mol⁻¹)
- 距离报告精度:2位小数(Å)
二、技术问答
Q1:反应坐标的选择理由
问题:为什么选择$d_{\mathrm{break}} - d_{\mathrm{nuc}}$形式的反应坐标而不是直接约束质子转移?
回答:
选择这种反应坐标有以下方法学优势:
- 机理无偏性:
- 这种坐标可以同时评估反应的同步性和四面体中间体的形成
- 不预先假定质子转移的顺序或是否形成稳定中间体
- 类似的表示方法已在其他水解酶研究中使用
- 化学直觉:
- 酯水解的慢步骤通常是重原子骨架的重排(C-O键的形成/断裂)
- 质子转移通常是快事件,可以在重原子重排的大框架下自发发生
- 如果约束质子转移,可能人为扭曲真实的反应路径
- 计算效率:
- 单一的一维反应坐标减少了伞形采样的窗口数量
- 如果同时约束多个距离,需要更复杂的二维或三维伞形采样
- 与实验一致:
- 计算得到的活化能(20.0 kcal·mol⁻¹)与实验值(18.0-18.6 kcal·mol⁻¹)吻合
- 这验证了反应坐标选择的合理性
Q2:质子转移的协同性
问题:在Umbrella Sampling中,只对反应坐标(CV)施加偏置力吗?其他质子转移是如何发生的?
回答:
是的,只对定义的反应坐标施加偏置力。
质子转移是协同自发发生的:
- 反应坐标不直接约束Ser131→His208或His208→离去基团的质子转移
- 这些质子转移作为协同事件自发发生,因为:
- 当Ser131的Oγ接近底物羰基碳时,其酸性增加
- His208的Nε自然成为质子受体
- 当底物酯键断裂时,离去基团的氧(O$_{\mathrm{oxi}}$)变得负电,自动从His208夺取质子
从数据可见协同性(SI表S2):
- 在反应物R状态:Ser131 Oγ-Hγ = 1.02 Å,Hγ-His208 Nε = 1.76 Å
- 在TS1附近:Ser131 Oγ-Hγ = 2.15 Å(质子已离开),Hγ-His208 Nε = 1.26 Å(质子已转移)
- 这种质子转移先于亲核攻击完成,但整个过程是协同且异步的
Q3:His208-Asp177相互作用
问题:远端His208与Asp177之间的质子转移是自发的吗?还是也需要被约束?
回答:
His208-Asp177之间的相互作用在整个反应过程中保持稳定,这个位置的质子转移是部分自发的。
氢键动态变化(SI表S2和S3):
- 酰化R状态:His208 NHδ-Asp177 Oδ = 1.62 ± 0.15 Å(强氢键)
- 酰化TS1:His208 NHδ-Asp177 Oδ = 1.39 ± 0.24 Å(更短,说明Asp177在稳定质子化His208)
- 酰化INT1:His208 NHδ-Asp177 Oδ = 1.63 ± 0.15 Å(恢复)
Asp177的催化作用:
- Asp177不直接参与质子转移反应
- 但它通过盐桥/氢键稳定质子化的His208(带正电)
- 在TS1时,His208 Nε接受Ser131的质子后变为正电,Asp177的负电荷稳定这种电荷分离
- 这种稳定作用不需要显式约束,是静电相互作用的自然结果
关键结论:
- 反应坐标只约束重原子间的距离(C-O键的形成和断裂)
- 所有质子转移事件都是协同自发发生的
- 这种方法的优势是不预设机理,让系统自然探索反应路径
- Asp177的作用是静电稳定,而非直接参与化学转化
Q4:泛函选择
问题:为什么选择PBE泛函而不是其他DFT方法(如杂化泛函M06-2X)?
回答:
- PBE是广义梯度近似(GGA)泛函,计算成本相对较低,适合大规模QM/MM动力学模拟
- 对于酶催化反应,PBE已被证明能够提供与实验一致的能垒预测
- 本研究的QM区域包含146个原子,若使用杂化泛函(如M06-2X或B3LYP),伞形采样的计算成本将难以承受
- 计算结果(20.0 kcal·mol⁻¹)与实验值(18.0-18.6 kcal·mol⁻¹)的良好一致性验证了PBE方法的可靠性
- PBE方法的预期系统误差约为3 kcal·mol⁻¹,在可接受范围内
三、反应路径的完整分析
3.1 酰化反应的拐点分析
酰化反应自由能曲线的梯度分析揭示了反应路径上的关键拐点(SI图S7)。除了主要的R、TS1和INT1状态外,还识别出五个拐点(IP1-IP5):
- IP1(RC = -0.7 Å):Ser131开始显著去质子化的点
- IP2(RC = -0.2 Å):接近TS1,质子转移基本完成
- IP3(RC = +0.7 Å):TS1后,酯键开始快速断裂
- IP4(RC = +1.9 Å):酯键基本断裂,MHET开始获得质子
- IP5(RC = +2.4 Å):接近INT1,MHET完全质子化
关键距离变化(SI表S2):
- Ser131 OHγ-His208 Nε距离在IP2时达到最小(1.16 ± 0.14 Å),随后在TS1拉伸
- O$_{\mathrm{oxi}}$-Ser131 OHγ距离在IP2到TS1急剧减小,证实质子向离去基团的转移
- 氧阴离子孔氢键角度在IP1到TS1区间变得最线性
3.2 去酰化反应的拐点分析
去酰化反应的梯度分析(SI图S8)识别出四个拐点:
- IP1(RC = -0.9 Å):水分子开始去质子化
- IP2(RC = +0.1 Å):TS2后,水质子几乎完全转移到His208
- IP3(RC = +0.5 Å):Ser131-底物键开始快速断裂
- IP4(RC = +1.3 Å):Ser131开始从His208获得质子
关键距离变化(SI表S3):
- 水的H${\mathrm{wat}}$-O${\mathrm{wat}}$键在TS2处显著伸长(1.46 ± 0.46 Å),证实去质子化
- Ser131 Oγ-C4¹键在IP3到IP4区间快速增加,对应酰基-酶键断裂
- H$_{\mathrm{wat}}$-Ser131 Oγ距离在IP3到P持续减小,对应Ser131再质子化
3.3 体系稳定性
50 ns经典MD模拟用于平衡PETase:PET二聚体复合物:
- 蛋白质骨架的RMSD在整个模拟过程中保持稳定,平均RMSD为0.75 ± 0.07 Å
- 活性位点残基的RMSD更低(0.56 ± 0.04 Å),表明活性位点结构紧凑且稳定
- 伞形采样窗口的密度分布(SI图S4和S5)显示了良好的重叠,确保WHAM分析的可靠性
四、底物结合与相互作用
4.1 底物结合模式
Han等人解析了R103G/S131A双突变体与1-(2-羟乙基)4-甲基对苯二甲酸酯(HEMT)和对硝基苯酚(pNP)的复合物结构。在前者中,配体结合在一个沟槽中,包括Tyr58、Trp130、Ala131、Met132、Trp156、Ile179和His208。Trp156在底物结合中发挥关键作用,通过π-π堆积相互作用稳定底物,而其他残基与HEMT提供不稳定的疏水相互作用。Tyr58和Met132的骨架NH基团与HEMT酯的羰基形成氢键,类似于氧阴离子孔排列。
4.2 结合子位点
Joo等人用2-羟乙基-(单羟乙基对苯二甲酸酯)₄,2HE-(MHET)₄(由四个MHET单元组成)进行了对接计算,识别出约40 Å的结合裂隙,分为两个结合子位点I和II:
- 子位点I:通过Trp156与MHET第一个苯基之间的π-π相互作用实现底物结合,Met132和Ile179通过在子位点底部提供疏水表面帮助结合
- 子位点II:更表面,通过疏水相互作用容纳MHET的其余部分
4.3 结合残基分析
目视检查PETase与PET二聚体的相互作用显示,残基Thr59、Ala60、Trp130、Trp156、Ile179、Ser207和Ser209似乎有助于聚合物与酶的结合(SI图S6)。这些相互作用主要是范德华类型,芳香部分之间的相互作用和其他疏水接触在大部分MD模拟中保持。
五、突变设计的详细分析
5.1 电荷流动分析方法
速率限制步骤(酰化)的电荷分布分析基于以下原理:
- 从R到TS1,Ser131从中性变为负离子(O⁻),His208从中性变为阳离子(NH⁺)
- O4¹从部分负电荷变为更负的氧阴离子
- 这种电荷分离和重新分布是TS1不稳定性的主要来源
5.2 带电残基的定量评估
研究识别了活性位点10 Å内的所有带电残基,并计算了它们的电荷中心到两个关键位点的距离:
- 正电荷中心(His208 Hε)
- 负电荷中心(O4¹)
对每个残基,计算了到两个中心的距离差$\Delta d = d(\mathrm{O4}^1) - d(\mathrm{His208})$:
- 对于负电荷残基:$\Delta d < 0$(更靠近O4¹)会增加势垒,$\Delta d > 0$会降低势垒
- 对于正电荷残基:$\Delta d > 0$(更靠近O4¹)会降低势垒,$\Delta d < 0$会增加势垒
5.3 三个关键Asp残基的详细分析
Asp83:
- 距离:O4¹ 18.0 Å,His208 Hε 14.0 Å,$\Delta d = +4.0$ Å
- 位置:β2-β3连接环
- 特点:远离底物结合口袋,突变不太可能影响底物识别
- 建议突变:D83N(保持氢键能力但消除负电荷)或D83K(引入正电荷进一步稳定TS1)
Asp89:
- 距离:O4¹ 14.5 Å,His208 Hε 14.0 Å,$\Delta d = +0.5$ Å
- 位置:β3表面
- 特点:与Asp83相邻,可能协同影响局部静电环境
- 建议突变:D89N或D89Q
Asp157:
- 距离:O4¹ 11.0 Å,His208 Hε 11.0 Å,$\Delta d = 0$ Å
- 位置:β7-α4环
- 特点:距离活性位点最近的三个之一,但仍在柔性区域
- 建议突变:D157N(保守突变)或D157S(更小的极性残基)
5.4 突变的潜在协同效应
单独突变每个残基预计降低势垒约1-2 kcal·mol⁻¹,但同时突变多个可能产生协同效应:
- D83N/D89N双突变:消除β2-β3区域的两个负电荷,可能降低势垒2-4 kcal·mol⁻¹
- D83N/D89N/D157N三突变:全面优化活性位点周围的静电环境,理论上可降低势垒4-6 kcal·mol⁻¹,将$k_{\mathrm{cat}}$提高10³-10⁴倍
六、实验数据对比
6.1 动力学参数
Yoshida等人报告的PETase对BHET的动力学参数:
- $K_{\mathrm{M}}$ = 0.4 mM
- $k_{\mathrm{cat}}$ = 0.08 s⁻¹(30°C)
- $k_{\mathrm{cat}}/K_{\mathrm{M}}$ = 200 M⁻¹s⁻¹
从$k_{\mathrm{cat}}$通过过渡态理论估算的自由能势垒:
\[\Delta G^{\ddagger} = -RT \ln\frac{k_{\mathrm{cat}} h}{k_{\mathrm{B}} T}\]在303 K时: \(\Delta G^{\ddagger} = -0.603 \times 303 \ln\frac{0.08 \times 6.626 \times 10^{-34}}{1.381 \times 10^{-23} \times 303} = 18.6 \text{ kcal} \cdot \mathrm{mol}^{-1}\)
Chen等人报告的PETase对高结晶PET的活化能为18.0 kcal·mol⁻¹,与本研究的20.0 kcal·mol⁻¹非常接近,差异在PBE方法的预期误差范围内。
6.2 突变实验数据
Han等人的定点诱变实验:
- S131A:活性几乎完全丧失(<1%野生型)
- H208A:活性显著降低(<5%野生型)
- D177A:活性中等降低(约20%野生型)
这些结果证实了Ser131-His208-Asp177催化三联体的身份,与本研究的机理一致。本研究建议的Asp83/Asp89/Asp157突变位点尚未有实验报道,需要未来的实验验证。
七、补充说明
本附录提供的技术细节和补充数据旨在帮助读者深入理解PETase催化机理研究的计算方法学和结果分析。完整的Supporting Information(包括所有表格和图表)可在原文出版商网站获取:https://pubs.acs.org/doi/10.1021/acscatal.1c03700