酶工程新时代的基石：物理建模如何突破定向进化的天花板

本文信息

标题：酶工程新时代中的物理建模
作者：Christopher Jurich, Qianzhen Shao, Xinchun Ran, Zhongyue J. Yang
发表时间：2025年4月24日在线发表（Nature Computational Science）
单位：范德堡大学（Vanderbilt University）
引用格式：Jurich, C., Shao, Q., Ran, X. & Yang, Z. J. Physics-based modeling in the new era of enzyme engineering. Nat. Comput. Sci. 5, 279–291 (2025). https://doi.org/10.1038/s43588-025-00788-8

摘要

酶工程正在进入一个以计算策略整合为特征的新时代。虽然生物信息学和人工智能方法已被广泛用于加速功能增强型突变体的筛选，但基于物理的建模方法（如分子力学和量子力学）在许多目标中是必不可少的补充。在本文中，我们强调了基于物理的建模如何通过探索当前进展、未解决的挑战以及工具开发的新兴机遇，帮助计算酶工程领域充分发挥其潜力。

核心结论

定向进化存在固有局限：依赖高通量筛选的定向进化难以处理蛋白酶（自水解）、光酶（利用光进行催化的酶，需要恒定光照设备）、植物源/哺乳动物酶（异源表达困难）等体系，也容易陷入进化死胡同。
基于物理的建模填补关键空白：量子力学（QM）、分子力学（MM）和QM/MM方法可以在原子分辨率上计算任意有三维结构的酶体系的实验相关性质，不受酶来源或操作条件限制。
设计原理的提炼与自动化：通过分析酶的结构、静电、动力学和热容等特征，可以归纳出定量的设计原理，并借助高通量工作流（如EnzyHTP、SubTuner）自动筛选突变体。
物理建模与机器学习形成共生关系：物理建模为ML提供有化学意义的描述符（如电场、结合能、底物定位指数），ML则帮助降维、生成过渡态几何构型、加速动力学模拟。
亟需高质量的基准数据集：与结构预测领域的 CASP 类似，酶工程领域需要盲测式的功能预测竞赛和标准化数据库，以公正评估计算方法。

背景

酶工程的工业化需求与定向进化的辉煌

酶工程的目标是让酶为合成、治疗和可持续性服务。工业界对工程化酶的需求强劲，预计未来十年复合年增长率在5%至6%之间。一个理想的未来是：计算协议能够以定量精度定位功能性野生型酶及其工程化变体，从而以最少的筛选工作实现生物催化开发，同时降低经济和环境成本。

历史上，定向进化一直主导着该领域。通过迭代诱变和高通量筛选，定向进化已成功创造出无数用于化学合成、环境污染物降解或升级回收以及治疗的酶。然而，定向进化依赖高通量实验筛选，这使其在多个场景下难以应用：

副反应不可忽略时：例如蛋白酶会自我水解，难以构建筛选体系。
需要专门设备时：例如光酶（利用光进行催化的酶）需要恒定光照且无污染的特殊装置。
工程目标不匹配时：例如微型化（在保持高活性的同时减小酶的大小）无法通过高通量删除或截短可靠实现；工业生物合成中高低温度适应性的改造，由于生物条件与工业条件（温度、pH等）的普遍不匹配，也难以用高通量筛选解决。
表达系统受限时：植物源和哺乳动物酶在大肠杆菌中表达困难或具有免疫原性，无法用于常规高通量筛选。

更令人警醒的是，定向进化常把催化过程当成黑箱，容易陷入进化死胡同——一旦被困，即使再筛选$10^9$个变体也无法改善效率。Blazeck等人报道的一个人源免疫治疗酶（犬尿氨酸酶）就遇到了这种情况，借助对酶结构和催化机制的理解，找到了另一条改进路径——即通过改变策略（如改变优化目标、设计不同的突变组合）绕过了之前无法突破的限制。

fig1

图1：基于物理的计算方法作为实现酶工程全部潜力的途径

中间列（传统酶工程）：在提高细菌、非膜结合酶的催化效率方面表现出色
顶部（传统方法的局限）：定向进化依赖高通量筛选，难以处理蛋白酶（自水解）、光酶（需要恒定光照）、植物源/哺乳动物酶（异源表达困难）等体系，容易陷入进化死胡同
右列（基于物理的计算酶工程）：更通用的方法，能够避免传统方法的常见陷阱，并扩展到更广泛的酶性质和系统

计算方法的崛起与物理建模的不可替代性

计算方法为酶工程提供了突破这些局限的路径。尽管生物信息学和人工智能（AI）被越来越广泛地应用，但由于酶序列-结构-功能关系数据的数量和质量普遍不足，基于物理的分子建模技术仍然不可或缺。

QM和MM方法在理论上可以应用于任意具有原子分辨率三维结构的体系，无论酶来源于细菌、植物还是哺乳动物，无论其偏好何种操作条件（高温、低温、极端pH）。

通过物理建模，从头酶设计已经展示了第一性原理方法创造催化新自然反应的人工酶的能力。虽然这些人工骨架通常还需要用定向进化进一步优化（从而再次打开进化死胡同的大门），但从头设计活动证明了虚拟的、基于物理的设计能够提供理性设计独有的骨架，这是计算酶工程的一个概念性里程碑。

综述内容

The role of physics-based modeling in enzyme catalysis

fig2

图2：基于物理的原理的生命周期。

左上：通过观察天然和工程化酶中具有所需功能特征（如高效率或冷适应）的来源，推导出基于物理的原理。示例包括工程化Kemp eliminase（KE，灰色，PDB ID 8usi）、冷适性腺苷酸激酶（蓝色，PDB ID 1p3j）和天然高效人红细胞过氧化氢酶（灰色，PDB ID 1dgf）
右上：通过物理建模（QM、MD、QM/MM）识别、量化和理解物理现象。MD模拟全酶-溶剂复合物（PDB ID 3nir），QM模拟简化活性位点簇（紫色QM区域，黑色球体为冻结边界原子），QM/MM对酶不同区域应用多层级理论
右下：将设计原理编码为产生明确、定量功能预测的通用理性设计规则
左下：应用设计规则对有益突变（红色球体）排序，推荐实现特定功能目标（如通过过渡态稳定化或基态去稳定化提高效率）

设计原理一：结构与拓扑

结构启发的酶工程最为直观——当活性位点与底物形状互补时，催化效率更高。例如：

保守的鸟嘌呤结合位点广泛驱动核酶的选择性。
儿茶酚-O-甲基转移酶中的一个残基通过定位S-腺苷甲硫氨酸辅因子来达到理想的供体-受体距离。
细菌芳胺脱羧酶的活性位点残基通过调节疏水口袋的大小来适应不同底物。

拓扑工程侧重于选择突变以促进底物结合，或改善隧道可及性以加速反应物/产物的扩散。通过突变连接活性位点与酶表面的隧道中的残基，可以调节底物和水到达活性位点的能力。这一原理已在实验中广泛验证，并用于隧道的从头设计。

此外，改变表面带电残基的数量可以调节酶的pH最适性。大多数酶在中性pH附近进化，而耐受非生物常见pH条件为在碱性或酸性环境中更快进行的反应打开了大门。改变pH最适性是一个尚未充分利用的工程策略。

结构信息工程的一个关键挑战是：仅仅稳定基态相互作用是不够的——酶还必须确保协调的相互作用将底物定位在能够生成产物的反应性构象上。AlphaFold3可以预测底物-酶复合物，但稳定基态相互作用并不等同于稳定过渡态。

设计原理二：静电（电场）

静电是酶催化的核心机制之一。Linus Pauling提出酶通过稳定过渡态实现催化，Ariel Warshel进一步证明，酶的预组织静电效应是催化的主要贡献来源。

预组织静电效应：活性位点在反应前就已经排布成有利于过渡态的电场构型。

实验验证与电场计算

Boxer课题组利用振动斯塔克位移光谱（vibrational Stark effect spectroscopy）直接在活酶中测量活性位点电场强度，发现在酮类固醇异构酶（KSI）中活性位点电场高达$15~\mathrm{MV/cm}$，远强于溶剂环境。更关键的是，电场强度与催化速率之间存在定量关系：电场越强，过渡态稳定化越显著，催化效率越高。电场可以用库仑定律近似计算——基于固定电荷MM、可极化MM或QM方法得到的原子电荷，将酶环境产生的电场$\mathbf{F}{\mathrm{env}}$投影到反应键的偶极矩$\mathbf{u}{\mathrm{bond}}$上，得到电场稳定化能：

\[E_{\mathrm{ES}} = -\mathbf{F}_{\mathrm{env}}\cdot \mathbf{u}_{\mathrm{bond}} \quad (1) \\ E_{\mathrm{ES}} = \int \rho (\mathbf{r})V_{\mathrm{env}}(\mathbf{r})\mathrm{d}^3 \mathbf{r} \quad (2)\]

其中$\rho$是电子密度，$V_{\mathrm{env}}$是静电势。这一原理已在KSI、Kemp eliminase、P450、二氢叶酸还原酶等多种体系中得到广泛验证。

从理解到设计

Head-Gordon课题组将静电理解转化为可操作的设计原理。在Kemp eliminase中，他们发现单个突变就可以有效地微调投影到催化键上的电场大小，从而系统性地设计出高效Kemp eliminase——这是首次通过电场工程实现酶活性的人工提升。对枯草芽孢杆菌酯酶Bs2的改造则展示了另一条路径：引入天冬氨酸残基稳定过渡态偶极矩，将水解酶转化为酰胺酶。

这些案例共同说明：电场是一个可以直接用于指导突变设计的工程量。SubTuner正是基于这一原理，将电场优化作为三个设计假设之一：通过活性位点电场稳定过渡态的偶极矩。

挑战：底物取向与远程效应

其一，底物取向的微小改变会迅速抵消预期的静电增益——如果突变改变了底物在活性位点的定位方式，即使电场强度增加了，实际催化效果也可能下降。
其二，远程突变对电场的影响难以预测：远端残基的电场贡献需要通过MD轨迹分析来评估，而这类分析的计算成本不低。基于侧链互信息的残基耦合分析提供了一种识别不太可能扰动底物动力学的电场介导残基的方法。

设计原理三：蛋白质动力学

静态结构只能告诉我们酶在某个瞬间的样子，而真实的酶时时刻刻都在振动和摆动——这些运动是催化机制的一部分。蛋白质动力学启发的酶工程，正是要利用这些动态信息来指导突变设计。

构象集合观：从单一快照到概率分布

传统观点把酶活性位点看成固定的钥匙-锁关系。但实际上，酶在不断于不同构象之间切换，每个构象有不同的能量和比例（概率分布）。Yabukarski等利用X射线衍生的构象集合（从多个晶体结构或低温晶体学数据中提取），直接量化了活性位点的定位分布；Du等则用构象集合揭示了丝氨酸蛋白酶催化的真正起源——其催化三联体（Asp-His-Ser）的空间排布在构象集合中高度偏置在有利于催化的区域。这说明酶活性不仅取决于最优构象长什么样，还取决于整个构象集合的统计分布。

Hur和Bruice进一步指出，底物进入活性位点后，必须先采用一种特定的构象——各化学键的方向和距离都恰好有利于反应发生——才算是准备好了。在分支酸变位酶中，NAC概率越高，催化速率越快，二者直接相关；这一原理已被成功用于工程化Kemp eliminase和荧光素酶。

对Kemp eliminase的进一步分析引入了底物定位指数（substrate positioning index，SPI）：衡量底物可及面积与活性位点溶剂可及面积之比，反映活性位点的松紧程度。SPI与自由能垒呈火山型分段线性相关——活性位点太松（SPI过高）或太紧（SPI过低）都会降低活性，存在一个“刚刚好”的最优点，而非越高越好。

近攻击构象（NAC）：各化学键的方向和距离都恰好有利于反应发生的底物构象。酶的催化作用之一，就是通过活性位点的空间约束，把底物稳定在这种构象上，降低它达到NAC的能垒。

动力学网络：突变是怎么从远端传递到活性位点的？

MD模拟可以揭示残基之间的相关运动——当一个残基移动时，哪些残基会跟着动？这些信息可以用来构建动力学网络（network of correlated motion）。Osuna课题组的最短路径图工具是这个方向的重要成果：它把蛋白质看成一张图（节点=残基，边=运动相关性强弱），然后用图论算法找出连接两个位置之间的“最短路径”。这条路径上的残基，就是最有可能把远端突变的影响传递到活性位点的桥梁。换句话说，如果你想在远离活性位点的位置做突变来影响催化，最短路径图可以告诉你应该选哪几个残基。

一个典型案例是祖先荧光素酶AncHLD-RLuc的工程化：MD分析发现，环区的柔性变化可以通过动力学网络传递到活性位点，改善配体结合和催化活性。这说明远程突变未必是碰运气，而是有物理规律可循的。

飞秒级蛋白运动与化学活化网络

飞秒级蛋白运动也是近年关注的热点。酶中最快的振动发生在飞秒（$10^{-15}$秒）尺度，恰好与化学键形成/断裂的过渡态时间尺度重叠——那么，这些超快运动是否真的能推动反应？答案是：有可能，但目前证据仍不充分。

Frost等人用过渡路径分析（transition-path analysis，TPA）分析人源嘌呤核苷磷酸化酶（PNP）时发现，一个远端残基的振动相位恰好与活性位点的化学转化同步——也就是说，这个远端残基在飞秒尺度上的一推一拉和化学键断裂/形成的时间精确吻合，表明动力学效应可能在催化中扮演着直接角色。
QM/MM准经典轨迹模拟则揭示了另一个现象：在SpnF催化的Diels-Alder反应中，反应体系穿越过渡态之后，并不只有一条路可以走——它会在多个产物通道之间选择。QM/MM准经典轨迹模拟显示，这种反应后分叉（post-TS bifurcation）的选择受活性位点疏水残基的动能贡献影响，最终决定了产物选择性，而非仅由过渡态能垒决定。

这些现象共同构成了化学活化网络（chemical activation network）的概念框架：酶不只是提供一个稳定的静电环境，而是通过多层次（从飞秒振动到皮秒构象变化）的动态协调，主动引导反应走向。理解这张网络，将为工程化生物催化剂开辟全新的设计维度。

设计原理四：热容与温度适应性

酶的最适温度看似只是活性-稳定性平衡的结果，但实际上背后还有更深的物理机制——热容（heat capacity）。

非阿伦尼乌斯行为与热容机制

经典阿伦尼乌斯行为认为，温度越高，反应速率越快，直到蛋白质热变性。但嗜冷酶（如嗜冷α-淀粉酶AHA）、古代重建的腺苷酸激酶等表现出非阿伦尼乌斯行为——它们在某个温度达到活性顶峰，高于或低于此温度活性都会下降。
这说明温度依赖性不只是热稳定性问题，还和活化热容 $\Delta C_p^\ddagger$（过渡态与基态之间的热容差）直接相关。换句话说，热容才是决定最适温度的关键变量，而非蛋白质稳定性本身。
Åqvist课题组进一步揭示了AHA低温最适温度的物理根源：在较高温度下，酶-底物复合物会意外地采用一种无活性的构象——底物虽然结合在活性位点，但构象不具有反应性，正是这种假结合拉低了整体活性。

陷阱构象：底物虽然结合在活性位点，但构象不具有反应性，无法进行催化反应。AHA活性下降的真正原因是陷阱构象的增多，而非蛋白质变性。

从热容到冷适应工程

从热力学角度看，负的活化热容意味着过渡态比基态更有序。AHA的策略是平衡活化焓$\Delta H^\ddagger$和活化熵$\Delta S^\ddagger$：维持较低的活化焓（降低反应能垒），但同时接受更负的活化熵（反应过程中损失更多构象自由度）。

在低温下，$T\Delta S^\ddagger$项的贡献较小，低活化焓主导，整体活化自由能$\Delta G^\ddagger = \Delta H^\ddagger - T\Delta S^\ddagger$仍然较低，因此反应能够高效进行。这恰好对应了嗜冷酶的整体特征：在低温下，高柔性反而帮助底物顺利结合和转化。

基于热容的框架，可以从分子动力学模拟直接计算酶效率。van der Ent等人进一步证明，通过计算预测 $\Delta C_p^\ddagger$，可以主动设计酶反应的最适温度——找到那些能平移其温度曲线的突变。

对多结构域工业酶（催化结构域+碳水化合物结合模块CBM），单结构域经验不直接适用。最新研究表明，可以通过引入连接子增加结构域分离指数（一个由MD推导的描述符，精确量化结构域之间的分离程度）来实现冷适应——延长连接子使结构域分离，增加活性位点柔性，从而在低温下保持活性。这是一条绕过单结构域经验局限的可行路径，已在纤维素酶中得到验证。

高通量计算工作流：从CADEE到SubTuner

为了将设计原理自动化、规模化地应用于突变筛选，研究者开发了多个高通量工作流。

fig3

图3：高通量工作流在酶工程中的作用。核心信息是：工作流的覆盖面还不够。

a子图：传统计算酶工程工作流的通用模式。以野生型酶-底物复合物为起点（酶显示为蓝色，底物为粉色），构建突变体库。每个突变体（红色点）部署到独立结构上，对每个突变体和野生型（WT）进行构象采样（通常用MD），计算物理描述符（RMSD、EF、$\Delta G_{\text{bind}}$、SPI等），对每个构象计算并求平均，最后根据构象平均描述符与野生型的比较对突变体排序
b子图：现有工作流主要集中在通过突变优化速率效率，但其他功能目标（如智能库构建、嵌合酶融合、新自然反应工程、基因组酶发现）仍有待开发

图3的左侧工作流之所以能走通，关键在于每一步都锚定在物理可观测量上：RMSD反映结构变化幅度，电场度量对过渡态的静电稳定化，$\Delta G_{\text{bind}}$描述底物结合能，SPI反映活性位点松紧度。这些描述符从原子模拟里直接算出，是物理量而非经验打分，理论上可以在不同酶体系之间迁移。

但现实是，大多数工作流目前只覆盖速率优化这一类目标。右侧列出的几类任务——智能库构建（如何选最有信息量的突变组合）、嵌合酶融合（如何拼接不同酶的结构域）、新自然反应工程（如何从头设计催化新反应的活性位点）、基因组酶发现（如何在大规模序列中快速筛选）——每一个都要求工作流能回答的问题不只是哪个突变更稳定，而是哪个设计策略真正改变化学路径。

CADEE（2017）

CADEE（计算机辅助定向进化）是第一个专门为基于活化能（通过经验价键理论EVB自由能微扰和伞形采样计算）排序和推荐突变体而设计的平台。它突破性地实现了自动化，但其性能对EVB力场的参数化质量敏感，缺乏实验数据时需要专家输入，且主要支持EVB方法。

EnzyHTP（2022）

EnzyHTP是一个通用的高通量酶建模平台，完全使用Python编写，自动化了酶工程的每一步：准备、诱变、几何采样和事后分析。它支持任意分子建模任务，包括MD、QM、配体对接、轨迹分析等。EnzyHTP更像一个模块化面包板，其他工作流可以构建在其之上。

SubTuner（2025）

基于EnzyHTP构建的SubTuner，是一个专门用于工程化酶催化非天然底物的计算工具。它基于三个假设：有益突变必须（1）热稳定，（2）能够结合限速过渡态，（3）通过活性位点电场优化稳定过渡态的偶极矩。在数百个突变体和多种底物上评估，SubTuner在命中率、功能增强速度和有益多突变设计的多样性方面优于现有AI模型。

SubTuner的真正价值不只是三条规则本身，而是将热稳定性、过渡态结合和电场优化三个物理条件压缩成一个可执行工作流。工作流终于开始显式回答为什么这个突变可能有用。但SubTuner也指出了当前工作流的Pareto优化困境：在计算成本与突变体排序精度、智能库构建方案、功能评分之间取得平衡，这些问题仍然没有解决。更精确、更全面往往意味着更贵、更慢；更快则可能牺牲命中率和多突变设计的多样性。这是今天高通量物理建模最现实的瓶颈之一。

EnzyHTP、SubTuner都是本文作者的工作

物理建模与机器学习的共生关系

fig4

图4：物理建模与ML建模的共生关系。

左侧（物理建模）：MD模拟、电子结构理论和其他分子建模技术（PDB ID 3nir）产生描述符，如Rosetta能量项、结合能和电场稳定化能
中间（特征与架构）：物理描述符可直接作为ML模型输入。物理建模也启发了编码结构信息的ML架构，例如主链结构编码（灰色线）或创建输入层直接对应酶残基的结构感知架构
右侧（ML建模）：ML帮助从高维数据中提取催化相关特征，例如识别反应性几何构型、聚合动力学数据（$x_0 \rightarrow x_1 \rightarrow \dots \rightarrow x_n$, $\psi^2$, $P(x)$）

图4把物理建模和机器学习之间的关系从谁替代谁改写成了双向供给。物理模型产出的电场、结合能、Rosetta能量项和过渡态信息可以直接变成ML的输入特征；ML又能帮助压缩高维模拟结果、生成过渡态几何、甚至近似QM/MM势能面。本文的立场是：未来强模型更可能来自物理约束和数据驱动的耦合，而非单纯的端到端替代。

物理建模赋能ML

结构特征提升ML性能：将MD衍生的构象描述符（如$\text{RMSF}$、主成分）纳入模型，改善了对牛肠激酶突变效应的预测。EnzyKR使用活性位点-反应物相互作用编码结构特征，成功预测了水解酶动力学拆分中的优势对映体。
QM衍生描述符：对接得分、QM衍生电荷等使得分类器能够准确预测细菌腈水解酶的底物混杂性。
结构感知图神经网络：将Rosetta能量项和序列同一性整合到结构感知蛋白图卷积网络中，改善了对蛋白酶特异性的预测。

然而，获取与实验表征的活性和选择性数据相链接的高质量酶-底物复合物结构是一个实际挑战。酶突变和不同底物的组合爆炸使得单纯依赖AI方法不切实际。大规模数据集如ProteinGym提供适应性值，但物理化学相关性有限。集成序列-结构-功能数据库（如IntEnzyDB）正在出现，但规模仍远远落后于社区需求。

ProteinGym更适合做蛋白fitness预测，而非直接支持酶工程里的物理建模。原因有两层：第一，它缺少底物、反应机制和酶—底物复合物结构这些关键信息；第二，不同实验条件下测得的fitness值反映的是不同物理性质，不同assay反映的物理量并不完全可比。所以ProteinGym对ML很有价值，但想训练真正理解催化机制的模型，数据还是不够物理。

IntEnzyDB则试图把序列、结构、动力学和功能放进同一张表，目标是让研究者能在同一平台上查到酶的动力学参数、复合物结构和功能注释。对酶工程来说，真正缺的不是更多活不活的标签，而是这些活性背后的物理机制——在什么底物、什么条件、什么构象下，活性由什么机制驱动。

ML赋能物理建模

过渡态几何生成：等变扩散模型可以从反应物和产物的结构出发，生成高精度的气相过渡态几何结构。将其扩展到考虑活性位点和溶剂分子的相互作用是一个活跃方向。
ML势函数加速模拟：AI2BMD框架使用基于蛋白片段QM计算训练的ML势，实现了媲美纯QM精度的动力学模拟，成本大幅降低。
从高维MD中提取催化意义：在酮醇酸还原异构酶（KARI）中，ML模型分析了底物转化事件，从大量候选的键长、键角和二面角中自动识别出与反应性强烈相关的几何参数。将此技术推广到更多体系，有望提炼出关于配体几何如何影响反应性的普适理解。

讨论

为什么物理建模是关键？

尽管定向进化和高通量筛选的能力令人印象深刻，但这只是一个中间步骤。最终目标是开发能够解决任何工程目标、应用于任何酶系统的方法。基于物理的建模凭借其独特能力——从第一性原理直接预测实验可观测量、阐明分子机制、识别关键分子描述符作为设计原理——在推动下一代酶工程方法中扮演着不可或缺的角色。

当前挑战

计算成本：MD和QM/MM可能需要数天时间。硬件上，量子计算可能成为下一代电子结构模拟的引擎，但真正的量子优势尚未实现。算法上，AI加速的高精度能量计算和采样（如ML势函数、生成式自由能映射）展现出巨大潜力。
缺乏标准化基准：与传统计算化学有成熟的基准集（如热化学预测）不同，计算酶工程面临一个不断变化的目标。一些模型系统（如Kemp eliminase）已成为事实上的基准，但从单一酶得出结论存在偏差。
软件工程的可持续性：许多软件包在开发活跃期过后即停止维护——本意是做通用工具，结果却沦为只能处理最初那几个特定案例的系统（无专业化）。社区缺乏软件工程指南。欧洲生物信息学基础设施ELIXIR及其FAIR原则（可查找、可访问、可互操作、可重用）是参考模板。Loschmidt Lab公开了15个软件工具和3个数据库，是个榜样。

这三条里，基准测试缺失可能是最根本的问题。本文专门提到2023年的Protein Engineering Tournament，把它视为一个重要起点：不同团队对同一批酶活性做预测，最后统一公开结果。酶工程现在最缺的是可重复、可横向比较、可定期更新的盲测体系，而非单篇案例。没有这种共同试卷，方法论文就很容易陷入各自挑数据、各自挑指标、各自宣称更强的循环。

大数据不等于好基准：真正需要的是既有规模、又保留微观物理特征的数据集——比如活性位点几何、电场、结合模式和反应障碍之间能互相对上的数据。没有结构化数据库很难做可靠benchmark，没有可维护的软件就很难持续更新数据库和benchmark——这是整个社区基础设施的问题，而非单纯的数据问题。

所以本文提出的Critical Assessment of Enzyme Functional Prediction，本质上是想给酶工程造一个类似CASP的共同战场。它不只是为了排榜单，更是为了逼着社区统一任务定义、数据格式、评价指标和失败案例的报告方式。对这个领域来说，这一步甚至可能和某个新模型本身一样重要。

未被充分探索的物理现象

质子耦合电子转移（PCET）：是无数高效酶反应的基础，但如何预测有益突变仍理解有限。
氢隧穿：大豆脂氧合酶中远端蛋白运动如何激活氢隧穿已被研究，但设计原理尚未提炼。
飞秒级蛋白运动：可能影响在相当时间尺度上发生的过渡态轨迹。
反应后分叉：决定产物选择性的关键因素，在SpnF催化的Diels-Alder反应中已展示。
短暂的手性中间体：在手性和非手性产物都产生的酶中，这些短暂中间体可能蕴含着关于选择性和活性的新设计规则。

这一节点出现有工作流的盲区，像PCET、氢隧穿和飞秒级蛋白运动，都牵涉到非常快的电子—核耦合过程，很难被简单的打分函数或静态结构特征吸收。反应后分叉关心的是过渡态之后轨迹会滑向哪个产物通道，而非单一过渡态够不够低。很多今天常用的工作流擅长回答这个突变会不会更稳定、更会结合，却还不擅长回答这个突变会不会改变真正的化学路径。

AlphaFold与结构建模的作用

AlphaFold2和AlphaFold3的出现深刻改变了酶工程的研究范式。Du等利用AlphaFold2生成的构象集合揭示了丝氨酸蛋白酶催化的起源，这表明AI预测的结构可以服务于物理机制研究。

然而，Brown等指出，AlphaFold预测可作为构象Boltzmann分布的近似估计，但存在一定偏差：预测的构象分布可能过于集中或遗漏某些重要构象。因此，AlphaFold最适合作为物理建模的起点，而非终点。其损失函数并不编码化学合理性，训练目标是让预测结构靠近实验晶体结构——这意味着它学到的是哪个构象在晶体里最常见，而不是哪个构象在催化意义上最重要。

对于酶工程来说，后者才是关键。如果活性位点附近的某个关键构象在晶体数据里出现频率很低，AlphaFold很可能完全忽略它——即便这个构象恰好是过渡态前后最关键的窗口。真正的设计验证仍需通过MD或QM/MM模拟来检验，这些方法才显式包含了力场和能量面。

从头酶设计的新突破

基于物理的从头设计已经创造出能够催化新自然反应的人工酶，这是计算酶工程的里程碑。然而，这些人工骨架通常活性较低，需要后续的定向进化来优化。

概念验证成立，但离终局还远。人工设计的酶骨架能在无天然酶引导的情况下实现全新反应，这一点已经打破了必须依赖自然界已有模板的思维定式。但骨架的初始活性通常只有天然酶的几百分之一甚至更低，需要大量突变筛选才能接近工业可用水平。这个gap不只是筛选效率的问题，而是反映了我们对如何从第一性原理直接构造高活性位点的理解仍然不完整。

Burns等的BioFragment Database提供了一个新思路：通过QM计算建立标准化的相互作用能数据库，使物理描述符可以作为ML模型的特征，从而加速设计过程。BioFragment Database这类资源之所以重要，正是因为它们试图把从结构到活性这个映射变得更系统化——用QM计算出的标准化相互作用能来教模型什么样的残基排布才真正有利于过渡态稳定，而不是靠直觉。

本文主要贡献

提供了基于物理的建模在酶工程中的全景式路线图：从设计原理（结构、静电、动力学、热容）到高通量工作流（CADEE、EnzyHTP、SubTuner），再到与ML的共生关系，涵盖了领域的现状、痛点和未来方向。
明确指出了定向进化的局限性：物理建模是互补技术，尤其在处理难搞系统和避免进化死胡同时，并非要否定定向进化。
首次系统总结了SubTuner等新一代工作流的设计哲学：基于热稳定性、过渡态结合和电场优化的三原则，展示了物理建模在非天然底物工程中的强大能力。
提出了建立酶功能预测盲测竞赛的倡议：模仿CASP，这将极大推动计算方法的客观评估和迭代改进。
强调了软件工程可持续性的重要性：呼吁社区建立代码开发的最佳实践和长期维护机制。

局限性

物理建模的计算成本仍然是主要瓶颈：虽然ML加速有希望，但尚未达到广泛可用的程度。
基准数据集严重缺乏：现有数据库（如ProteinGym）缺乏底物、反应机制、酶-底物复合物结构等关键信息，无法公平评估基于物理的工具。
许多设计原理尚未在高通量工作流中实现：例如PCET、飞秒动力学、反应后分叉等，仍停留在学术研究层面。
软件可持续性问题普遍存在：大部分工具由博士生/博士后开发，他们毕业后维护往往停止，导致社区碎片化。

未来方向

建立Critical Assessment of Enzyme Functional Prediction：定期、盲测、多目标的酶功能预测竞赛，将极大推动领域标准化。
开发集成物理描述符的大规模数据库：类似BioFragment Database（QM衍生相互作用能）的模式，为ML提供有化学意义的特征。
将生成模型（如ProteinMPNN）与催化相关物理特征（电场、动力学）条件化：直接设计具有初始活性的酶，而非仅稳定骨架。
探索量子计算在酶模拟中的应用：虽然量子优势尚未确定，但早期应用已展示在蛋白结构预测中的潜力。
将ML加速的QM/MM和过渡态生成推向常规应用：使高精度势能面计算不再是专家特权。

定向进化只是中间步骤，物理建模才是解锁酶工程全部潜力的关键。对于那些希望跳出黑箱筛选、真正理解并设计酶的科研人员，本文提供了从第一性原理出发的系统框架。而对于计算化学家，本文则清晰地指出了软件工程、基准数据集和未探索物理现象这三个最值得投入的方向。

Mendelevium

Contact