解密皮肤渗透的“潜规则”：表面活性剂尾链结构如何调控其与皮肤脂质屏障的相互作用本文信息标题: 表面活性剂疏水链结构对表面活性剂-皮肤脂质模型相互作用的影响作者: Yao Chen, Mingrui Liao, Kun Ma, Zi Wang, Bruno Demé, Jeff Penfold, Jian R Lu, John R. P. Webster, Peixun Li 发表时间: 2021年9月22日单位: 卢瑟福·阿普尔顿实验室ISIS中子源 (英国)，曼彻斯特大学 (英国)，中国石油大学 (中国)，劳厄·朗之万研究所 (法国) 引用格式: Chen, Y., Liao, M., Ma, K., Wang, Z., Demé, B., Penfold, J., Lu, J. R., Webster, J. R. P., & Li, P. (2022). Implications of surfactant hydrophobic chain architecture on the Surfactant-Skin lipid model interaction. Journal of Colloid and Interface Science, 608, 405–415. https://doi.org/10.1016/j.jcis.2021.09.098 摘要尽管表面活性剂已广泛应用于皮肤护理及相关领域，但我们对其如何与角质层（SC）脂质相互作用的认知仍然有限。本研究通过中子衍射和分子动力学（MD）模拟，报道了表面活性剂与SC脂质模型的相互作用，重点考察了表面活性剂分子结构的影响。研究构建了由等摩尔的神经酰胺/胆固醇/脂肪酸与1 mol%的表面活性剂混合而成的模型膜。通过中子散射衬度变化法，获得了膜中水分子和表面活性剂分子的中子散射长度密度（NSLD）分布图；同时，MD模拟清晰地揭示了模型膜水合作用变化的内在机制。研究发现，加入表面活性剂后，膜的短周期相（SPP）重复距离未发生剧烈变化，但显著增强了膜的水合作用，并减少了相分离的结晶胆固醇的数量，且这些效应强烈依赖于表面活性剂的链长、支链和双键。这项工作清晰地展示了表面活性剂的结构如何影响其与SC膜的相互作用，为筛选现有或设计新型的、用于透皮应用的表面活性剂提供了有用的指导。背景皮肤作为人体最大的器官，正成为透皮给药系统（Transdermal Drug Delivery）的重要靶标。相比于传统的口服或注射，透皮给药具有无创、可自主用药、能长时间持续释放等优点。然而，其最大的挑战在于皮肤角质层（Stratum Corneum, SC）的强大屏障功能，它像一道坚固的“城墙”，阻止了绝大多数外来分子的入侵，从而严格限制了可用于透皮给药的药物种类。角质层呈“砖墙-砂浆”结构，其中“砖块”是充满角蛋白的死细胞，“砂浆”则是由神经酰胺（CER）、胆固醇（CHOL）和游离脂肪酸（FFA）等脂质构成的连续、高度有序的层状结构。这个脂质基质是限制物质渗透的决定性因素。因此，通过改变脂质层的堆积方式来增强皮肤渗透性，是开发透皮给药系统的核心策略。表面活性剂，因其独特的两亲性和自组装能力，被广泛用作药物载体和渗透促进剂。然而，表面活性剂是一把“双刃剑”，在增强渗透的同时也可能引起皮肤刺激。为了实现“增效减毒”，我们必须在分子层面深入理解表面活性剂与SC脂质的相互作用机制。SC脂质的层状结构极为复杂，主要包括重复距离约6 nm的短周期相（SPP）和约13 nm的长周期相（LPP）。尽管已有大量研究利用X射线衍射、中子衍射和MD模拟等手段探索了SC脂质的结构，但一个关键问题仍未得到系统解答：表面活性剂分子结构的细微变化，例如疏水尾链的长度、是否存在支链或不饱和键，究竟会如何影响其与SC脂质的相互作用，并最终改变皮肤屏障的功能？回答这个问题，将为理性设计更高效、更安全的皮肤护理产品和透皮递送系统提供关键的理论指导。关键科学问题本研究旨在回答的核心科学问题是：表面活性剂疏水尾链的精细结构差异（链长、支链、不饱和键）究竟如何影响其与模拟皮肤角质层脂质膜的相互作用？具体而言，研究通过对比四种具有相同阳离子头基但不同C16-C18疏水尾链的表面活性剂，聚焦于以下几个子问题：这些表面活性剂的引入，将如何改变SC脂质膜的整体纳米结构（如层状重复距离）？它们如何影响对屏障功能至关重要的膜水合程度？它们如何影响SC脂质关键组分，特别是胆固醇，在膜中的分布和相行为？这些宏观结构和性质变化的背后，其微观分子机制是什么？创新点系统性研究：首次系统地比较了四种具有相同阳离子头基但不同疏水尾链结构（链长、支链、不饱和键）的表面活性剂对模拟皮肤脂质膜的影响，揭示了尾链结构与膜相互作用之间的构效关系。先进技术联用：结合了中子衍射（特别是同位素衬度变化法）和全原子分子动力学模拟，从实验和理论两个层面，以前所未有的分辨率揭示了水分子和表面活性剂在脂质膜中的精确定位和作用机制。揭示了新的作用机制：发现表面活性剂不仅是简单地“扰乱”脂质膜，还能通过促进相分离的结晶胆固醇重新整合到脂质层状结构中，并显著增加膜的水合程度来发挥作用，且这两种效应都强烈依赖于其尾链结构。 graph TD A["低浓度表面活性剂分子 (1mol%)"] --> B["作用一：增强水合"] A --> C["作用二：重排胆固醇"] B --> D["膜边界区域的 水含量和流动性增加"] C --> E["相分离的结晶胆固醇 重新整合入SPP层状结构"] D --> F["综合效应： 皮肤屏障渗透性改变"] E --> F classDef surfactant fill:#e1f5fe classDef mechanism fill:#f3e5f5 classDef effect fill:#e8f5e8 classDef result fill:#fff3e0 class A surfactant class B,C mechanism class D,E effect class F result 研究内容核心理论与实验方法实验体系模拟SC脂质膜：采用等摩尔比的神经酰胺 ($\ce{CER NS (C24)}$)、胆固醇 (CHOL) 和游离脂肪酸 (FFA，$\ce{C22}$和$\ce{C24}$酸等摩尔混合) 构建，该体系能形成与真实皮肤SC结构相似的短周期相 (SPP)。表面活性剂：选用四种阳离子表面活性剂，它们拥有完全相同的亲水头基，但疏水尾链结构各异： $\ce{C16HAB}$：十六烷基双(2-羟乙基)甲基溴化铵（16碳，饱和直链） $\ce{C18HAB}$：十八烷基双(2-羟乙基)甲基溴化铵（18碳，饱和直链） $\ce{OHAB}$：油烯基双(2-羟乙基)甲基溴化铵（18碳，含一个顺式双键） $\ce{IHAB}$：异硬脂基双(2-羟乙基)甲基溴化铵（18碳，含支链）图1：神经酰胺、胆固醇、脂肪酸和表面活性剂的化学结构。实验技术解读：中子衍射与SLD剖面分析（写给模拟工作者）本研究的核心实验技术是中子衍射，对于熟悉MD但不了解散射实验的读者，以下是关键概念的解释：衍射图的横坐标 q：q被称为散射矢量，是倒易空间（reciprocal space）中的坐标，单位是 Å⁻¹。它与实验中的散射角 $\theta$ 和中子波长 $\lambda$ 相关，关系为 $ q = \frac{4\pi \sin\theta}{\lambda} $。可以将其理解为结构在空间中的“频率”。根据布拉格定律，当样品中存在周期性结构（如此处的脂质层状堆积）时，会在特定的 $q_h$ 值处出现尖锐的衍射峰。这些峰的位置与真实空间中的重复距离 d 成反比：$ d = \frac{2\pi h}{q_h} $，其中h是衍射级数。因此，通过测量衍射峰的位置，就能精确计算出脂质双层的厚度。 SLD剖面图的纵坐标 $\rho(x)$：$\rho(x)$是中子散射长度密度（Neutron Scattering Length Density, SLD）。可以将其类比为X射线衍射中的电子密度。每个原子核都有一个固有的、描述其与中子相互作用强弱的参数，称为“散射长度”。SLD就是一个区域内所有原子散射长度的总和除以该区域的体积。SLD剖面图 $\rho(x)$ 就是这个物理量沿着膜法线方向（x轴）的一维分布图。衬度变化法（Contrast Variation）：该方法是中子散射的“独门绝技”。其原理是氢（H）和它的同位素氘（D）的散射长度值差异巨大，甚至是符号相反（H为-3.74 fm, D为+6.67 fm）。通过使用不同比例的重水（$\ce{D2O}$）和普通水（$\ce{H2O}$）来水合样品，就可以系统地改变水分子的SLD值。例如，在8% $\ce{D2O}$ / 92% $\ce{H2O}$的混合溶剂中，水的平均SLD恰好为零，此时水对中子来说是“隐形”的，衍射信号完全来自脂质和表面活性剂。而在100% $\ce{D2O}$中，水的SLD非常高。通过对不同衬度下的SLD剖面图进行差值运算（例如，用100% $\ce{D2O}$的图减去8% $\ce{D2O}$的图），就可以精确地分离出水分子自身的分布，从而确定其在膜中的精确定位。 1 mol%的表面活性剂换算成我们熟悉的浓度单位大概是多少？在样品制备中，所有组分（脂质+表面活性剂）的总浓度是10 mg/mL，即10 g/L。根据文中的摩尔比（1:1:1:0.03），我们可以计算出表面活性剂的质量分数约为0.9%。因此，在用于制备薄膜的初始溶液中，表面活性剂的浓度大约是 10 g/L$\times $0.9%$ \approx 0.09 \ \text{g/L}$。这个浓度远低于这些表面活性剂的临界胶束浓度（CMC，约为0.1-0.8 mM，换算后约0.04-0.36 g/L）。这表明研究的是表面活性剂单体与脂质膜的相互作用，而非胶束的作用，这对于理解产品在低浓度或初始接触阶段对皮肤的影响尤为重要。辅助验证：全原子分子动力学（MD）模拟建模过程：使用CHARMM-GUI工具搭建了包含CER/CHOL/FFA以及两种代表性表面活性剂（$\ce{C16HAB}$和$\ce{IHAB}$）的脂质双层模型，并溶于TIP3P水盒子中，加入$\ce{NaCl}$维持离子强度。力场与软件：模拟采用CHARMM36 (C36) 脂质力场和GROMACS软件。模拟方案：体系经过能量最小化、NVT和NPT系综的平衡后，进行了50 ns的生产性模拟，并对最后5 ns的轨迹进行分析。MD模拟能够提供动态的、原子分辨率的图像，为中子衍射得到的静态、平均的结构信息提供机理上的解释。结果与分析 1. 模拟基线：纯脂质膜的结构验证图S8：(A) CER, CHOL, 木蜡酸(LA)的化学结构。(B) 等摩尔比的CER/CHOL/LA在50 ns模拟结束时的快照。(C) CER头、尾和溶剂的质量密度分布。(D, E) CER, LA, CHOL中特定原子的RDF及相应的水合数函数。在研究表面活性剂的影响前，作者首先通过MD模拟验证了其纯脂质模型（CERPure）的合理性。模拟得到的层状结构厚度（由CER头基峰间距定义）为5.25 nm，与实验测得的5.31 nm高度一致。CER尾链的质量密度分布呈“W”形，证实了与实验结果相符的尾链相互嵌入（interdigitation）的排列方式。这表明所用的MD模型能够可靠地复现实验结构。 2. 表面活性剂对脂质膜整体结构的影响图2：在100% $\ce{D2O}$水合条件下，纯CER/CHOL/FFA膜以及添加了1 mol%不同表面活性剂的混合膜的中子衍射一维图。数字表示SPP层状结构的衍射级数，星号表示胆固醇晶体的衍射峰。中子衍射图谱显示，所有样品都形成了高度有序的层状结构。层间距基本不变：纯脂质膜的SPP重复距离为 $53.4 \pm 0.5$ Å。加入1 mol%的任何一种表面活性剂后，该距离基本保持不变（约 $53.2$ Å）。有序性增强：一个有趣的现象是，加入表面活性剂后，衍射峰（尤其是高阶峰，见图S3）变得更加尖锐明显。这表明表面活性剂的加入反而使脂质膜的层状结构变得更加规整有序。胆固醇峰变化：另一个显著变化是，代表相分离结晶胆固醇的衍射峰（星号所示）强度在加入表面活性剂后有所下降。 3. 核心发现一：尾链结构决定膜的水合程度图3：(A) 纯脂质膜(CERPure)在8% $\ce{D2O}$和100% $\ce{D2O}$水合下的相对SLD剖面图，以及两者的差值曲线（蓝色实线），即水的SLD分布。(B) 不同模型膜中水的相对SLD剖面图。(C) 根据图3B计算出的水SLD剖面的截距和斜率。所有表面活性剂均增强水合：如图3B所示，与纯脂质膜（黑线）相比，所有添加了表面活性剂的膜，其边界区域（X ≈ ±27 Å，对应脂质头基位置）的水SLD信号都显著增强。这表明表面活性剂的亲水头基吸引了更多的水分子，导致膜整体的水合程度增加。水合程度与尾链结构相关：如图3C所示，不同表面活性剂增强水合的能力不同。通过比较边界处的水SLD峰高（截距）和梯度（斜率），发现水合作用的强度顺序为： $\ce{C16HAB}$ > $\ce{IHAB}$ > $\ce{C18HAB}$ > $\ce{OHAB}$ > 纯脂质膜。这个顺序与表面活性剂尾链的亲水性/疏水性密切相关。剂量依赖性：图S7（水SLD剖面图对比CERPure, CER$\ce{OHAB}$-1%和CER$\ce{OHAB}$-2%）进一步证实了这种水合增强效应。将$\ce{OHAB}$的浓度从1 mol%增加到2 mol%，膜边界的水SLD峰变得更高，表明水合作用的增强与表面活性剂的浓度呈正相关。 4. 核心发现二：表面活性剂促进胆固醇重排图4：(A) 不同模型膜在8% D₂O水合下的相对SLD剖面图。(B) 混合膜与纯脂质膜在8% D₂O下的SLD差值图，反映了表面活性剂和重排脂质的SLD分布变化。(C) 不同模型膜中胆固醇晶体衍射峰的强度比较。表面活性剂的定位：在8% $\ce{D2O}$的衬度下，水的信号被“屏蔽”。如图4A和4B所示，加入表面活性剂后，膜边界区域的SLD增加，而中心区域的SLD降低。这证实了表面活性剂的分子取向：亲水头基位于膜边界的水/脂界面，疏水尾链伸入膜中心的疏水核。胆固醇的重排：最关键的发现来自图4C。纯脂质膜中存在明显的结晶胆固醇衍射峰。加入表面活性剂后，该峰的强度显著下降，且下降程度与表面活性剂种类有关，顺序为： IHAB > $\ce{C16HAB}$ > $\ce{C18HAB}$ > OHAB。这表明，表面活性剂能够促进原本相分离出来的结晶胆固醇，重新溶解并整合到SPP的层状结构中。其中，支链的IHAB效果最好，这可能是因为其较大的尾链体积能更有效地在脂质层中为胆固醇“腾出空间”。 5. 分子机制的动态模拟验证图5：(A-C) 含$\ce{C16HAB}$的混合膜的MD模拟结果，包括快照、质量密度分布和径向分布函数(RDF)。(D-F) 含$\ce{IHAB}$的混合膜的MD模拟结果。 MD模拟为上述实验发现提供了微观图像。分子排布：模拟快照和质量密度分布图（图5B, 5E）清晰地显示，表面活性剂（红色和蓝色）的头基确实位于CER头基（灰色）外侧，更靠近水层（绿色），与中子衍射结果完美吻合。水合机制：通过计算径向分布函数（RDF），模拟揭示了水合变化的细节。图S9（LA与表面活性剂头基的RDF）显示，表面活性剂的阳离子头基会与脂肪酸的阴离子头基发生强烈的静电吸引。这种离子对的形成会“挤走”原本与脂肪酸头基结合的水分子（见表S4，LA的第一水合层水分子数从3.24下降到3.07或2.96）。然而，由于表面活性剂自身的头基（特别是两个羟乙基）具有强大的水合能力（第一水合层水分子数高达27个左右），其吸引的水分子远超脂肪酸失去的水分子，因此宏观上表现为膜整体水合程度的显著增加。 6. 总结：双重作用机制模型示意图1：模型SC中SPP双层结构的示意图。(a) 不含表面活性剂的纯SC膜，同时存在SPP相和CHOL相。(b) 表面活性剂-脂质混合模型膜，结晶CHOL分子迁移到SPP中，双层膜的水合作用增强。综合所有结果，作者提出了表面活性剂作为渗透促进剂的双重作用机制。它并非简单地通过“搞乱”脂质层来增强渗透。一方面，它通过自身强大的水合能力，显著增加了SC脂质膜极性区域的含水量和流动性；另一方面，它还能促进原本以结晶形式存在的、对屏障功能不利的相分离胆固醇重新整合入有序的层状结构中。这两种看似矛盾（增加流动性 vs 增加有序组分）的作用共同决定了最终对皮肤渗透性的影响。 Q&A Q1: 为什么添加表面活性剂后，脂质膜的层状结构反而变得更“有序”（衍射峰更尖锐）？这与我们通常认为表面活性剂会“扰乱”膜的直觉相悖。 A1: 这是一个非常好的观察。这种“反直觉”的现象可能有两个原因：首先，本研究中表面活性剂的浓度非常低（1 mol%），可能不足以造成宏观上的无序化。其次，更重要的原因是表面活性剂促进了相分离的结晶胆固醇重新整合到SPP层状结构中。胆固醇本身是维持脂质层有序性和致密性的关键分子，当更多的胆固醇被有序地插入到神经酰胺和脂肪酸之间时，整个层状结构的规整性（long-range order）可能会得到提升，从而导致衍射峰变得更尖锐。这揭示了表面活性剂在低浓度下可能扮演着“结构优化剂”而非“破坏者”的复杂角色。 Q2: MD模拟结果显示，加入表面活性剂后，脂肪酸（LA）周围的水分子变少了，但这与实验观察到的整体水合增加似乎矛盾，如何解释？ A2: 这个看似矛盾的现象恰好揭示了相互作用的复杂性。MD模拟可以“看”到更精细的局部变化。脂肪酸（LA）的羧基头基带负电，而表面活性剂的头基带正电，两者之间会形成强烈的静电吸引。这种离子对的形成会“挤走”原本与脂肪酸头基通过氢键结合的水分子，导致LA的局部水合下降。然而，从整个体系来看，一个表面活性剂分子（特别是其头基上的两个羟乙基）自身所能吸引和结合的水分子数量，远远超过了一个脂肪酸头基失去的水分子数量。因此，局部的“脱水”和更强的全局“增水”效应同时发生，最终宏观表现为膜整体水合程度的显著增加，这与中子衍射的实验结果是完全一致的。关键结论与批判性总结核心结论低浓度（1 mol%）的阳离子表面活性剂并不会破坏SC脂质模型膜（SPP）的整体层状结构，反而会使其更有序。所有测试的表面活性剂都显著增加了模型膜的水合程度，其效果与疏水尾链的结构密切相关，亲水性越强（如链越短、有支链）的尾链导致的水合作用越强。表面活性剂能够促进相分离的结晶胆固醇重新整合入SPP层状结构中，其中空间位阻较大的支链表面活性剂（$\ce{IHAB}$）效果最为显著。 MD模拟揭示，表面活性剂的亲水头基位于水/脂界面，疏水尾链伸入膜核心，其强大的水合能力是导致膜整体水合增加的主要原因。潜在影响为理解表面活性剂与皮肤屏障的相互作用提供了分子层面的新视角，揭示了其作为渗透促进剂的“双重作用”机制（增强水合+重排胆固醇）。为化妆品和透皮给药系统的配方设计提供了重要的理论指导，表明可以通过精细调控表面活性剂的分子结构来定制其对皮肤屏障的功能影响。存在的局限性研究采用了简化的SC脂质模型（仅SPP），未能包含更复杂的LPP结构以及角质层中的蛋白质等其他组分。仅研究了阳离子表面活性剂，结论是否适用于阴离子或非离子表面活性剂尚不明确。研究主要在平衡态下进行，未能完全反映真实皮肤上产品使用过程中的动态相互作用。未来研究方向将研究扩展到包含LPP的更复杂的脂质模型，甚至离体皮肤模型。系统研究其他类型（阴离子、非离子、两性）表面活性剂的结构-效应关系。结合其他实验技术（如红外光谱、NMR等）进一步探究表面活性剂对脂质链构象和动力学的影响。附录 SLD剖面图 $\rho(x)$ 的物理意义 SLD剖面图，即中子散射长度密度（Neutron Scattering Length Density, SLD）剖面图 $\rho(x)$，可以直观地理解为一维的“分子地图”，它展示了沿特定方向（在此研究中是垂直于脂质膜平面的方向，即MD模拟中的z轴）物质分布的情况。基本定义：从物理化学角度看，$\rho(x)$ 代表在位置 x 处单位体积内的中子散射能力。您可以将其类比为X射线衍射中的“电子密度图”。每个原子核都有一个固有的中子散射长度（scattering length），$\rho(x)$ 就是在x位置一个微小体积元内所有原子核散射长度的总和除以该体积元。如何解读：通过分析$\rho(x)$曲线的形状，我们可以推断出不同分子基团在膜中的空间排布：峰（Peak）：$\rho(x)$值高的区域，意味着该处富含中子散射能力强的原子。在本研究中，由于重水（$\ce{D2O}$）的氘（D）原子具有很高的正散射长度，因此SLD的峰值通常对应于水分子富集的区域，也就是亲水性的脂质/表面活性剂头基所在的界面处。谷（Trough）：$\rho(x)$值低的区域，意味着该处富含中子散射能力弱或为负值的原子。氢（H）的散射长度为负值，因此SLD的谷值通常对应于富含C-H键的疏水性烷基链区域，即膜的中心。平台（Plateau）：相对平坦的区域表明该处的物质分布较为均匀。对于MD研究者的意义：SLD剖面图是从中子衍射实验数据（存在于倒易空间）通过傅里叶变换得到的真实空间图像。它提供了一个与您的MD模拟中质量密度分布（mass density profile）或原子数密度分布（number density profile）直接对应的实验验证结果。通过对比实验SLD剖面图和模拟密度分布图，可以验证您的模拟体系是否准确地复现了真实的分子排布。 SLD剖面截距 (Intercept) 的物理意义在这篇论文的语境中，“截距”（Intercept）是一个用于量化水合程度的参数。具体定义：作者将“截距”定义为水分子的SLD剖面图在单位晶胞最边界处（X = ±27 Å）的$\rho(x)$值。这个位置对应于脂质头基与体相水层接触最充分的界面。物理意义：因此，截距的物理意义是水/脂界面处的最大水分子密度，它直接反映了模型膜表面的最大水合程度。截距值越大，意味着在膜的边界处聚集了更多的$\ce{D2O}$分子，表明该膜体系的亲水性越强，水合能力也越强。在图3C中，作者通过比较不同体系的截距大小，直接得出了不同表面活性剂增强膜水合能力的强弱顺序。 SLD剖面斜率 (Slope) 的物理意义与截距类似，“斜率”（Slope）也是一个量化水合特征的参数。具体定义：作者将“斜率”定义为水分子SLD剖面图在亲水头基区域（从 X = 20 Å 到 27 Å）的曲线梯度。这个区域代表了从水/脂界面向膜疏水核心过渡的地带。物理意义：斜率的物理意义是亲水头基区域的水密度梯度。它描述了水分子密度从膜表面向内渗透时下降的快慢程度。斜率绝对值越大（曲线越陡峭），表示水分子密度从界面处向内急剧下降。这通常意味着水分子被紧密地束缚在最外层的亲水头基周围，形成一个界限分明、比较致密的水合层。斜率绝对值越小（曲线越平缓），表示水分子密度向内下降得比较缓慢，水合层可能更为弥散（diffuse），或者水分子能够渗透到头基区域更深的位置。在本文中，作者将更大的斜率和更大的截距共同作为膜水合作用增强的标志，即表面活性剂的加入不仅吸引了更多的水分子（高截距），还使这些水分子在界面处形成了密度更高、梯度更陡峭的水合层（大斜率）。

Specific Sytems · 2026-06-23

电荷少，效果好？解密疏水作用如何助力高效基因递送本文信息标题: Role of Charge Density of Polycations in DNA Complexation and Condensation 作者: Jianxiang Huang, Yangwei Jiang, Dong Zhang, Jingyuan Li, Youqing Shen, Ruhong Zhou 单位: 浙江大学生命科学学院定量生物学中心引用格式: Huang, J., Jiang, Y., Zhang, D., Li, J., Shen, Y., & Zhou, R. (2025). Role of Charge Density of Polycations in DNA Complexation and Condensation. Biomolecules, 15(7), 983. https://doi.org/10.3390/biom15070983 摘要聚阳离子基因载体在基因递送领域已被广泛研究，其电荷密度在凝聚核酸中扮演着关键角色。最近，我们合成了两种具有不同电荷密度的聚阳离子：聚(2-(二甲氨基)乙基甲基丙烯酸酯)（表示为A100）和一种由2-(四氢亚甲基亚氨基)乙基甲基丙烯酸酯与2-(二异丙氨基)乙基甲基丙烯酸酯以3:1进料比共聚的聚合物（表示为B75D25）。尽管B75D25基载体的电荷密度较低，但其展现出比A100基载体更高的转染效率，这启发了一个假说：疏水相互作用，而不仅仅是高电荷密度，增强了DNA的复合与基因递送。本研究旨在通过分子动力学（MD）模拟研究DNA与B75D25和A100的复合过程，以探究这些差异背后的分子机制。我们的模拟显示，DNA被B75D25相当均匀地覆盖，并且这种复合不仅由与DNA的静电吸引驱动，更重要的是由B75D25之间的疏水相互作用驱动。相反，由于A100之间强烈的静电排斥，只有一小部分A100能与DNA结合。我们的结果揭示了疏水相互作用对低电荷密度B75D25与DNA复合的贡献。这些结果表明，高电荷密度可能并非DNA凝聚和高效基因递送的必要条件。背景基因治疗，通过将治疗性核酸（如DNA）递送到目标细胞以纠正遗传缺陷，正逐渐成为一种前景广阔的革命性医疗策略。然而，脆弱的核酸分子无法独自“闯荡”复杂的体内环境，它们需要被包裹在载体中，以保护其免受降解，并帮助其穿透细胞膜的壁垒。目前，临床上使用的基因疗法多依赖于病毒载体，但其高昂的成本、有限的装载能力、潜在的免疫原性和致癌风险，极大地限制了其广泛应用。因此，开发更安全、更经济的非病毒载体成为了该领域的关键。其中，聚阳离子是一类极具潜力的非病毒载体。它们是带有正电荷的长链聚合物，能够通过静电吸引力与带负电的DNA结合，并将其“压缩”成纳米级别的致密颗粒（称为“polyplex”），从而保护DNA并促进其进入细胞。长期以来，该领域的一个核心设计准则是：聚阳离子的电荷密度越高，其与DNA的结合力就越强，形成的颗粒就越致密，基因递送效率也理应越高。这个直观的理论指导了许多载体的设计。关键科学问题然而，近期的实验结果开始挑战这一传统认知。本文作者团队前期合成并测试了两种结构相似但电荷密度差异巨大的聚阳离子：A100（在pH 7时约有50%的单元带正电，高电荷密度）和B75D25（在pH 7时仅有约10%的单元带正电，低电荷密度）。实验结果惊人地发现，低电荷密度的B75D25所介导的基因转染效率，反而显著高于高电荷密度的A100。这一反常现象引出了本研究的核心科学问题：为何在静电吸引力明显更弱的情况下，低电荷密度的B75D25反而能成为更优秀的基因载体？是什么被忽略的关键物理化学作用力在其中扮演了更重要的角色？本研究旨在通过全原子分子动力学模拟，从分子层面深入剖析这两种聚阳离子与DNA相互作用的动态过程，揭示这一反常现象背后的物理机制。创新点挑战传统认知：通过原子级别的模拟证据，有力地挑战了“电荷密度越高越好”的传统基因载体设计准则。揭示关键机制：首次从分子动力学角度，清晰地揭示并量化了聚阳离子间的疏水相互作用在稳定DNA复合物中的主导作用。提供新设计思路：研究结果表明，通过巧妙地平衡疏水性与静电相互作用，可以设计出电荷密度更低、潜在毒性更小且效率更高的非病毒基因载体，为未来的载体设计提供了新的方向。研究内容核心方法：全原子分子动力学模拟为了在原子尺度上“观察”DNA与聚阳离子的相互作用，研究者构建了精细的计算机模拟体系。他们将一段标准的B型DNA（Drew-Dickerson十二聚体）置于水盒子中央，周围环绕着24条聚阳离子链（A100或B75D25），并加入离子以模拟生理盐浓度。随后，利用经典的GROMACS软件进行长达数百纳秒（ns）的分子动力学模拟，追踪每一个原子的运动轨迹。 graph TD subgraph "体系构建" direction LR A["DNA模型 Drew-Dickerson十二聚体"] --> C; B["聚阳离子模型 A100 (高电荷) 或 B75D25 (低电荷)"] --> C; end subgraph "模拟与分析" direction LR CMD模拟 GROMACS软件 数百纳秒轨迹 --> D[("轨迹分析")]; end subgraph "关键分析手段" direction LR D --> E["COM距离 分析整体结合趋势"]; D --> F["接触分析 区分疏水与静电相互作用"]; D --> G["PMF计算 量化相互作用强度"]; end classDef main fill:#e6f2ff,stroke:#007bff,stroke-width:2px; class C,D main; 结果与分析本文的研究思路遵循着“观察反常现象 -> 提出假说 -> 精细化验证 -> 得出结论”的经典科研逻辑，如下图所示： graph TD A["现象 低电荷B75D25完全包裹DNA 高电荷A100仅部分结合"] --> B核心假说 B75D25的优异性能 由链间疏水作用主导， 而非链与DNA间的静电作用; subgraph "假说验证" direction LR B --> C["证据1：接触分析 B75D25链间以疏水接触为主"]; B --> D["证据2：自由能计算 拉开B75D25需克服巨大能量壁垒 （40.6 kcal/mol）"]; end subgraph "结论" direction LR E(主要结论 疏水作用是低电荷载体 形成稳定包裹的关键) --> F(最终推论 平衡疏水与静电是更优的设计策略); end A --> B C & D --> E A --> F classDef observation fill:#e6f2ff,stroke:#007bff,stroke-width:2px; classDef hypothesis fill:#e8fef0,stroke:#28a745,stroke-width:2px; classDef evidence fill:#fff,stroke:#6c757d,stroke-width:2px; classDef conclusion fill:#fff8e1,stroke:#ffc107,stroke-width:2px; class A observation; class B,G hypothesis; class C,D evidence; class E,F conclusion; 1. 反常识的包裹现象：为何“弱者”胜出？模拟结果首先从宏观上复现了实验的怪异现象。对于低电荷密度的B75D25体系，24条聚阳离子链在模拟开始后迅速向DNA靠拢，并在约25 ns内全部聚集在DNA周围，形成了一个厚度可达2.5 nm的、完整且均匀的保护层。相反，对于高电荷密度的A100体系，尽管其与DNA的静电吸引力更强，但由于A100链之间强烈的同种电荷排斥力，平均只有约7条（最多约10条）链能够成功结合到DNA上，其余大部分都被排斥在外，未能形成有效的保护层。补充材料中的数据显示（图S7），B75D25的包裹层在25 ns内就迅速稳定地包含了全部24条聚合物链，而A100的包裹层始终只有不到一半的链参与，定量地证实了这种包裹效率的巨大差异。图2：聚阳离子-DNA的复合过程及体系的最终模拟构象。（a） DNA与聚阳离子之间平均质心（COM）距离随时间的变化。阴影误差带代表平均值的标准误差。（b）从DNA开始的净电荷分布。误差棒代表平均值的标准误差。（c） B75D25/DNA复合物的最终模拟构象，虚线圆标记了电荷中和距离 $R_{0}$ 以内的区域。（d） A100/DNA复合物的最终模拟构象。 2. 揭秘B75D25的“隐藏力量”：疏水相互作用既然静电吸引无法完全解释B75D25的优异包裹能力，研究者将目光投向了另一种重要的作用力：疏水相互作用。通过精细的接触分析，他们发现，在B75D25形成的保护层中，聚阳离子链与链之间的相互作用，主要由非极性原子间的接触（即疏水相互作用）所主导，其接触数量显著高于极性原子间的接触。这表明，B75D25链倾向于彼此“抱团”，形成一个稳定的疏水核心，从而将DNA包裹在内。图3：B75D25聚合物间的疏水相互作用。（a） B75D25的疏水接触表面积随时间的变化。（b） B75D25之间的接触原子对（红色线为极性-极性对，绿色线为非极性-非极性对）。（c） B75D25与DNA之间的疏水接触表面积随时间的变化。（d） B75D25与DNA之间的接触原子对。为了进一步量化这种“抱团”的力量有多强，研究者通过伞形采样模拟计算了将一条B75D25链从复合物中拉出的自由能代价（PMF）。结果显示，拉出一条B75D25链需要克服高达 $40.6\ \mathrm{kcal/mol}$ 的能量壁垒，这是一个非常巨大的数值，强有力地证明了B75D25聚合物之间的疏水聚集是其形成稳定保护层的根本原因。图4：沿着反应坐标（定义为被选择的B75D25链的COM与DNA的COM之间的距离）的平均力势（PMF）。插图显示了用于PMF计算的反应坐标。 3. 重新审视静电相互作用分析同样证实，B75D25的质子化胺基与DNA的磷酸骨架之间确实存在静电吸引和氢键作用。然而，这些相互作用的强度和数量都相对温和。相比之下，A100与DNA形成的静电相互作用虽然更强，但这种强作用力是一把“双刃剑”，它同时也导致了A100链之间更强烈的排斥，最终阻止了它们形成有效的整体包裹。这一电荷密度的差异在补充材料的静电势表面图中（图S2）得到了直观的展示，A100表面呈现出大片的强正电势（蓝色），而B75D25表面则大部分呈中性（白色）。因此，B75D25的成功策略可以总结为：利用温和的静电吸引将自身“锚定”在DNA表面，再依靠强大的链间疏水作用力完成“自组装”，形成稳定外壳。图5：DNA与B75D25聚合物的相互作用。（a） B75D25聚合物的质子化胺氮原子围绕DNA磷酸磷原子的径向分布函数。（b） DNA(P)与B75D25（质子化N）相互作用的代表性快照。（c）接触数的时程演化。（d）氢键数量的时程演化。 Q&A Q1：“疏水接触表面积”具体是指什么？它指的是B75D25链与链之间，还是B75D25与DNA之间的接触？ A1：这是一个非常关键的区别。本文分析了两种疏水接触表面积：一种是B75D25链与链之间的（图3a），另一种是B75D25与DNA之间的（图3c）。结果显示，链与链之间的疏水接触表面积（最终达到约 $180\ \mathrm{nm}^2$）远大于链与DNA之间的（约 $5\ \mathrm{nm}^2$）。您观察得非常正确，DNA的疏水碱基主要位于双螺旋内部，其暴露在表面的主要是亲水的磷酸脱氧核糖骨架。因此，B75D25与DNA的直接疏水作用相对较弱。这恰恰反过来强化了本文的核心论点：驱动B75D25形成稳定多层包裹的主要力量，并非来自与DNA的直接作用，而是来自B75D25链与链之间强大的疏水“抱团”效应。 Q2：B75D25的非极性接触比极性接触多，有没有可能是因为它本身的非极性原子就比极性原子多？作者是否考虑了这一点？ A2：这是一个非常深刻的问题，触及了数据归一化的核心。确实，从化学结构上看，B75D25的疏水单元（TMI）占75%，其非极性碳氢原子在数量上就远多于极性质子化氮原子。…… 小编觉得就应该是说明自己跟自己是疏水，那大部分原子都是非极性的当然是非极性接触。。 B75D25和DNA的结合仍然是静电驱动的，但大量B75D25和DNA的结合是疏水主导。 Q3：为什么后续的几张图（如PMF和RDF分析）主要表征B75D25，而没有对A100进行同样的分析？ A3：这反映了研究的逻辑聚焦。在初步的模拟中，研究已经明确了一个核心现象：B75D25成功形成了稳定的多层包裹，而A100因为强烈的内部排斥而失败了。因此，后续研究的核心科学问题就变成了：“成功者”B75D25究竟是靠什么机制成功的？于是，后续的PMF（测量聚集强度）和RDF（测量静电作用）等精细分析，都是为了深入刻画B75D25的成功机制。对A100进行PMF分析的意义不大，因为它根本没有形成一个可供“拉开”的稳定聚集体。作者在补充材料（图S12）中确实也计算了A100的RDF，并证实了其与DNA存在很强的静电吸引。小编觉得还是可以拉的…… Q4：这项研究对未来设计基因载体有何具体的指导意义？ A4：它提供了一个全新的设计范式。传统的设计思路是尽可能增加聚合物的正电荷。而本研究表明，一个更优的策略是“疏水与静电的协同设计”。未来的基因载体可以设计成这样：1）保留适量的正电荷，足以让载体与核酸发生初始的静电吸引；2）引入可控的疏水基团，利用疏水效应驱动载体分子自组装成稳定的纳米颗粒核心。这种设计不仅可能提高包裹效率和稳定性，还可能因为总体电荷较低而降低细胞毒性。 Q5：高电荷密度的A100与DNA之间存在很强的静电吸引，这个事实如何支撑“链间静电排斥是其失败主因”的结论？ A5：这个逻辑是成立的，它通过排除法得出了结论。首先，补充材料（图S6, S12）的数据证实了A100与DNA的吸引力非常强（甚至强于B75D25）。这就排除了“吸引力不足”是A100包裹失败的原因。既然吸引力足够强，但大部分A100链依然无法靠近DNA，那么必然存在一个更强大的、阻止它们靠近的拮抗力。在水溶液和离子环境中，对于带有大量同种电荷的A100分子链来说，这个力只能是它们彼此之间的静电排斥力。因此，正是因为“与DNA的吸引力很强”这个前提，我们才能更有信心地断定，是“链间的排斥力”阻止了更多A100的结合。也不算支撑，就是排除了一个答案 Q6：研究的核心论点是疏水作用“主导”了B75D25的包裹行为，但图5也显示了稳定的静电和氢键相互作用。我们如何客观评估这两种作用力的相对重要性？ A6：这是一个非常深刻的批判性问题。作者的“疏水主导”论点主要基于两个证据：1）链间的非极性接触数量远超极性接触（图3b）；2）将一条链从聚集体中拉开需要克服巨大的能量壁垒（$40.6\ \mathrm{kcal/mol}$，图4）。然而，正如您所指出的，图5也清晰地显示了B75D25与DNA之间存在着峰值尖锐的径向分布函数（RDF）和持续存在的氢键，这证明静电相互作用同样不可或缺。一个更严谨的解读是：静电吸引是“必要非充分”条件，而疏水作用是“决定性”因素。可以这样理解：静电吸引像是“船锚”，负责将第一批B75D25分子链从溶液中捕获并锚定到DNA表面。没有这个初始步骤，B75D25链将只是在溶液中随机漂浮。然而，仅靠这个“船锚”不足以形成一个稳定厚实的保护层，因为链与链之间仍然存在一定的排斥。此时，强大的链间疏水作用开始扮演主角，它像“万能胶”一样，将已经锚定和新到来的B75D25链紧密地粘合在一起，克服了它们之间的排斥力，最终形成了那个完整的多层包裹结构。因此，静电作用负责“启动”，而疏水作用负责“建成并稳定”。 Q7：研究比较了50%带电的A100和10%带电的B75D25。是否存在一个“最佳电荷密度”的甜点区？ A7：这是一个极好的问题，也是本研究未能直接回答的。本文通过两个极端的例子，雄辩地证明了“越高越好”的理论是错误的，并揭示了疏水作用的重要性。但这确实留下了一个开放性问题：是否存在一个最佳的平衡点？例如，一个25%或30%带电、同时保持疏水性的聚合物，是否会表现出比B75D25更优的性能？本研究的结论强烈暗示了这样一个“甜点区”的存在，即电荷密度既要足够强以启动与DNA的结合，又要足够弱以避免过度的链间排斥。探索这个最佳区间，将是后续研究中一个非常有价值的方向。 Q8：模拟使用的是一段短的、线性的DNA。真实世界中的DNA（如质粒）是环状且超螺旋的，这会对结果产生什么影响？ A8：这个问题触及了模型简化与生物现实之间的差距。使用短链DNA是计算模拟中的常见简化，但真实情况远为复杂。超螺旋的质粒DNA具有更紧凑的结构和更高的局部电荷密度，这可能会增强与聚阳离子的初始静电吸引。然而，其复杂的拓扑结构也可能对聚合物的缠绕和包裹方式提出新的挑战。例如，聚合物链可能被“卡”在DNA的扭结中。此外，本文的模拟也没有考虑DNA末端效应，而补充材料（图S8）中的周期性DNA模拟初步探讨了这一点。总的来说，虽然本研究揭示的基本物理原理（静电vs疏水）很可能同样适用，但这些原理在更复杂的DNA拓扑结构上如何具体表现，仍需进一步的研究。关键结论与批判性总结关键结论本研究通过全原子分子动力学模拟，为“低电荷密度聚阳离子B75D25比高电荷密度聚阳离子A100具有更优的基因转染效率”这一反常实验现象提供了深刻的分子机制解释。研究明确指出，一个成功的基因载体不仅需要与DNA有足够的静电吸引力，聚合物链之间的相互作用也同样至关重要。对于B75D25，强大的链间疏水相互作用是主导力量，它驱动聚合物自发地聚集、包裹在DNA周围，形成了一个稳定且完整的保护层。对于A100，过高的电荷密度导致了强烈的链间静电排斥，这种排斥力超过了其与DNA的吸引力，使得大多数聚合物链无法靠近DNA，最终导致包裹失败。因此，本研究的核心结论是：聚阳离子的包裹能力与其电荷密度并非简单的正比关系。适度的疏水性可以有效补偿较弱的静电吸引，通过链间聚集效应，同样能形成稳定的DNA复合物，并可能因为较弱的结合力而有利于在细胞内更高效地释放DNA，从而实现更优的基因递送。批判性总结潜在影响：这项工作为非病毒基因载体的设计提供了全新的、反传统的设计思路。未来的研究者在设计新型聚阳离子载体时，或许应该将目光从“如何最大化电荷”转向“如何巧妙地平衡静电与疏水相互作用”，这可能为开发出更低毒、更高效的基因治疗工具开辟新的道路。研究局限性：作者在文中也坦诚地指出了本研究的局限性，主要包括分子动力学模拟的时间尺度限制和计算中使用的力场精度可能存在固有偏差。未来展望：为了克服这些局限，未来的研究可以采用粗粒化模拟等方法来探索更长的时间和空间尺度。最重要的是，本研究的计算发现迫切需要进一步的实验验证，例如通过细胞摄取、内涵体逃逸等实验，来证实这种以疏水作用为主导的包裹机制是否真的能转化为最终的体内基因递送优势。

Specific Sytems · 2026-06-23

Specific Sytems · 2026-06-23

Specific Sytems · 2026-06-23

分子主轴相对膜法向的取向角用于识别膜肽插入状态的S/T/I三态模型与实验证据核心概念：取向角作为膜插入状态的判据在研究膜蛋白、抗菌肽等分子与脂质膜的相互作用时，分子主轴相对膜法向的取向角（tilt angle, θ）是判断其插入状态的核心结构参数。这一指标可通过分子动力学模拟、固态NMR等实验手段定量测定，为理解膜-分子相互作用提供了直接的结构基础。取向角是分子主轴（如α-螺旋轴）与膜法向（z轴）之间的夹角，这一几何参数提供了判断膜插入状态的定量判据： θ≈0°：分子垂直于膜平面，对应典型的跨膜插入态，疏水核心完全埋藏在膜的疏水区域 θ≈90°：分子平行于膜表面，两亲性螺旋的疏水面朝向脂质而极性面朝向水相中间角度：代表部分插入、倾斜跨膜等倾斜态，反映了膜-分子相互作用的多样性和复杂性 S/T/I三态模型：从定义到分类三态的经典定义（$\ce{^2H}$-NMR方法学） Strandberg等人通过$\ce{^2H}$-NMR系统分析了PGLa在膜中的取向和动力学，首次建立了S/T/I三态分类体系，并通过涨落分析验证了这一分类的物理合理性。三种取向态的定义状态全称倾斜角τ 方位角ρ 物理意义 S-state Surface（表面态） 60–120° 变化螺旋平行于膜表面 T-state Tilted（倾斜态） 30–60°或120–150° ~110–120° 螺旋倾斜插入膜内 I-state Inserted（插入态） 0–30°或150–180° ~90–100° 螺旋垂直跨膜形成孔道该示意图清晰展示了三种典型取向及其功能含义： S-state中螺旋平行于膜表面（τ≈90°），疏水面朝向脂质双层而亲水面朝向水相，体现表面吸附特征 T-state以一定角度（τ≈45°）倾斜插入膜内，是表面吸附向跨膜插入过渡的关键中间态 I-state近乎垂直于膜平面（τ≈0-10°），疏水核心完全埋藏在膜内，对应跨膜插入与成孔三种状态的几何差异对应功能差异，体现从表面结合到倾斜插入再到跨膜成孔的渐进过程研究动机：为什么$\ce{^2H}$-NMR能“看穿”分子的运动？想象一下，你想知道一根漂浮在水面上的木头是静止的还是在微微晃动。如果只拍一张照片（静态测量），你只能看到它此刻的角度；但如果录一段视频（动态测量），你就能知道它的晃动幅度有多大。 $\ce{^2H}$-NMR就是这样一种“能录制分子晃动”的技术。传统的观点认为NMR只能给出平均结构，但Strandberg团队发现：只要精细分析谱线形状，就能同时得到两个信息：平均角度：分子大部分时间待在什么位置晃动幅度：分子围绕这个位置晃了多大角度这种方法的威力在于：不仅能区分S/T/I三种状态，还能通过晃动幅度的差异来验证这种分类是否物理合理。核心逻辑：从一张图里提取三个参数 $\ce{^2H}$-NMR测的是氘原子（$\ce{^{2}H}$）的核四极分裂，这个分裂值直接取决于C-D键相对磁场的取向。对于$\alpha$-螺旋上的Ala-d3标记，每个残基的分裂值可以写成： [\Delta \nu_q = \frac{3}{2} \frac{e^2 q Q}{h} \left( 3\cos^2\beta - 1 \right)] 其中$\beta$是C-D键与磁场的夹角，背后对应两个关键几何量：倾斜角$\tau$为螺旋轴与膜法向的夹角，直接决定插入深度与跨膜程度；方位角$\rho$为螺旋绕自身轴的旋转角，决定哪一侧面朝向膜内或水相。分子晃动会把分裂值“平均化”，晃动越大分裂越小，因此可从谱线强度同时反推出平均角度（$\tau_0$, $\rho_0$）和晃动幅度（$\sigma_\tau$, $\sigma_\rho$）。图2给出倾斜角$\tau$与方位角$\rho$的几何定义：$\tau$描述螺旋轴与膜法向的夹角，$\rho$描述螺旋绕自身轴的旋转角。两者共同决定“是否插入”和“朝向哪一侧”，是区分三态的几何基础。倾斜角τ的数学表达 [\tau = \arccos(\vec{h} \cdot \vec{n})] 其中$\vec{h}$是螺旋轴向量，$\vec{n}$是膜法向单位向量。 PGLa的三态：一张图讲清抗菌肽如何“作案” Strandberg团队选择了PGLa这个经典的抗菌肽作为研究对象。为什么选它？因为PGLa在不同条件下会表现出三种截然不同的取向，这正是建立“三态模型”的完美材料。表1：PGLa的三种取向状态状态全称条件结构特征角度参数晃动幅度物理图像 S-state Surface（表面态）低浓度（肽:脂=1:200）单体平躺膜表面 $\tau = 97°$, $\rho = 117°$ $\sigma_\tau = 17°$, $\sigma_\rho = 19°$ 人趴在草地上，被表面吸附限制，晃动中等 T-state Tilted（倾斜态）中浓度（肽:脂=1:50）二聚体倾斜插入 $\tau = 121°$, $\rho = 111°$ $\sigma_\tau = 11°$, $\sigma_\rho = 20°$ 两人手拉手斜插土里，二聚体约束让晃动减小 I-state Inserted（插入态）与magainin-2协同（肽:肽=1:1）寡聚体跨膜成孔 $\tau = 157°$, $\rho = 97°$（等效$\tau = 23°$） $\sigma_\tau = 8°$, $\sigma_\rho = 20°$ 多人围圈钻透土层，刚性约束让晃动最小这三个状态不仅角度不同，晃动幅度也呈系统性递减：晃动幅度从17°降到11°再到8°，与“单体→二聚体→寡聚体”的物理图像高度一致单体自由度最大，二聚体受限明显，寡聚体最有序，这一变化体现动力学约束的递增这说明三态分类并非人为划分，而是有清晰物理差别的真实状态对照实验：WALP23的“自由爵士” 为了证明PGLa的规律不是偶然，Strandberg团队测量了WALP23这个疏水跨膜肽，得到一组强对照结果： WALP23倾斜角$\tau_0 = 14°$接近垂直，但晃动幅度高达$\sigma_\tau = 26°$, $\sigma_\rho = 66°$，显示极强的自由旋转作为单体肽，WALP23不受寡聚体约束，可在膜内自由摆动，与PGLa的I-state形成鲜明对比这一对照验证了“寡聚体越有序，晃动越小”的普遍规律，也证明$\ce{^2H}$-NMR能解析动态约束而不止于静态结构为了直观理解S/T/I三态与对照构象的差别，见图1。子图A–C对应PGLa的S/T/I三态，子图D/E为WALP23在DMPC与DLPC中的跨膜取向，灰度阴影表示疏水性梯度，便于对照插入深度与取向变化。为什么这篇论文重要？这篇论文的重要性体现在四个方面：方法学突破：首次证明$\ce{^2H}$-NMR可以同时提取静态角度和动态涨落，超越传统NMR只能给出平均结构的局限三态模型建立：为膜肽研究提供统一描述框架（S/T/I），使不同实验室的数据具备可比性物理合理性验证：通过涨落分析确认三态不是人为划分，晃动幅度递减与寡聚化程度完全一致普适性：该方法随后被广泛用于多类膜肽与膜蛋白研究，成为领域内的标准工具 PGLa：温度诱导的态转变 PGLa的温度/相态依赖（T态↔S态、低温DNP验证、脱水导致的I态）已经在《倾斜角的物理决定因素：从膜厚度到跨膜电位》中完整展开，这里不再重复。 $\ce{^{15}N}$ NMR化学位移与倾斜角的定量关系 [\delta_{\ce{^{15}N}} = \delta_{\parallel} \cos^2 \beta + \delta_{\perp} \sin^2 \beta] 其中$\beta$是N-H键相对磁场的取向角，$\delta_{\parallel}$和$\delta_{\perp}$是化学位移张量的主轴分量。对于α-螺旋： [\beta = \arccos(\cos \tau \cos \alpha + \sin \tau \sin \alpha \cos \rho)] 其中$\tau$是倾斜角，$\alpha \approx 17°$是N-H键相对螺旋轴的夹角，$\rho$是方位角。通过拟合实验谱图，可精确提取$\tau$和$\rho$。 S/T/I三态的具体观测 Melittin/MelP5：MD直接观测三态转变 Melittin是蜜蜂毒液中的主要成分，为26个残基的阳离子短肽，具有强烈的溶膜与抗菌活性；在中性膜中可形成由多条肽支撑的跨膜toroidal孔道。MelP5则是降低正电荷数的变体，实验上在更低浓度即可活化，因此是研究“序列电荷如何调控孔道稳定性”的理想对照。 Melittin和其突变体MelP5是形成膜孔的经典模型肽。研究者通过MD模拟直接观测到了S/T/I三态的动力学转变，提供了三态存在的直接证据。研究动机：从“静态照片”到“动态电影” 在Strandberg的$\ce{^2H}$-NMR研究之后，科学界已经有了S/T/I三态的分类，但还缺少直接的视觉证据。$\ce{^2H}$-NMR告诉我们“有这三种状态”，但没法回答：这三种状态是如何相互转换的？转换的中间过程是什么样的？什么因素驱动了这种转换？ MD模拟的优势在于：它可以记录每个时刻每个原子的位置，相当于给分子拍了一部“电影”，而不仅仅是“照片”。核心设计：亲水性突变的巧妙之处 Melittin是蜜蜂毒液中的主要成分，能在膜上打孔。MelP5是它的突变体，只在几个关键位置换成了更亲水的氨基酸。为什么要这样设计？ Melittin的原始序列：疏水性较强，倾向于稳定地跨膜 MelP5的突变序列：增加亲水性，让它更“犹豫”于插入膜中这种设计非常聪明：就像给一个本来喜欢潜水的人穿上了一件不那么喜欢水的衣服，他在水里的行为就会变得更加多样化——这正是研究者想要的，能够观察到更丰富的取向转变。实验设计：五种不同场景研究者设计了5种不同的模拟体系，覆盖了从“稳定孔道”到“解离”的完整谱系：体系描述观测到的现象 Melittin平行六聚体 6个Melittin肽段平行排列稳定的跨膜孔道，多数在I态 Melittin平行六聚体（部分解离）同上，但允许一个肽解离一个肽从孔道逃逸到S态 Melittin-MelP5混合六聚体 3个Melittin + 3个MelP5 两者的行为差异清晰可见 MelP5平行六聚体 6个MelP5肽段更大的倾斜角，更多T态 Melittin-MelP5五聚体最后只剩5个肽观察孔道维持的最小单位关键发现：三种状态的动态身份识别发现1：I-state（插入态）——孔道的“骨架” 结构特征：干三聚体稳定处于插入态，倾斜角仅9–19° 功能角色：位于孔道中心，承担跨膜孔道的结构骨架功能动力学特征：5 μs模拟中始终保持I态，几乎不发生转换，显示高度结构刚性图2展示干三聚体在平行六聚体中的逐步分离：不同颜色代表不同单体，三条螺旋从紧密结合走向轻微分开，但整体仍维持插入态；疏水侧链彼此朝内形成稳定核心，避免直接接触水性孔道。图S1进一步给出三聚体的细节构象，三条α-螺旋以反平行方式排列，疏水面朝内、亲水面朝外，解释其对孔道长期稳定的贡献。发现2：T-state（倾斜态）——孔道的“边缘” 倾斜范围：20–50°，明显高于干三聚体功能角色：连接跨膜孔道与膜表面的“桥梁” 动力学特征：在T/I之间摇摆但更偏向T态，兼顾稳定性与柔性构象直观：文中未单独给出T态的构象图，但图5的MelP5六聚体中间态可作为参考，部分单体呈明显倾斜，符合孔道边缘的T态特征发现3：S-state（表面态）——逃逸者现象特征：个别单体跃迁到~110°高倾斜角区间结构含义：从孔道区域回到膜表面吸附态功能启示：孔道组装可逆，单体可脱离并回到表面，这对抗菌肽毒性与选择性具有意义图4展示平行八聚体中单体的解离轨迹，肽段从稳定孔道逐步脱离并转向膜表面，倾斜角从~20°升至~110°，直观对应I/T向S的转换；八聚体更容易出现逃逸，提示孔道越大越易不稳定。图6补充混合体系中的快速解离：异源相互作用较弱，melittin更易从混合孔道逃逸，孔径略缩小到~0.8 nm但仍维持功能性孔道。发现4：Melittin vs MelP5的“性格差异” 亲水性突变对tilt angle的影响清晰可见：Melittin的平均倾斜角为25°（更垂直），而MelP5的平均倾斜角达39°（更倾斜）。这种差异的物理根源在于MelP5增加了亲水残基（Pro→His），导致螺旋“倾向于把头探出来透气”，更大的倾斜角意味着孔道稳定性降低，这解释了为什么MelP5在实验中表现出更快的孔道形成动力学和更低的细胞毒性。该图展示MelP5平行六聚体的构象演化：左侧为50 ns中间态，右侧为最终态，孔道逐步松散；相比melittin，MelP5倾斜角更大，部分肽段明显偏离垂直取向。不同颜色区分单体，脂质以球棍表示，直观呈现肽-膜相互作用。 MD模拟观测到的倾斜角分布肽段状态平均倾斜角描述 Melittin（干三聚体） I-state 9–19° 完全插入，维持跨膜孔道 Melittin（孔道单体） T-state 20–50° 倾斜取向，支持水性孔道 Melittin（解离单体） S-state 113° 转向表面吸附 MelP5 T/I混合 15–52°（平均39°）比melittin倾角更大，平均39° vs 25° MD模拟揭示倾斜角与功能直接相关：I-state构成孔道骨架，T-state连接孔道与表面，S-state代表脱离与回归；同时，MelP5亲水性增强（Pro→His）使平均倾斜角升至39°（melittin约25°），更“探头”的取向带来更快成孔与更高解离倾向并存的现象。为什么这篇论文重要？这篇论文的重要性体现在四个方面：直接视觉证据：在原子尺度上“看到”S→T→I的完整转变过程，这是实验难以捕捉的动态事件机制层面的深化：干三聚体构成核心骨架，外围单体支撑孔道边缘，个别单体可逃逸到表面序列与取向的关联：亲水性突变使倾斜角增大、孔道稳定性下降，为理性设计提供定量线索方法学示范价值：MD补足实验静态信息，二者结合才能完整解释膜-肽相互作用 Fis1尾锚：Monotopic vs Bitopic的取向区分 Fis1(TA)是线粒体外膜蛋白的尾锚片段，研究通过MD模拟结合增强采样技术分析了其在膜中的取向。该研究明确使用tilt-angle（$\theta$）和到膜中心的距离（$r$）作为两个集合变量来区分单层吸附（monotopic）和跨膜（bitopic）两种状态。其中“膜中心线”指穿过双层中心、沿膜法向（z轴）延伸的直线，$r$为肽段质心到这条直线的垂直距离（即在膜平面内的径向偏离），$\theta$为螺旋轴与膜法向的夹角。研究背景：尾锚蛋白的“身份危机” 尾锚蛋白（Tail-anchored protein, TA）面临两个相互竞争的取向：既可能单层吸附（monotopic）贴在膜表面，也可能跨膜插入（bitopic）穿透双层。Fis1作为酵母线粒体外膜蛋白，必须精准定位到膜上，因此“自发插入”还是“需要MIM复合物辅助”成为核心争论。核心设计：三步走策略攻克采样难题 MD模拟的难点在于采样稀有构象转换，研究者采用三步走策略：步骤目标关键参数结论要点 Simulated Annealing 让肽快速探索位置与取向 298 K → 800 K → 298 K 11次独立运行一致收敛到monotopic，插入深度约0.7 nm AA-REX 获得平衡结构与tilt angle 80个副本，298–471 K α-螺旋保持完整，tilt angle集中在20–40° Metadynamics + Hamiltonian REX 定量评估能垒集合变量$\theta$与$r$ 能垒约15–20 kJ/mol（6–8 $k_BT$）第一步：Simulated Annealing（模拟退火）——暴力破解目标：快速探索所有可能位置与取向，避免陷入局部能量谷操作：298 K升到800 K再降回298 K 结果：11次独立SA一致收敛到monotopic态，插入深度约0.7 nm 第二步：AA-REX（全原子副本交换）——精细平衡目标：获得平衡结构并精确定义tilt angle 操作：80个副本覆盖298–471 K 结果：α-螺旋完整保留，tilt angle集中在20–40° AA-REX的结构结果见图3，可按子图理解：子图(a)为代表性构象快照，显示Fis1 TA以α-螺旋形式嵌入膜内；子图(b)给出序列特异性α-螺旋倾向性，残基132–151中除羧基末端5个带电/极性残基外，其余部分螺旋性接近1；子图(c)展示残基相对膜/水界面的平均深度，疏水段（132–146）埋藏约0.7 nm，而带电末端延伸至界面附近；子图(d)给出螺旋轴与膜法向夹角的分布，用于定义并量化倾斜角$\theta$，结果显示monotopic态主要集中在20–40°。第三步：Metadynamics + Hamiltonian REX——自由能面目标：定量评估monotopic↔bitopic的自由能能垒操作：以$\theta$和$r$为集合变量驱动采样结果：能垒约15–20 kJ/mol，解释常规模拟“看不到转换”的原因是能垒过高自由能分析自由能面的关键结果见图4：子图(a)为$F(r,\theta)$自由能面，色条表示相对自由能高低，1和3对应monotopic态，2和4对应bitopic态，虚线标示膜-水界面；子图(b)给出各极小值代表构象，并用不同颜色球标记N端与C端。核心结论是monotopic与bitopic之间能垒显著，且从羧基端跨越的路径更高（文中约60 kJ/mol），与“带电末端锁定表面态”一致。 [F(\theta, r) = -k_B T \ln P(\theta, r)] 其中$P(\theta, r)$是在倾斜角$\theta$和距离$r$处的概率分布。Monotopic态对应$\theta \approx 20-40°$且$r \approx 0.7$ nm（埋藏在单层内），而bitopic态对应$\theta \approx 0-10°$且$r \approx 0$（跨越双层中心）。关键发现：带电末端的“守门员”作用自由能面揭示了四个能量极小值（monotopic为1/3，bitopic为2/4），虽然两者能量相近，但能垒高达15–20 kJ/mol，导致monotopic→bitopic几乎不可达。状态典型倾斜角$\theta$ 位置$r$ 自由能极小值物理含义 Monotopic 20–40° ~0.7 nm 1、3 单层吸附稳态 Bitopic 0–10° ~0 2、4 跨膜插入态 Fis1尾锚的羧基末端含5个连续带电/极性残基（Asn-Arg-Lys-Arg-Arg），形成“门禁”： monotopic态稳定：电荷停留在脂质头部极性区域，形成离子桥 bitopic态受阻：电荷穿越疏水核心代价高（每个电荷约3–5 kcal/mol）总能垒高：累计约15–25 kJ/mol，将构象“锁”在表面态序列分区如下：片段残基范围组成特征作用疏水段 132–146 VAL、ALA、LEU为主驱动插入与疏水匹配带电末端 147–151 R、N、K、R、R + COOH 离子桥锁定表面态发现3：验证突变的“失效”机制 A144D：疏水段引入负电荷，插入深度不足 L139P：脯氨酸破坏α-螺旋，取向不稳定综合结论：疏水段连续性与末端电荷位置必须精确，才能维持稳定拓扑为什么这篇论文重要？方法学示范：组合SA、AA-REX与Metadynamics破解稀有事件采样难题解决争议：支持Fis1可自发插入线粒体外膜，无需MIM复合物协助揭示机制：末端电荷通过能垒“锁定”monotopic态，明确拓扑决定因素可移植框架：为其他尾锚蛋白研究提供可复用的计算路径影响取向角的关键因素 S4螺旋：膜厚度、转移能与取向机制 S4是电压门控离子通道的电压感受器螺旋。采用各向异性溶剂模型（PPM 2.0）计算了其在不同膜厚度下的取向和插入自由能，揭示了膜厚度对tilt angle的决定性影响。 PPM模型与参数化研究动机：富精氨酸螺旋如何在疏水膜核心中“生存”？研究动机可以拆成两层张力：能量悖论：S4富含带正电的精氨酸（Arg），按传统疏水效应理论在膜内应有~+20 kcal/mol能量惩罚实验事实：固态NMR显示S4以跨膜α-螺旋存在，tilt angle在22°到40°之间变化核心问题：为什么含4个精氨酸的S4能稳定插入疏水核心？此外，不同实验报告的倾斜角差异（22°到40°）究竟源于真实物理变化还是实验误差？更根本的问题是：哪些物理因素决定S4的tilt angle？膜厚度是否为决定性变量？核心设计：各向异性溶剂模型（PPM 2.0）的巧妙之处这篇论文采用Lomize等人开发的PPM（Positioning of Proteins in Membranes）模型2.0：模型类型：隐式膜模型（implicit membrane model）核心思想：将脂质双分子层视为“各向异性溶剂”，沿膜法向（z轴）具有梯度变化的极性、介电常数、表面张力和氢键供受体能力要点物理含义对应量或范围实验参数化模型参数来自实验而非经验拟合水浓度、极性、介电常数中极性区域膜内存在水浓度较高的缓冲区头部约55 M，中极性区约3.66 M，核心约0.55 M snorkeling效应带电侧链可部分溶剂化以降低惩罚精氨酸胍基团伸向中极性区刚性体扫描自动寻找最稳定取向与深度倾斜角$\tau$、方位角$\rho$与膜深度$d$ 转移能与倾斜角随膜厚变化（含机制与验证）取向状态倾斜角范围条件跨膜取向 22–40° 取决于脂质双分子层疏水厚度表面取向 ~73° 替代性表面结合态该图展示了S4螺旋在不同膜厚度下的能量和取向特征。这里的“转移能”$\Delta G_{\text{transf}}$指螺旋从水相转移到膜环境时的自由能变化，数值越低说明该取向更稳定、更容易被膜接受（图注注明$\Delta G_{\text{calc}}$未包含疏水匹配惩罚）：子图(A) 能量与倾斜角：菱形为转移自由能$\Delta G_{\text{transf}}$，圆圈为倾斜角，蓝色代表跨膜取向，紫色代表表面取向。跨膜态倾斜角随膜厚从22°增加到40°，表面态保持在~73° 子图(B) 两种取向示意：左侧为跨膜插入态（蓝色，倾斜~40°），右侧为表面结合态（紫色，倾斜~73°）。snorkeling可视证据：R120、R123、R126侧链伸向脂质头部磷酸基团区域形成离子桥，稳定两种取向参数文献值说明表面取向转移能 $\Delta G_{\text{transf}} \approx -9.5\ \mathrm{kcal/mol}$ 表面取向的能量水平跨膜取向转移能 $\Delta G_{\text{transf}} \approx -9.5$ 至 $-14\ \mathrm{kcal/mol}$ 取决于膜厚度临界厚度 23.5 Å 小于该厚度时跨膜取向更有利表面取向倾角 $\sim 73°$ 替代表面结合态跨膜倾角（薄膜） $\sim 40°$ DMPC变薄至16.4 Å时的插入倾角最优厚度 $21 \pm 6.8$ Å 对应倾角 $22.5 \pm 11.4°$ ER膜厚度 27.5 Å 对应插入惩罚约0.5 kcal/mol，表面取向更占优 S4螺旋的取向由疏水匹配与局部溶剂化共同调控，计算与实验在关键量上吻合： snorkeling效应：R120、R123、R126侧链伸向脂质头部/中极性区域并与磷酸基团形成离子桥，降低带电残基埋藏惩罚实验证据：固态NMR显示S4在DMPC膜中以约40°倾斜插入，并诱导局部膜变薄约9 Å；DMPC疏水厚度从25.4 Å降到16.4 Å与计算预测一致内质网膜情形：原文指出在ER膜（疏水厚度约27.5 Å）转位子介导的跨膜插入惩罚约0.5 kcal/mol，这里的“惩罚”指插入相对表面结合的自由能代价，意味着插入仅略不利，因此表面取向相对更占优倾斜角与膜厚的定量关系对于跨膜螺旋，倾斜角$\theta$由几何匹配条件决定： [L_{\text{helix}} \cos \theta = d_{\text{hydrophobic}}] 其中$L_{\text{helix}}$是螺旋的疏水段长度（对S4约为30 Å），$d_{\text{hydrophobic}}$是膜的疏水厚度。因此： [\theta = \arccos \left( \dfrac{d_{\text{hydrophobic}}}{L_{\text{helix}}} \right)] 这解释了为什么S4的倾斜角从22°（薄膜，$d \approx 28$ Å）增加到40°（厚膜，$d \approx 23$ Å）。为什么这篇论文重要？这篇论文的重要性体现在四点：统一实验观测：用几何匹配定律解释22°到40°的倾斜角差异来自膜厚变化而非实验误差揭示snorkeling机制：PPM模型定量展示“中极性区域”对精氨酸稳定化的作用建立理论框架：$\theta = \arccos(d/L)$可预测多类跨膜螺旋的tilt angle 预测取向转换：跨膜态与表面态能垒很小，提示电压感受过程中可能发生取向转换第一篇的总结本文通过$\ce{^2H}$-NMR、MD模拟等多种手段，系统阐述了取向角作为区分膜相关螺旋插入状态的核心判据。从经典S/T/I三态模型的定义，到实际观测中的动态转换，我们看到了这一简单指标的强大解释力： S/T/I三态的定量定义：Surface态（60-120°）、Tilted态（30-60°）、Inserted态（0-30°）为理解膜-分子相互作用提供了清晰框架实验方法的互补性：$\ce{^2H}$-NMR提供 ensemble average，MD模拟揭示动态轨迹，两者相互验证温度的鲁棒性：DNP低温条件（100K）测得的取向与室温生理条件一致，验证了方法学可靠性序列决定取向：疏水残基驱动插入，带电/极性残基决定表面结合然而，一个核心问题仍未回答：为什么同一条螺旋在不同膜环境里会选择不同的倾斜角，并触发S/T/I三态切换？第二篇将沿着疏水匹配、能量分化与静电调控三条主线展开，并用PGLa的跨膜电位耦合等案例说明如何把“角度变化”追溯到可量化的物理机制。参考文献 2H-NMR分析PGLa和WALP23的取向与动力学：S/T/I三态定义。Biophys J 2009, 96, 3223–3232. https://doi.org/10.1016/j.bpj.2009.01.026 PGLa的固态NMR研究与DNP低温验证。Sci Rep 2016, 6, 20895. https://doi.org/10.1038/srep20895 Melittin/MelP5膜孔形成的MD模拟：建立S/T/I三态分类体系。Biophys J 2018, 114, 2865–2874. https://doi.org/10.1016/j.bpj.2018.05.027 Fis1 tail anchor MD研究：单层吸附vs跨膜由取向角判别。Membranes 2022, 12, 752. https://doi.org/10.3390/membranes12080752 S4螺旋的PPM模型：取向-膜厚关系与固态NMR验证。J Chem Inf Model 2011, 51, 930–946. https://doi.org/10.1021/ci200020k

Specific Sytems · 2026-06-23

植物重金属解毒的分子防线：金属结合蛋白的保护机制

植物重金属解毒的分子防线：金属结合蛋白的保护机制本文信息标题：Uptake and toxicity of heavy metals: The protective frontiers of metal binding proteins 作者：Ravneet Kaur, Harleen Kaur, Ashish Sharma 发表期刊：Journal of Geochemical Exploration 发表时间：2025年（Volume 271, Article Number 107673） DOI：https://doi.org/10.1016/j.gexplo.2025.107673 单位：Department of Botany and Environment Science, DAV University, India 引用格式：Kaur, R., Kaur, H., & Sharma, A. (2025). Uptake and toxicity of heavy metals: The protective frontiers of metal binding proteins. Journal of Geochemical Exploration, 271, 107673. 摘要环境中多种污染物和有毒物质被释放到生态系统中的含量正呈惊人增长。在所有污染物中，重金属是特别令人关注的一类。这些污染物进入环境后，通过土壤进入植物系统。植物通过质外体-共质体连续体从土壤中吸收重金属。植物需要微量浓度的营养元素，但这些元素过量时会对植物产生毒性效应。重金属会导致植物叶片失绿、光合作用受损、脂质过氧化等毒性，最终导致植物生物量整体下降。过量浓度的重金属如铜、铬、镍在多种植物物种诱导形态和生理畸形。为响应重金属毒性产生的活性氧，植物激活多种防御机制。此外，多种金属结合蛋白如金属硫蛋白、植物螯合肽、谷胱甘肽等被激活。这些金属结合蛋白通过结合重金属并将其区隔化到液泡中来降低重金属的毒性效应。本综述将重点介绍植物对重金属的摄取机制、常见重金属在植物中引起的毒性，以及金属结合蛋白在螯合和区隔化重金属中的作用。核心结论重金属摄取的双重途径：植物通过质外体途径（细胞壁和胞间空间的被动扩散）和共质体途径（通过胞间连丝连接的细胞质连续体的主动转运）吸收土壤中的重金属，在凯氏带处必须进入共质体继续运输关键转运蛋白系统：ZIP家族（锌/铁摄取）、HMA家族（P型ATP酶重金属外排）和NRAMP家族（天然抵抗相关巨噬细胞蛋白）精确调控金属离子平衡，各自具有特异的底物识别和跨膜转运机制金属结合蛋白的分子防线：金属硫蛋白作为富含半胱氨酸的低分子量胞质蛋白，通过硫醇基团直接结合重金属；植物螯合肽作为从谷胱甘肽衍生的多肽，通过酶促合成响应重金属胁迫，形成PC-金属配合物并区隔化到液泡中协同保护网络：MTs和PCs形成功能互补的保护系统，MTs负责快速响应和胞质金属离子调控，PCs负责延迟响应和液泡区隔化，两者通过ROS信号、$\ce{Ca^2+}$信号和GSH代谢网络协同调控背景重金属污染已成为全球环境和食品安全的重大威胁。随着工业化和城市化的快速发展，采矿、工业排放、农业活动（污水灌溉、农药使用）和交通尾气等人为活动向环境中释放了大量重金属。与有机污染物不同，重金属具有不可破坏性和生物累积性——它们不会在环境中降解，而是沿着食物链传递和浓缩，最终威胁人类健康。重金属对植物的毒性主要通过三个机制实现：氧化应激（重金属诱导ROS爆发，导致脂质过氧化、蛋白质氧化和DNA损伤）、酶活性抑制（重金属离子与酶活性位点结合，取代必需金属辅因子）和结构损伤（影响细胞膜完整性、叶绿素合成和光合作用）。不同重金属的毒性特异性明显：Cd、Hg、Pb、Cr等非必需金属即使低浓度也极具毒性，而Cu、Zn、Mn等必需金属在过量时同样产生毒害。植物为了应对重金属胁迫，演化出了复杂的金属稳态调控网络。这包括精确的金属摄取和转运机制、高效的金属螯合系统、以及区隔化解毒策略。其中，金属结合蛋白是植物重金属解毒的核心组件，它们能够高亲和力地结合重金属离子，形成稳定的配合物，并将这些有毒物质区隔化到代谢非活跃的细胞区室（如液泡）中。当前研究的核心挑战在于：植物如何精确识别和区分必需金属和有毒金属？金属结合蛋白如何实现高选择性和高亲和力的金属配位？MTs和PCs系统如何在时空上协同调控以实现最优的重金属解毒？对这些问题的深入理解不仅有助于揭示植物抗逆性的分子机制，还为作物遗传改良和植物修复技术提供理论基础。关键科学问题本研究综述旨在回答以下核心问题：植物重金属摄取和转运的分子机制：质外体和共质体途径如何协同工作？关键转运蛋白家族（ZIP、HMA、NRAMP）如何实现金属离子的选择性识别和跨膜转运？金属结合蛋白的结构-功能关系：MTs的半胱氨酸富集结构域如何决定金属选择性？PCs的多肽长度可塑性如何影响螯合能力和金属特异性？ MTs和PCs的协同保护机制：两套系统如何在时空上分工协作？它们如何通过共享的信号通路（ROS、$\ce{Ca^2+}$、GSH）实现协调调控？区隔化解毒的分子基础：ABC转运蛋白如何识别不同的PC-金属配合物？液泡区隔化如何影响金属的生物毒性和再利用？植物重金属摄取与转运机制图1：环境中重金属的各种来源，包括自然来源（如岩石风化、火山活动）和人为来源（如工业排放、农业活动、污水灌溉等）。人为活动是环境中重金属污染最主要的危险来源。根系摄取的双重途径图2：植物细胞中重金属的摄取和转运机制。展示重金属通过质外体和共质体途径进入根系，通过特定的转运蛋白（如ZIP、HMA、NRAMP家族）跨膜转运，最终装载到木质部进行长途运输到地上部分。植物根系通过两条平行的途径吸收土壤中的重金属离子：质外体途径定义与过程：重金属通过细胞壁和胞间空间的被动扩散，金属离子首先结合到果胶-纤维素细胞壁，然后扩散至内皮层屏障机制：在凯氏带处被富含软木脂的不透水屏障阻断，迫使离子进入细胞共质体途径定义与机制：重金属通过胞间连丝连接的细胞质连续体的主动转运，依赖质膜负电位和特异性转运蛋白优势特点：可控性强，能选择性吸收必需金属，排除有毒金属关键转运蛋白家族植物利用多套转运蛋白系统精确调控金属离子平衡：转运蛋白家族主要功能底物特异性组织定位 ZIP家族锌/铁摄取 $\ce{Fe^2+}$、$\ce{Zn^2+}$、$\ce{Cd^2+}$、$\ce{Mn^2+}$ 质膜，含8个跨膜结构域和组氨酸富集金属结合域 HMA家族 P型ATP酶，重金属外排 $\ce{Cu^2+}$、$\ce{Zn^2+}$、$\ce{Cd^2+}$、$\ce{Pb^2+}$ 质膜（OsHMA2,5,9）和液泡膜（OsHMA3） NRAMP家族天然抵抗相关巨噬细胞蛋白 Zn、Fe、Mn、Cu、Al、Ni、Cd、Co、Pb 质膜，含羰基肽键金属结合位点转运蛋白的分子识别机制：ZIP转运蛋白通过组氨酸富集的金属结合域和极性残基形成跨膜结合位点，精确识别不同金属离子的电荷半径和配位几何。NRAMP转运蛋白的跨膜结构域VI中的羰基肽键，以及一个甲硫氨酸和两个天冬氨酸残基，构成了金属离子选择性结合的分子基础。韧皮部装载与长途运输重金属从根系向地上部的转运涉及复杂的生理过程：径向转运过程：金属离子通过共质体连续体的径向移动，从外皮层到达中柱木质部装载机制：在木质部薄壁细胞中，金属离子从共质体转移到木质部导管长途运输途径：溶解在木质部汁液中的金属复合物随蒸腾流向上运输到叶片卸载与分配过程：在叶片组织中，金属离子从木质部卸载，分配到不同细胞区室关键调控点包括：木质素沉积调节金属进出中柱的通量，液泡保留减少向地上部的金属流，以及螯合剂分泌促进金属的可移动性（如组氨酸、柠檬酸）。金属结合蛋白：植物解毒的分子防线图3：不同金属结合蛋白引起的金属结合、螯合和区隔化机制。展示MTs和PCs如何与重金属离子配位结合，形成稳定的配合物，并通过ABC转运蛋白将金属-配合物区隔化到液泡中，从而实现重金属解毒。金属硫蛋白（Metallothioneins, MTs）发现与基本特征 MTs于1957年首次在马肾脏皮质中发现，作为结合Cd的蛋白质被鉴定。随后研究表明，MTs是广泛存在于原核生物（如蓝细菌Synechococcus）和植物中的低分子量、富含半胱氨酸的胞质蛋白。结构分类与组织特异性植物MTs根据半胱氨酸残基排列分为四个类型，各有特异的组织分布： MT类型主要组织位置金属解毒特异性生理功能 MT1 根系和叶片细胞 Cd解毒根系金属胁迫响应 MT2 根系和叶片细胞 Cu、Zn解毒叶片金属稳态 MT3 叶片和果实多种金属胁迫生殖组织保护 MT4 成熟种子和胚性细胞 Zn解毒种子萌发和早期生长结构-功能关系的分子基础：MTs的金属结合域富含硫醇基团，能通过配位键与重金属离子形成稳定的配合物。这种软硬酸碱理论的完美匹配——软酸金属（$\ce{Cd^2+}$、$\ce{Hg^2+}$、$\ce{Pb^2+}$）优先结合软碱硫醇——解释了MTs对重金属的高亲和力和选择性。 MTs的诱导表达调控 MTs的转录调控受到多重信号网络控制：金属离子直接诱导：Cd、Zn、Hg、Cu、Au、Ag、Co、Ni、Bi等金属直接激活MT基因转录 ROS信号介导：重金属诱导的氧化应激通过ROS信号激活MTs表达，维持氧化还原稳态激素信号通路：胁迫激素（如脱落酸、茉莉酸）参与MTs的诱导表达发育程序控制：不同MT类型在发育阶段特异性表达，确保组织保护机制的关键创新：MTs不仅作为金属螯合剂，还作为抗氧化剂和信号转导分子。研究表明，MTs能直接清除自由基，并通过调节细胞内金属离子稳态影响依赖金属的酶活性和信号转导。植物螯合肽（Phytochelatins, PCs）结构特征与生物合成 PCs是从谷胱甘肽（GSH）酶促合成的富含半胱氨酸的多肽，具有通用结构（-Glu-Cys）n-Gly，其中n=2-11。其C末端的甘氨酸在不同植物中可被丙氨酸、丝氨酸、谷氨酰胺或谷氨酸取代。合成途径的分子机制 PCs的生物合成由Glu-Cys二肽转肽酶（PC合酶）催化：前体合成：GSH由谷氨酸-半胱氨酸连接酶和谷胱甘肽合酶两步合成酶促聚合：PC合酶催化GSH的γ-Glu-Cys键转移，延长肽链结构多样化：根据植物种类，C末端氨基酸可被替换，产生结构多样性 PC合酶的调控机制：PC合酶的活性受重金属离子直接激活，其中$\ce{Cd^2+}$是最有效的激活剂，其次是$\ce{Cu^2+}$、$\ce{Ag^+}$、$\ce{Hg^2+}$、$\ce{Pb^2+}$、$\ce{Zn^2+}$。这种金属依赖的激活确保了PCs只在需要时合成，避免不必要的代谢消耗。 PC-金属配合物的形成与区隔化 PCs与重金属形成两类配合物，具有不同的稳定性和毒性：配合物类型分子量特征稳定性毒性区隔化位置 LMW PC-Cd配合物低分子量，简单结构较低，可逆结合仍有毒性胞质，临时储存 HMW PC-CdS配合物高分子量，含酸不稳定硫化物高，不可逆结合低毒性液泡，长期储存 HMW PC-CdS配合物的形成机制：在酸不稳定硫化物（$\ce{S^2-}$）存在下，LMW PC-Cd配合物进一步聚合，形成更稳定的高分子量配合物。这一过程增加了金属螯合的稳定性，降低了金属的生物毒性。 PCs的转运与液泡区隔化 PC-金属配合物的区隔化涉及ATP依赖的主动转运：胞质螯合：PCs在胞质中结合重金属离子，形成低毒性的PC-金属配合物主动转运：通过ABC转运蛋白（ABCC类型），PC-金属配合物被逆浓度梯度泵入液泡液泡储存：在液泡的酸性环境中，PC-金属配合物进一步稳定化，实现长期隔离解毒完成：金属离子与细胞组分隔离，保护关键代谢过程免受金属毒性区隔化的生理意义：液泡区隔化不仅降低胞质中游离金属离子浓度，还为金属胁迫解除后的潜在再利用提供储存库。某些超积累植物能通过液泡区隔化积累异常高浓度的重金属而不表现毒性。 MTs与PCs的协同保护网络功能互补与分工协作 MTs和PCs在植物重金属解毒中形成功能互补的协同网络：金属选择性差异 MTs：主要解毒Cu、Zn、Cd，通过半胱氨酸硫醇基团配位 PCs：广谱螯合$\ce{Ag^+}$、$\ce{Hg^2+}$、$\ce{Pb^2+}$、$\ce{Zn^2+}$、$\ce{Cd^2+}$、$\ce{Cu^2+}$，通过肽链骨架和硫醇基团协同作用时间响应动态 MTs：快速响应（分钟到小时），通过预存mRNA和蛋白的快速激活 PCs：延迟响应（小时到天），需要从GSH重新合成空间分布特异性 MTs：组织特异性表达，不同MT类型在不同组织中优势表达 PCs：广泛分布，在几乎所有细胞类型中都可诱导分子机制的交叉调控 MTs和PCs系统通过多重信号通路相互协调：共同上游信号：ROS爆发和$\ce{Ca^2+}$信号同时激活MTs和PCs的表达共享抗氧化系统：GSH既是PCs的前体，也作为MTs的辅助抗氧化剂金属稳态平衡：MTs主要调控胞质金属离子浓度，PCs负责液泡区隔化胁迫记忆效应：首次金属胁迫诱导的MTs和PCs表达产生胁迫记忆，提高后续胁迫的耐受性协同网络的关键创新：MTs和PCs的协同不仅体现在功能互补上，还体现在代谢互作上。研究表明，GSH合成的调控同时影响PCs的可用性和MTs的氧化还原环境，形成统一的胁迫响应网络。关键结论与批判性总结优势：从分子识别到系统保护 1. 结构-功能关系的精妙设计 MTs和PCs的保护机制体现了分子层面的精密设计：MTs的半胱氨酸富集结构域提供高亲和力金属结合位点，PCs的多肽骨架长度可调性提供金属选择性的结构基础。这种结构可塑性使植物能应对多样的金属胁迫。 2. 诱导表达的能量经济学 MTs和PCs的金属依赖性诱导表达避免不必要的蛋白合成和能量消耗。只有在金属胁迫确实存在时，才启动解毒机器的合成。这种按需保护策略在资源受限的环境中具有明显的选择优势。 3. 跨物种保护的普适性 MTs从原核生物到人类的广泛分布，PCs在植物、真菌和某些藻类中的保守存在，表明这类保护机制具有进化起源的古老性和功能的普适性。不同谱系的生物趋同演化出相似的金属解毒策略，说明了这一机制的有效性。局限性与未来方向分子识别的特异性机制：MTs和PCs如何区分必需金属（Cu、Zn）和有毒金属（Cd、Hg），避免必需金属的过度螯合导致微量元素缺乏？区隔化的可逆性：液泡中的金属是否能在胁迫解除后重新动员供正常代谢使用？PC-金属配合物的稳定性是否阻碍这一过程？转运蛋白的分子机制：ABC转运蛋白如何识别不同的PC-金属配合物？是否存在配合物选择性和转运效率的权衡？作物改良的应用潜力：能否通过基因工程过表达MTs或PCs提高作物的重金属耐性？这对植物修复和食品安全有何意义？未来研究方向：需要更多结构生物学研究揭示MTs和PCs的金属结合位点原子细节，更多体内动态成像追踪金属-配合物在细胞内的实时分布，以及更多系统生物学建模整合金属稳态网络的复杂调控。

Specific Sytems · 2026-06-23

聚合物自组装体系的自由能面构建：从指标到景观的综合综述

聚合物自组装体系的自由能面构建——指标选取、采样方法与景观解读的综合综述由AI调研和总结，请自行甄别信息正确性摘要自组装体系的自由能面（Free Energy Surface，FES）是理解纳米粒子稳定性、动力学路径和可控制备的核心工具。本文系统综述了构建自组装体系自由能面所需的指标体系、坐标组合、采样方法和可视化策略，重点关注类蛋白折叠漏斗状势能面在聚合物纳米粒子体系中的应用。候选指标涵盖最大团簇占比$f_{LCC}$、异质/同质接触数$C_{AB}/C_{AA}$、混合度指数$\chi_{mix}$、回转半径$R_g$、溶剂可及表面积SASA、结构因子$S(q)$、径向分布函数$g(r)$、配位数分布、网络指标、相互作用能分解、构型熵估计等。对于每项指标，给出数学定义、物理意义、与聚集稳定性的相关性、对噪声和采样的敏感性、计算复杂度，以及是否可由常见软件直接输出。推荐坐标组合包括$(f_{LCC}, R_g)$、$(C_{AB}, \chi_{mix})$、$(S(q), f_{LCC})$等。本文还提出漏斗质量评分函数，综合考虑自由能差、陷阱数目、粗糙度、产物生成概率等因素。对于软件可能缺失的功能，给出利用PLUMED、WHAM、MDAnalysis脚本等补充实现要点，并提供可视化推荐与Python/MDAnalysis代码示例。核心结论自组装FES构建的核心挑战是CV选择：单一距离型CV会混淆不同机制，需要”聚集程度坐标+构象紧凑度坐标”的二维设计 CV选择的核心逻辑：一个CV反映”聚集到什么程度”（如$f_{LCC}$、接触数、cluster size），另一个CV反映”构象是否紧密”（如$R_g$、链端距离、coordination number）推荐主图坐标组合为$(f_{LCC}, R_g)$，备选包括$(C_{AB}, \chi_{mix})$、$(S(q), f_{LCC})$、$(\langle z \rangle, E_{int})$等增强采样（Metadynamics、伞形采样、REST2等）对自组装体系至关重要，特别是路径复杂、能垒高的多步组装过程评估FES质量应使用漏斗评分函数，综合考虑全局稳定性、陷阱深度与数量、产物生成概率文献中明确构建自组装二维FES的工作仍不多，Varner等2025年的”距离+链构象”二维FES是最直接的方法学参考，体现了”过程+构象”的CV设计思想背景自组装作为软物质、纳米材料和生物大分子领域的核心现象，其热力学驱动力和动力学路径的理解是建立可推广结构-性质关系的关键。蛋白折叠领域的“漏斗势能面”概念为理解自组装提供了理论框架：折叠态对应能量漏斗底部，分散态对应漏斗顶部，中间过程需穿越不同深度的能垒。但与蛋白折叠不同，自组装体系（如聚合物胶束、纳米颗粒聚集体）涉及多体相互作用、组分多样性和可调参数空间，其自由能面构建面临独特挑战。近10-15年，分子模拟在自组装研究中扮演越来越重要的角色。从全原子MD到DPD粗粒化、从直接Boltzmann反演到Metadynamics增强采样，研究者发展了多种构建FES的方法。然而，自组装FES的系统综述仍相对缺乏，特别是在指标选择、坐标组合、采样策略和结果解读方面缺乏统一指导。本综述基于近10-15年文献，系统梳理构建自组装体系自由能面的指标与方法，重点关注聚合物-聚合物共组装形成的纳米粒子这一类重要体系。研究内容一、指标清单与评估构建自组装体系自由能面需要选择合适的集体变量（Collective Variable, CV）。以下逐项列出候选指标的定义、物理意义、计算表达式和评价。最大团簇占比 $f_{LCC}$ 定义为最大簇中粒子数$S_{\max}$与系统总粒子数$N$之比： [f_{LCC} = S_{\max} / N] 反映体系聚集程度，值越接近1说明大部分粒子聚成一团；在多体聚集时常用于区分集聚与分散态。物理上与相互作用强弱、温度、浓度相关。计算简单，可通过并查集算法或GROMACS中gmx cluster模块得到每帧$S_{\max}$。对含噪轨迹较稳健，但需足够采样显著信号。此指标可直接用于二维FES绘制，例如与能量或$R_g$联立分析。异质/同质接触数 $C_{AB}$, $C_{AA}$ 定义为不同种类（A-B）或同种类（A-A）粒子对在给定截断距离$r_c$内的数目： [C_{AB} = \sum_{i \in A, j \in B} \Theta(r_c - r_{ij})] 其中$\Theta$为阶跃函数。物理意义为互补组分间或自身间的结合程度。高$C_{AB}$意味着A/B混合良好，$C_{AA}$大则表明A粒子自团聚明显。该指标线性依赖截断参数，需经验选取，一般取第一近邻距离。计算可用MDAnalysis、MDTraj直接累加距离判据。对噪声较敏感，但能揭示组分间亲和性。适合与$f_{LCC}$组合绘制二维FES。混合度指数 $\chi_{mix}$ 定义为混合接触占比： [\chi_{mix} = C_{AB} / (C_{AB} + C_{AA} + C_{BB})] 反映A/B异质混合程度。若系统完全混合，$\chi_{mix} \to 1$，若自分相，$\chi_{mix} \to 0$。物理上表达共组装质量；易于从轨迹计算，只需接触数统计。对系统大小和配比敏感，需注意正则化（当某类接触极少时易发散）。通常与全局混合能判断结果一致。质心距/簇半径 $R_g$ 回转半径定义为所有原子到质心距离的均方平均： [R_g = \sqrt{\frac{1}{M} \sum_i m_i \mathbf{r}i - \mathbf{r}{CM} ^2}] 其中$M = \sum m_i$为总质量。$R_g$衡量结构整体尺寸和紧凑度，值小表示高度聚集。可直接用GROMACS（gmx gyrate）、MDTraj或MDAnalysis计算。受温度和形状变化影响，对于非团簇或高噪声轨迹可能误差较大。通常与接触数或簇大小联合使用。溶剂可及表面积（SASA）与结合面面积（AP）计算分子/纳米粒子聚集物的溶剂可及表面积，常用GROMACS（gmx sasa）或MDTraj方法。SASA减少通常意味着疏水驱动的聚集增强。AP一般指两组分接触界面的面积，也可用切换函数计算。公式较复杂（求球面网格交点或解析式），一般通过程序得出。受粒子形状、定义截断面影响；对反映暴露/接触面有用，但计算量较大。结构因子 $S(q$) 与峰位 $q^*$ 结构因子度量体系在动量空间的有序性： [S(\mathbf{q}) = \frac{1}{N} \left\langle \left \sum_j e^{-i \mathbf{q} \cdot \mathbf{r}_j} \right ^2 \right\rangle] 峰位$q^$对应主要结构周期（如晶格常数约$2\pi/q^$）。在无序系统$S(q) \approx 1$平坦，有序聚集时出现峰值。计算可用FFT方法或PLUMED的STRUCTURE_FACTOR功能得到角平均$S(q$)谱。$S(q$)对体系有序性敏感，对噪声和有限尺寸影响较大。适合揭示长程有序结构，但不适合小团簇局部自由能面。峰位$q^*$可作为聚集间距指标。径向分布函数 $g(r$) 定义为单位密度下在距离$r$处的粒子对分布概率： [g_{AB}(r) = \frac{1}{4\pi r^2 \langle \rho_B \rangle} \frac{1}{N_A} \sum_{i \in A, j \in B} \delta(r_{ij} - r)] $g(r$)刻画短程结构，如第一个峰对应近邻距。可用GROMACS（gmx rdf）或MDAnalysis计算。$g(r$)有助于确定配位数（通过积分至第一个谷）并作为坐标之一用于FES投影（例如$(R_g, q$)或$(R_g, g(r^*)$)）。对统计采样要求较高，曲线平滑性决定计算精度。配位数分布统计每个粒子在某截断半径$r_c$内邻居数的分布（histogram of coordination number）。可定义粒子$i$的配位数$z_i = \sum_{j \neq i} H(r_c - r_{ij}$)，然后统计$P(z$)。反映局部结构多样性，分布宽度增大意味着结构无序度高。通常采用第一近邻截断。易用MDAnalysis或numpy histogram快速得到。对噪声敏感，但适用于表征局部稳定性和链状聚集。邻接矩阵/网络指标将体系视为图，节点为粒子，边存在于两粒子$< r_c$。常用指标：节点度（平均度$\langle k \rangle$）、连通性（是否连通）、社区结构（模块度modularity）等。模块度定义为社区内连边密度与随机模型差异。高模块度表明粒子可分为几个紧密子簇。度分布、聚类系数等也可反映聚集组织。计算可借助NetworkX处理邻接矩阵。此类指标能够捕捉复杂结构性特征，但直观关联自由能不易量化，多作为定性辅助。相互作用能分解将系统总能分解为部件间相互作用，如A–B和A–A、B–B能；或范德华/静电分量。常定义A–B相互作用能为： [E_{int} = \sum_{i \in A, j \in B} [V_{LJ}(r_{ij}) + V_{elec}(r_{ij})]] GROMACS可用gmx energy或自写脚本分析能量输出。物理上直接反映组分间吸引力或排斥，适合评估稳定性。需要平衡剪切截断误差和静电处理方式。对小改动灵敏；作为坐标使用时一般与结构指标联合。熵估计方法构型熵可从采样的状态分布估算：如以简化状态簇概率$p_i$计算香农熵$S = -k_B \sum_i p_i \ln p_i$。或利用协方差矩阵计算Schlitter熵近似。方法依赖采样质量且对统计不足敏感，适合定性比较。对粗粒化自组装尤难准确定义，通常视为热力学态稳定性的补充说明。自由能估计方法常见方法包括直接Boltzmann公式$F(\mathbf{x}) = -k_B T \ln P(\mathbf{x}$)，最大似然WHAM、umbrella采样、metadynamics（偏置势逼近$F$）及Replica Exchange（REST2）等。其中Metadynamics可生成多维CV下的FES（偏置收敛为$-F$），WHAM用于合并多窗口样本。各方法要求设计适当CV或窗口，计算量随维度增大急剧增长。对动态特征复杂、自组装路径冗长体系，增强采样尤为重要。指标对比表指标物理意义敏感性/复杂度软件工具支持适用FES 最大团簇占比$f_{LCC}$ 系统聚合程度（1=全聚集）低（简洁统计） IMPULSE/GROMACS 常用，易与其他CV联合，如$(f_{LCC}, R_g$) 接触数$C_{AB}/C_{AA}$ 组分间/同分子内相互作用强度依距选敏感 IMPULSE/MDAnalysis 适合衡量混合态，可与$f_{LCC}$等联合绘制混合度$\chi_{mix}$ 异质混合程度（0分离，1混合）中等需自定义二维FES构建，如$(\chi_{mix}, f_{LCC}$) 回转半径$R_g$ 聚集物尺寸、紧凑性中（形状敏感） GROMACS/MDTraj 常用CV，可与团簇大小/接触数联合绘制 SASA/AP 暴露表面积/结合面面积（聚集稳定性指标）高（计算量大） GROMACS/MDTraj 通常与$R_g$等结合，表征疏水/亲水效应结构因子$S(q$) 长程有序性（峰值反映周期结构，$q^*$首峰位）中等 MDAnalysis/dynasor 对局域团聚不敏感，常用于长程有序结构分析径向分布$g(r$) 粒子近邻分布（峰值与配位相关）高（需大量采样） GROMACS 常用结构表征，可基于第一个峰值定义配位数坐标配位数分布局部结构差异（粒子邻居数分布）中 MDAnalysis 辅助指示结构均匀度，可做直方图分析网络指标（度、模块度等）体系连通性与社区结构（模块度高→分相）高（需计算图分） NetworkX/IMPULSE 可反映分相与混合，需配合其他指标综合评估相互作用能分解聚集驱动力（VDW/静电贡献）中（需二次计算） GROMACS/PLUMED 用于动力学分析，多与结构指标结合构型熵估计聚集态自由度大小高（统计需求大） MDAnalysis/PlaMO 常作为自由能面的补充说明，不直接作CV 自由能估计方法 FES计算技术（-kTlnP、WHAM、MetaD、REST2等）高（计算密集） PLUMED/GROMACS 强调方法而非坐标，用于构建FES本身每项指标需结合具体系统和需求评估：物理上是否能反映粒子稳定性或陷阱深度（例如$f_{LCC}$反映聚合程度，$R_g$/SASA反映紧凑度和暴露度）；对噪声/采样的敏感性（如$g(r$)和熵估计需大量采样，网络指标对小团簇波动敏感）；计算复杂度和可行性（简单几何量如$f_{LCC}$、$R_g$计算成本低，相互作用能需逐对累加）；是否可由现有软件直接输出（GROMACS/PLUMED自带RDF、$R_g$、能量分解；MDAnalysis可快速自定义计算）；以及能否用作联合CV绘制二维/三维自由能面（一般推荐2维组合，确保信号区分度较高且易于统计）。二、近期文献进展：二维/多维FES的CV类型详解本节聚焦2021-2025年明确构建聚合物（及聚合物-药物）纳米粒子自组装自由能景观的分子模拟研究，共分析10篇文献的CV设计、采样策略和FES构建方法。这些文献体现了CV设计的核心思想：一个坐标反映“聚集到什么程度”，另一个坐标反映“构象是否紧密”。 1. Varner et al., 2025 – 二嵌段共聚物胶束链交换机制详解体系：二嵌段共聚物胶束的链交换/链逃逸问题，强分凝条件下的单链逃逸过程。模拟方法：结合粗粒化MD和增强采样，计算链逃逸过程的二维自由能面，并用forward-flux sampling研究稀有事件动力学。 CV设计： distance-based CV：推动链从胶束中逃逸 core block end-to-end distance：确保链构象充分采样 FES构建：二维FES形式为$F(R, r) = -k_B T \ln P(R,r)$，其中$R$是链逃逸距离，$r$是core block end-to-end distance。作者从2D FES投影到1D自由能曲线：先由$F(R,r)$得到$P(R,r)=\exp[-\beta F(R,r)]$，再对构象变量积分得到$P(R)$，最后$\beta F(R)=-\ln P(R)$。关键发现：二维FES揭示两条几乎简并的逃逸路径：一条接近Halperin–Alexander的budding-like机制另一条是链逐珠（bead-by-bead）伸展逃逸计算不同core block长度下的自由能垒，发现其中一条路径的能垒满足$\beta\Delta F_{\rm barr}\sim N_{\rm core}^{2/3}$。方法学价值：这篇最适合借鉴“一个进程坐标 + 一个构象坐标”的二维FES设计。如果只用一个聚集距离/团簇大小坐标，可能会把不同机制混在一起；最好再加一个能区分“紧密团聚、拉伸桥连、松散网络”的构象坐标，比如$R_g$、core compactness、异质接触数、端到端距离、链拉伸度或局部密度。 2. Zhang & Meng, 2025 – 超分子二嵌段共聚物无序-有序转变详解体系：超分子二嵌段共聚物的disorder–order transition 模拟方法：比较共价二嵌段共聚物和超分子二嵌段共聚物，使用smart Monte Carlo模拟动力学路径，再用string method构建minimum free energy path CV设计：FES可写成$F(S_{\rm order}, f_{\rm bond})$形式，其中： $S_{\rm order}$：结构序参量 $f_{\rm bond}$：动态键比例关键发现：沿minimum free energy path讨论，得到transition state和free energy barrier，并将自由能分解为A–B interaction energy和association energy 方法学价值：这篇说明自组装FES不一定要写成$F(r)$，也可以写成$F(S_{\rm order}, f_{\rm bond})$或沿minimum free energy path讨论。对应到二元纳米药物体系，可以借鉴成$F(S_{\rm assembly}, f_{\rm hetero\ contact})$，其中$S_{\rm assembly}$是整体有序/组装程度，$f_{\rm hetero\ contact}$是HA-OP、载体-药物或A-B异质接触比例。这比单纯距离更贴近“共组装是否可控” 3. Gautham & Patra, 2022 – 聚合物接枝纳米粒子深度学习PMF详解体系：polymer-grafted nanoparticles 模拟方法：从小规模polymer-grafted nanoparticle cluster的MD轨迹中学习pair interaction，然后用deep-learning PMF-based simulation预测大量接枝纳米粒子的3D自组装结构，包括percolating networks和bilayers CV设计：核心CV是颗粒间相对位置/距离，PMF形式为$W_{\rm eff}(\mathbf{R}{ij}, \Omega{ij}, \ldots)$ FES构建：构建的是effective potential of mean force，而不是传统umbrella sampling得到的简单$F(q)$。用深度学习从小体系MD cluster轨迹中学习两颗polymer-grafted nanoparticles的有效相互作用，再把这个PMF放入更大规模的粒子模拟中方法学价值：不一定直接在全体系上构建高维FES，也可以先计算/学习“组装基元之间的PMF”，再用PMF预测大体系组装。这对大规模纳米药物自组装很现实，因为全体系$F(q_1,q_2,q_3)$采样困难；而基元-基元、载体-药物、HA-OP、OP-OP、HA-HA的pair/many-body PMF可以作为降维的热力学输入 4. Wu, Pal & Keten, 2023 – 隐式链粒子模型详解体系：matrix-free polymer grafted nanoparticles，以PMMA的chemistry-specific coarse-grained MD为测试体系模拟方法：提出implicit chain particle model，核心是用strain-energy mapping framework和PMF计算建立粒子间有效相互作用 CV设计：不是传统的单一两颗粒拉开距离PMF，而是把颗粒排列在close-packed lattice configuration中，通过bulk dilation/compression的strain-energy density匹配来推导有效相互作用。CV更接近于颗粒间距/晶格膨胀压缩程度 FES构建：构建的是coarse-grained effective interaction/PMF，形式上类似$W_{\rm eff}(a) \leftrightarrow U_{\rm strain}^{\rm CG-MD}(a)$，其中$a$是晶格尺度或颗粒间距相关坐标关键发现：ICPM可将计算速度相对CG-MD提升约$10^5$–$10^6$倍方法学价值：适合借鉴“从显式链模型中抽取有效自由能相互作用”的思想。对二元聚合物体系，如果全体系太大，可以先做若干代表性小体系PMF：例如HA-OP、OP-OP、HA-HA、载体-药物之间的effective PMF，再把这些PMF作为coarse-grained self-assembly landscape的输入 5. Munaò et al., 2018 – 原子级纳米颗粒PMF详解体系：atomistic silica/gold nanoparticles，包括bare gold nanoparticles和polyethylene-coated gold nanoparticles 模拟方法：用atomistic MD计算纳米颗粒之间的PMF。先用silica nanoparticles对比Hamaker理论来验证过程，再计算bare与polyethylene-coated gold nanoparticles的有效相互作用 CV设计：主要CV是两颗纳米颗粒之间的interparticle separation，即颗粒中心距离。对coated gold nanoparticles，还考察grafting density $\rho_g$对PMF的影响 FES构建：构建一维PMF：$W(r) = -k_B T \ln P(r)+C$，或等价地由约束/平均力积分得到$W(r)$ 关键发现： silica nanoparticles的PMF与粒径相关性不强，但较大颗粒出现明显surface interaction peak bare gold nanoparticles作用较弱 polyethylene-coated情况下，有效相互作用随接枝密度增强。中等$\rho_g$下PMF类似Lennard-Jones型，而高$\rho_g$、小间距下逐渐变为更强排斥方法学价值：适合借鉴“表面聚合物层如何改变纳米颗粒PMF”的分析逻辑。对纳米药物载体来说，表面修饰密度、链长、亲疏水性、电荷状态都可以通过pair PMF表征其聚集倾向或抗聚集稳定性 6. Egorov, 2011 – 立体稳定lock-and-key胶体详解体系：sterically stabilized lock-and-key colloids in polymer solution。key particle和lock cavity都设定为cylindrical shape，表面均匀接枝polymer chains，同时溶液中有free polymer chains 模拟方法：使用self-consistent field theory，计算sterically stabilized lock-key particles在polymer solution中的PMF CV设计：由于假设key和lock都沿$z$轴同轴排列，PMF是单坐标函数$W(z)$，其中$z$是lock-key separation FES构建：先通过SCF理论得到不同$z$下的Helmholtz free energy $A(z)$，再定义$\beta W(z) = \beta A(z) - \beta A(\infty)$ 关键发现：lock-key interaction可通过几何匹配、接枝密度、自由链体积分数和焓相互作用调控。尺寸匹配时depletion attraction最强，聚合物steric stabilization可使binding-unbinding transition更尖锐方法学价值：这篇的重点不是动态轨迹采样，而是用SCF直接计算自由能面。它适合借鉴到“载体表面接枝层/聚合物刷/溶剂化层调控粒子间可逆结合”的场景。如果二元结合几何明确，比如HA与OP局部复合、载体表面基元与另一个颗粒/膜片段结合，可以把$z$或$r$作为PMF坐标，并扫描链长、接枝密度、溶剂质量、电荷状态 7. Wang & Ferguson, 2017 – 环状聚合物拓扑约束体系：polyethylene ring polymers，包括trefoil knot、catenane、Borromean等拓扑状态模拟方法：用MD加nonlinear manifold learning，抽取低维自由能面 CV设计：不是纳米颗粒自组装，但它是很好的“非预设CV的聚合物自由能面”参考。从多指标中学习低维坐标，再构建$F(\xi_1,\xi_2)=-k_B T \ln P(\xi_1,\xi_2)$，其中$\xi_1,\xi_2$是数据驱动的慢变量 FES构建：这些FES揭示degree of polymerization和topological constraints如何影响可热访问构象、手性对称破缺、folding/collapse pathways 方法学价值：如果不想手动限定CV为距离/$R_g$/contact number，可以用manifold learning、tICA、diffusion map、PCA/UMAP之类从多指标中学习低维坐标，再构建FES。这会更像“真实景观”，但解释性要靠事后把$\xi$与$R_g$、接触数、团簇大小、混合度相关联 8. Sucerquia et al., 2022 – 银团簇ab initio metadynamics详解体系：$\ce{Ag5}$/$\ce{Ag6}$ clusters 模拟方法：用ab initio metadynamics，通过PLUMED和ASE接口计算free-energy landscape CV设计：选用的CV是radius of gyration和coordination number，用它们比较planar/non-planar isomers的相对自由能 FES构建：这对聚合物纳米粒子非常自然：$F(R_g, C_{\rm contact})$，低$R_g$、高contact number是紧密稳定颗粒；高$R_g$、低contact number是分散或松散网络；低$R_g$、低异质接触可能是单组分塌缩陷阱方法学价值：很直接展示了“非距离型二维CV”如何做纳米团簇FES。$(R_g)$和coordination/contact number对聚合物纳米粒子非常自然，物理含义很清楚 9. Balestra & Semino, 2022 – ZIF-8自组装早期阶段详解体系：ZIF-8早期成核与热分解模拟方法：用all-atom well-tempered metadynamics，明确探索了一组physically relevant collective variables，选择合适子集 CV设计：说明自组装FES的CV可以是coordination/connectivity、cluster size、ring count等，而不必是距离关键发现：结果包括Zn–N connectivity快速增加、小团簇蒸发并形成少数大团簇、$\ce{Zn(MIm)4^{2-}}$/$\ce{Zn(MIm)3^-}$复合物、4/5/6-membered rings等寿命差异方法学价值：虽然这是MOF，不是聚合物，但它说明自组装FES的CV可以是connectivity、cluster size、ring count。对二元聚合物体系，ring count不一定适用，但connectivity、largest cluster size、heterogeneous contact network是非常适用的 10. Méndez & Semino, 2024 – ZIFs自组装热力学体系：ZIF-4自组装的early nucleation和late growth 模拟方法：用reactive force field + well-tempered metadynamics CV设计：自由能分析聚焦金属离子配位变化、building block形成、ligand coordination saturation，以及不同晶面/多晶型增长的热力学差异方法学价值：对于多步自组装，CV可以按“化学连接/局部配位饱和度/生长单元加入程度”定义。对应到二元聚合物体系，可以类比为$F(n_{\rm AB\ contact}, n_{\rm core})$或$F(\text{hetero-coordination}, \text{cluster growth})$。这比单个距离更容易表达“成核—生长—稳定化”的过程文献CV类型总结 CV类型代表文献典型形式方法学价值 CV设计思想距离 + 链构象 Varner 2025 $F(r, R_{ee})$ 组装进程 + 链伸展/紧密度过程坐标 + 构象坐标结构序参量 + 动态键比例 Zhang & Meng 2025 $F(S_{\rm order}, f_{\rm supra})$或MFEP 有序组装程度 + 异质复合比例聚集程度 + 协同效应颗粒间PMF Gautham & Patra 2022; Munaò 2018 $W(r)$或ML-learned PMF A-A、B-B、A-B基元相互作用简化为有效相互作用压缩/膨胀自由能 Wu 2023 strain-energy mapped PMF 纳米颗粒紧密堆积稳定性体积变化 + 自由能响应拓扑/数据驱动低维坐标 Wang & Ferguson 2017 $F(\xi_1, \xi_2)$ 从多指标自动学习慢变量无预设CV，数据驱动 $R_g$ + coordination/contact number Sucerquia 2022; ZIF metadynamics文献 $F(R_g, CN)$, $F({\rm connectivity}, {\rm cluster\ size})$ 最适合转译成聚合物纳米粒子稳定性景观整体紧密度 + 局部连接度 CV设计的核心原则：成功的二维FES设计通常遵循“聚集程度+构象紧凑度”的逻辑——一个坐标描述“组装到什么程度”，另一个坐标描述“结构是否紧密”。这种设计能区分不同的组装机制（如紧密团聚vs松散网络，拉伸桥连vs塌缩成团）。三、关键符号与公式的物理意义为便于读者理解文献中的CV设计和自由能表达式，本节对常用符号和公式的物理意义进行解释。自由能面基本概念文献中的$F$、PMF、free-energy surface/landscape大多不是“势能面”($U$)，而是沿某些集体变量($q$)投影后的有效自由能： [F(q)=-k_B T \ln P(q)+C] 二维情况下： [F(q_1,q_2)=-k_B T \ln P(q_1,q_2)+C] 其中$P$是体系在某个坐标区域出现的概率，$k_B T$是热能尺度，$C$是任意零点。更低的$F$代表该状态更常出现、更热力学稳定；能垒$\Delta F_{\rm barr}$代表从一个稳定态到另一个状态需要跨越的自由能代价。核心参数符号表符号/表达式出现场景物理含义稳定性解释 $\beta=1/k_B T$ 多数自由能文章把自由能换算成热能单位 $\beta\Delta F$越大，越难跨越 $\Delta F_{\rm barr}$ Varner、Zhang & Meng、Seeger等初态到过渡态的自由能垒能垒越高，动力学越慢、结构越kinetically stable $N_{\rm core}$ diblock micelle 疏水核心block的聚合度 core越长，链逃逸越难 $\beta\Delta F_{\rm barr}\sim N_{\rm core}^{2/3}$ Varner budding-like过渡态的表面自由能尺度胶束链交换能垒随core block长度亚线性增长 $r$ Seeger、Munaò、Egorov等距离型反应坐标描述结合/解离或链逃逸 $R_{\rm ee}$ Varner core block端到端距离区分塌缩逃逸和拉伸逃逸 $S_{\rm order}$ Zhang & Meng 结构有序参数越高越接近有序组装相 $f_{\rm bond}$, $f_{\rm supra}$ supramolecular copolymer 动态键/超分子连接比例表示可逆连接网络成熟程度 MFEP Zhang & Meng 自由能面上的最低自由能路径可识别transition state和pathway $W(r)$ PMF文献距离$r$下的平均力势低谷代表稳定结合，高峰代表排斥/能垒 $W_{AA}$, $W_{BB}$, $W_{AB}$ 对二元体系的类比同质/异质组分PMF 判断共组装还是自聚集 $R_g$ cluster/metadynamics文献回转半径，整体紧密度低$R_g$通常更紧密 $CN$ cluster/metadynamics文献 coordination/contact number 高CN表示局部连接更多 $F(R_g,CN)$ 纳米团簇FES 紧密度+局部连接二维景观可区分松散态、紧密态、亚稳态 connectivity MOF自组装文献关键连接/配位数量表示成核和网络形成程度 cluster size 自组装文献团簇大小表示成核、生长、并合 $\xi_1$,$\xi_2$ manifold learning FES 数据驱动慢变量可发现非人工预设的构象盆地典型公式的物理意义 1. Varner的能垒标度律 [\beta\Delta F_{\rm barr}\sim N_{\rm core}^{2/3}] 其中$\beta=1/k_B T$，$\Delta F_{\rm barr}$是链逃逸能垒，$N_{\rm core}$是疏水核心block的聚合度。$2/3$次方来自Halperin–Alexander budding-like机制的物理图像：逃逸链在过渡态中形成一个类似“球状芽”的globular transition state，其表面自由能随体积/链长的$2/3$次方增长。核心意义：胶束稳定性不是简单随链长线性增加；在budding-like逃逸路径中，能垒近似随核心链段长度的表面积尺度增长。 2. Zhang & Meng的二维FES [F(S_{\rm order}, f_{\rm bond})] 其中$S_{\rm order}$是结构有序参数，$f_{\rm bond}$或$f_{\rm supra}$表示形成supramolecular bonds/supramolecularly connected chains的比例。核心意义：自组装路径不仅取决于结构是否有序，也取决于可逆连接/结合网络是否形成。动态键可能降低或改变能垒，但也可能引入中间态和路径复杂性。 3. Egorov的SCF自由能定义 [\beta W(z) = \beta A(z) - \beta A(\infty)] 其中$A(z)$是lock-key距离为$z$时的Helmholtz free energy，$A(\infty)$是两者相隔无限远时的自由能，$W(z)$是相对于无限远分离状态的PMF。核心意义：聚合物刷、自由链耗竭作用和几何匹配共同决定颗粒识别/结合的自由能。 4. 纳米团簇的二维FES [F(R_g, CN)] 其中$R_g$是回转半径，描述团簇整体尺寸/紧密度；$CN$是coordination number，描述原子之间的局部配位/接触程度。核心意义：低$R_g$、高CN的盆地通常对应紧密稳定构型；高$R_g$、低CN对应松散构型；中间盆地可能对应亚稳态异构体。对聚合物纳米颗粒，$CN$可以替换成contact number：$F(R_g, C_{\rm contact})$。 5. Minimum Free Energy Path (MFEP) MFEP是自由能面上从初态到终态最可能经过的低自由能路径。对于disorder–order transition，它大致表示： [\text{disordered state} \rightarrow \text{transition state} \rightarrow \text{ordered state}] 沿MFEP可以定义： [\Delta F_{\rm barr}=F_{\rm TS}-F_{\rm initial}] 其中$F_{\rm TS}$是过渡态自由能，$F_{\rm initial}$是初态自由能。这个能垒越高，转变越慢；中间有多个局部极小值，就说明路径上有metastable intermediates或kinetic traps。 CV选择的总原则不同类型的CV适用于不同的自组装分析需求：距离$r$：适合描述“结合/解离”过程，如颗粒靠近/远离、链逃逸等 $R_g$、contact number、coordination、cluster size：适合描述“颗粒是否紧密稳定”，反映聚集体整体紧密度和局部连接程度 $S_{\rm order}$、$f_{\rm bond}$、network/connectivity：适合描述“是否形成有序、协同、可控的组装结构”，反映组装质量和协同效应 $\xi_1$,$\xi_2$：适合在人工CV不确定时用数据驱动方式寻找自由能景观坐标，通过流形学习发现非预设的慢变量这些符号和公式的核心是：通过合适的集体变量投影，将复杂的多维自组装过程降维到可理解、可计算的自由能景观，从而定量分析稳定性、动力学路径和可控性。四、推荐坐标组合与计算流程基于上述指标评估和文献分析，以下核心坐标组合可用于主图/备选图的自由能面构建。CV设计的核心思想是：一个坐标反映“聚集程度”（如$f_{LCC}$、接触数），另一个坐标反映“构象紧凑度”（如$R_g$、链构象），这样可以区分不同的组装机制和路径。组合1：$(f_{LCC}, R_g$) $f_{LCC}$捕捉聚集程度，$R_g$表征整体尺寸，两者可区分紧密团簇与分散态。计算流程：数据提取：逐帧用MDAnalysis或自定义脚本确定最大簇大小并归一化得$f_{LCC}(t)$；用GROMACS或MDTraj计算$R_g(t)$ 直方化/KDE：对结果进行二维直方化或核密度估计，计算每个格点概率$P(f, R_g)$ 归一化：归一化自由能$F = -k_B T \ln P$ 误差估计：建议使用细致的网格（bin宽视数据散布调整），通过多次Bootstrap估误差增强采样：缺采样区域可考虑温度扩展或Metadynamics增强（比如在$f_{LCC}$方向施加偏置）以填补低概率区间组合2：$(C_{AB}, C_{AA})$或$(C_{AB}, \chi_{mix})$ 该组合直观衡量组分混合程度。计算流程：数据提取：根据距离截断计算每帧$C_{AA}(t), C_{AB}(t)$；或计算混合度$\chi_{mix}(t)$ 直方图构建：构建二维直方图$P(C_{AA}, C_{AB})$（或$P(\chi_{mix}, C_{AB})$）归一化：归一化得$F$面平滑处理：由于接触统计可能波动大，需足够长轨迹并可适用滑动窗口平均平滑增强采样：增强采样建议对非混合态构造预偏置组合3：$(S(q^*), f_{LCC})$ 适用于有序自组装体系，如纳米晶体。计算流程：结构因子计算：对每帧计算小范围$q$的$S(q)$（用FFT或Dynasor库）峰位提取：提取主峰$q^$或对应峰值$S(q^)$ FES构建：与$f_{LCC}$一起构建FES：$F(f_{LCC}, S(q^*))$ 方法学价值：此组合将聚集程度与长程有序性结合，可显著区分混沌聚集与形成晶格结构的情况。组合4（备选）：$(\langle z \rangle, E_{int}$) 使用每帧平均配位数$\langle z \rangle$（通过积分$g(r$)首谷得到）与体系总相互作用能$E_{int}$，构建$F(\langle z \rangle, E_{int}$)面。此图可揭示形态相变中结构紧凑度与结合能的关系。组合5（备选）：$(Q, R_g$) 适合分析分相体系。先构造邻接图计算社团模块度$Q(t$)，然后与$R_g(t$)配对。$F(Q, R_g$)可显示不同分相（高$Q$小$R_g$）和混合状态（$Q \approx 0$大$R_g$）区域。流程示意 graph TB Traj([轨迹文件]) --> Pre Pre --> ComputeMetrics{计算指标} ComputeMetrics --> fLCC[f_{LCC}] ComputeMetrics --> RG[R_g] ComputeMetrics --> Contacts[C_{AB},C_{AA}] ComputeMetrics --> Struct[SASA, g(r)] ComputeMetrics --> Energy[E_{int}] fLCC --> Binbin[二维直方或KDE] RG --> Binbin Contacts --> Binbin Struct --> Binbin Energy --> Binbin Binbin --> FreeE["自由能计算$F=-k_BT\ln P$"] FreeE --> Plot[绘制二维等高或色图] 五、评分函数与实现建议为量化自由能面“漏斗”特性，可定义评分函数综合考虑全局稳定性和结构多样性。例如建议的漏斗评分： [S_{\rm funnel} = w_1 \Delta F_{\rm global} - w_2 N_{\rm trap} - w_3 {\rm Roughness} - w_4 \sigma_{\rm basin} + w_5 P_{\rm prod}] 其中：$\Delta F_{\rm global} = F_{\rm dispersed} - F_{\rm assembled}$为主井深度差（全局稳定性），$N_{\rm trap}$为能量陷阱（局部极小）数量，Roughness为势能面粗糙度度量（如主路径振荡总和），$\sigma_{\rm basin}$为主要基态宽度（椭圆拟合方差），$P_{\rm prod}$为从游离态演化到聚集态的“产物概率”。各权重$w_i$可根据系统需求调节（例如强调稳定性则增大$w_1$）。该函数可结合路径分析工具计算，参考蛋白折叠领域“foldability score”概念。关键结论与批判性总结综述了构建自组装体系自由能面所需的完整指标体系，包括物理意义、敏感性、软件支持和FES适用性的全面评估推荐的核心坐标组合为$(f_{LCC}, R_g$)、$(C_{AB}, \chi_{mix}$)、$（S(q^*), f_{LCC}）$等二维设计，能够兼顾稳定性与形态区别提出漏斗评分函数$S_{\rm funnel}$，综合考虑全局稳定性、陷阱深度与数量、产物生成概率给出软件缺失功能的补充方案（PLUMED插件、WHAM工具、MDAnalysis脚本等）梳理了近10-15年自组装FES相关文献的6类CV设计：距离+链构象、序参量+动态键比例、颗粒间PMF、压缩/膨胀自由能、拓扑/数据驱动坐标、$R_g$+配位数局限性现有文献中明确构建自组装二维FES的工作仍不多，许多自组装模拟只报告micelle、vesicle、lamella、cluster size、$R_g$、$S(q$)、morphology diagram，并未真正构建$F(q) = -k_B T \ln P(q$)或PMF 漏斗评分函数的权重选择目前缺乏系统指导，需要根据具体体系调节增强采样方法的选择在自组装体系中尚无统一标准，不同方法各有优劣自组装FES的实验验证仍然困难，特别是动力学陷阱和亚稳态结构分布的对应关系粗粒化模型的选择会显著影响FES结果，不同分辨率的模型可能给出不同的漏斗形貌后续工作优先级对推荐坐标组合做实际模拟验证，检查是否合理区分聚集态实现并测试上述评分函数，评估能否量化漏斗质量针对软件功能空缺，开发补充脚本或PLUMED模块使用增强采样（如并行Metadynamics、REST2等）提高FES可靠度基于生成的FES提出可实验验证的预测（如体系在不同参数下的相行为）以上结论均基于现有文献与官方文档所述原理。未来可持续关注相关软件更新和新的案例研究。对于自组装体系自由能面构建的进一步工作，建议优先关注二维/多维FES设计和数据驱动CV抽取两个方向，它们将是未来改善现有方法学局限的关键。

Specific Sytems · 2026-06-11

从合作自组装到水溶性超分子聚合物：粗粒化模拟揭示BTA纤维的逐步生长机制

BTA水溶性超分子聚合物——从合作自组装到粗粒化模拟的逐步聚合机制本文信息标题：从合作自组装到水溶性超分子聚合物：粗粒化模拟研究作者：Davide Bochicchio，Giovanni M. Pavan* 发表期刊：ACS Nano 发表时间：2017年（Volume 11, Pages 1000-1011） DOI：https://doi.org/10.1021/acsnano.6b07628 单位：瑞士南部应用科学与艺术大学创新技术系引用格式：Bochicchio, D.; Pavan, G. M. (2017). From Cooperative Self-Assembly to Water-Soluble Supramolecular Polymers Using Coarse-Grained Simulations. ACS Nano, 11, 1000-1011. https://doi.org/10.1021/acsnano.6b07628 代码与数据：研究使用标准MARTINI力场，未提供独立代码库摘要超分子聚合物通过非共价自组装形成，因其动态仿生特性而极具研究价值。理解其行为需要在保持单体结构和相互作用高分辨率的同时访问其动力学，这在水溶液中尤其困难。聚焦于1,3,5-苯三甲酰胺（BTA）水溶性超分子聚合物，我们开发了一种可迁移的粗粒化模型，能够在水中研究BTA超分子聚合，同时在描述单体间关键相互作用（疏水、氢键等）、自组装合作性以及纤维中有序放大方面与全原子模型保持显著一致性。这使我们能够监测BTA纤维在动态聚合过程中单体间关键相互作用（包括氢键）的放大。我们的分子动力学模拟揭示了逐步合作聚合机制：首先是BTA单体在水中快速疏水聚集，随后是这些无序聚集体缓慢重组为有序定向的低聚物，超分子聚合物生长则以更慢的速率进行。我们通过与实验证据对比挑战了我们的模型，成功捕捉了温度变化和单体结构的微妙变化对聚合及纤维性质的影响。这项工作提供了BTA在水溶液中自组装的多尺度时空表征，为研究基于BTA的超分子聚合物构建结构-性质关系提供了有用的平台。核心结论开发了基于MARTINI力场的可迁移BTA粗粒化模型，能够在微秒尺度监测水溶液中的自组装过程揭示了逐步合作聚合机制：快速疏水聚集（~20 ns）→ 无序聚集体重组为有序低聚物（~30-16 μs）→ 纤维慢速生长两种BTA-CG模型（显式氢键的BTA-CG_C和隐式氢键的BTA-CG_0）都能准确重现全原子模型的相互作用放大效应和有序放大效应成功预测了疏水侧链长度变化（C12→C9/C6/C3）对聚合的抑制效应，与Meijer团队的实验结果一致模型能够模拟温度诱导的纤维解聚（95°C），验证了其研究环境条件变化的能力背景超分子聚合物通过非共价相互作用连接单体，近年来因其动态和自适应特性受到广泛关注。这些自组装结构的实验级研究极其困难，尤其是在水溶液环境中。这导致了分子层面自组装控制因素的普遍缺失。在这一背景下，分子模拟已成为研究BTA及其他类型超分子聚合物的重要工具。之前的全原子MD模拟研究了肽两亲超分子纤维，提供了关于组装结构和自组装机制的深入见解，但仍受限于可探索的空间和时间尺度，无法访问自组装机制和超分子聚合物动态行为。为解决这些限制，一种策略是开发自组装单体的粗粒化模型。已有重要努力开发CG模型来模拟CG肽两亲单体在水溶液中自发聚集成超分子纤维，获得关于组装结构和自组装机制的有用见解。 MARTINI粗粒化力场作为“通用”CG力场具有高可迁移性的优势，许多化学功能团/基团已经可用并经过测试，便于单体定制。这对研究多种自组装单体变体以建立结构-性质关系至关重要。创新点可迁移的BTA-CG模型：基于MARTINI力场开发两种变体（BTA-CG_C显式氢键、BTA-CG_0隐式氢键），在描述单体在水溶液中的行为、单体-单体相互作用和自组装合作性方面与全原子模型保持显著一致性逐步合作聚合机制：首次在微秒尺度直接观测到BTA自组装的三个阶段——快速疏水聚集、慢速有序重组、纤维慢速生长实验验证的预测能力：成功预测疏水侧链长度变化（C12→C9/C6/C3）对聚合的抑制效应和温度诱导的纤维解聚（95°C）相互作用与有序的双重放大：CG模型重现了全原子水平的疏水效应放大（SASA降低）、氢键能量放大和堆积有序放大（g(r)峰高增加）研究内容一、BTA单体与粗粒化模型设计 1,3,5-苯三甲酰胺（BTA）单体通过核心-核心堆积和三重氢键形成一维自组装（Figure 1c）。研究采用的BTA单体由疏水十二烷基间隔物（C12）和四聚乙二醇（PEG）末端单元组成（Figure 1a）。粗粒化模型基于MARTINI力场构建。对于芳香核和侧链，使用了最近优化的MARTINI参数。CG表示的BTA酰胺基团构成了参数化的关键点。由于氢键的方向性对MARTINI方案提出了相关挑战（MARTINI中所有相互作用通常由非方向性Lennard-Jones势表示），研究构建了两种BTA-CG模型变体，仅在酰胺基团描述上有所不同： BTA-CG_C：包含BTA-BTA氢键的显式处理，通过AMD_c珠子的刚性偶极子（±q）的静电相互作用实现方向性 BTA-CG_0：酰胺基团（AMD_0）由标准MARTINI珠子表示，BTA-BTA氢键隐式包含在AMD_0-AMD_0 LJ相互作用中两种模型的AMD_c和AMD_0珠子都经过优化，在CG水平重现全原子水平观察到的核心+酰胺二聚自由能曲线。图1：BTA单体结构及其粗粒化模型——展示BTA的化学结构、全原子模型和两种CG变体。图1a：BTA单体的化学结构图1b：BTA单体在水中的平衡全原子模型图1c：通过核心-核心堆积和三重氢键进行一维自组装，导致纤维生长图1d：基于MARTINI的BTA核和侧链粗粒化模型。BTA-CG_C和BTA-CG_0模型在酰胺基团描述上不同（分别包含或不包含显式单体间氢键处理）图1e：MD模拟得到的单个BTA单体在水中的回转半径和溶剂可及表面积（SASA）数据，AA和CG水平的一致性在单个单体水平，BTA-CG模型的回转半径和溶剂可及表面积（SASA）与全原子BTA单体在显式水中的数据拟合良好（Figure 1e），证明两种BTA-CG模型都能很好地代表BTA单体在水中的行为。二、自组装合作性：相互作用放大与有序放大研究构建了两个预堆积系统（160和480），由160和480个初始延伸的BTA-CG_C单体沿主纤维轴通过周期性边界条件复制，形成“无限”BTA纤维。疏水效应放大随着BTA堆积体尺寸增大，每个BTA的SASA变化（ΔSASA）持续下降（Figure 2b），证明疏水效应在纤维生长过程中被放大。这与全原子水平最近观察到的行为一致。氢键能量放大在BTA-CG_C系统中，每个BTA的等效氢键平均数和每个BTA的平均氢键能量都随组装尺寸增加而增加（Figure 2c）。值得注意的是，将氢键能量除以饱和时每个BTA的平均氢键数（2.2），得到水溶液中单个氢键的平均能量约为-1.6 kcal mol⁻¹，与水溶液中肽结构的单个氢键能量（-1.58 kcal mol⁻¹）惊人一致。堆积有序放大 BTA-CG_C超分子聚合物中堆积有序的放大通过径向分布函数监测。随着BTA-CG_C组装尺寸增大，g(r)峰的高度增加，在最大系统中达到饱和（Figure 2d）。这种行为再次与全原子水平最近观察到的行为一致。图2：BTA自组装的合作性——相互作用放大与有序放大——展示BTA低聚物中关键相互作用和堆积有序的放大。图2a：不同尺寸的BTA堆积体图2b：疏水效应——不同尺寸堆积体中每个BTA的SASA变化（ΔSASA）随组装尺寸的变化图2c：BTA-CG_C系统中每个BTA的等效氢键平均数和每个BTA的平均氢键能量随组装尺寸的变化。CG模型中关键相互作用（疏水和氢键）的放大与全原子水平最近观察到的结果一致图2d,e：堆积有序放大到生长中的BTA超分子聚合物。不同尺寸系统中BTA核的径向分布函数，针对BTA-CG_C和BTA-CG_0两种模型三、BTA自组装机制：逐步合作聚合由160个BTA-CG_C单体最初分散在溶液中的分子系统提供了一个有趣的案例研究（Figure 3a）。在CG-MD模拟的早期步骤（前~0-20 ns），单体在溶液中非常快速聚集，通过溶液中BTA聚类数量的急剧减少来证明（Figure 3b，红色虚线）。 Φ指数（BTA核心间的平均配位数）在CG-MD模拟时间内的演化表明，直到约30 ns的CG-MD模拟，BTA聚集体仍然无序（Figure 3b，红色实线）。Φ指数随后显著增加，在16 μs CG-MD后达到最大值约1.8。在此CG-MD模拟时间内，溶液中自发形成的最大BTA组件是一个具有细长形状的纤维片段——一个BTA 85聚体（Figure 3a）。图3：BTA在水溶液中的自组装机制——展示逐步合作聚合过程的动力学和热力学特征。图3a：160 BTA-CG_C自组装系统的起始和平衡（最终）快照（为清晰起见，仅显示CG-MD期间自发形成的最大聚类中的BTA单体，即BTA 85聚体）图3b：160 BTA自组装系统（BTA-CG_C和BTA-CG_0）的BTA聚类数量和序参数Φ（核心-核心配位）随CG-MD模拟时间的变化图3c：CG-MD轨迹作为平均聚类大小和Φ的函数。该图显示了自组装的逐步过程图3d：BTA-CG_C系统自组装的二维自由能景观，作为每个BTA的平均氢键数和每个BTA的平均SASA的函数 Figure 3c中的CG-MD轨迹图显示了一个S形自组装路径，可总结如下：首先，单体快速自组装，形成无序聚集体；当达到一定尺寸（本例中约~20-30个BTA）时，这些聚集体经历结构重组，演化为有序（堆积）BTA低聚物；纤维生长随后通过这些有序组装的融合进行（图中右上区域的离散步骤）。为了更好地描述BTA聚合机制，从CG-MD模拟获得了自组装过程的自由能景观（Figure 3d），表示为BTAs的平均SASA和每个单体的平均氢键数的函数。较浅的颜色对应于能量最不利和最少访问的构型，而最深的颜色识别最有利和最多访问的构型。四、结构修饰和温度变化的影响 Meijer团队最近的实验研究表明，BTA在水溶液中的聚合对单体结构中疏水/亲水平衡的微妙变化极其敏感。虽然使用C12或C11烷基间隔物产生几乎相同的超分子纤维，但将后者替换为C10被发现会抑制BTA超分子聚合物的形成。研究挑战了BTA-CG模型与这些实验证据的一致性。为此，构建了具有较短疏水间隔物（分别包含3、2和1个疏水MARTINI珠子）的BTA-CG_C模型，对应于C9、C6和C3烷基间隔物（Figure 4a）。 CG模型与实验证据显示出一致性。在C6和C3 BTA-CG_C系统中，超分子聚合化完全受到阻碍（Figure 4b-d）。在模拟过程中仅自发形成非常小的BTA组件，通过平均聚类大小和形成的最大BTA聚类的大小来证明。为了测试CG模型模拟环境条件变化的能力，研究了温度变化的影响。当将480*C12 BTA-CG_C“无限”纤维模型的温度从27°C升高到95°C时，观察到纤维的解聚（Figure 4e）。在CG-MD运行期间，聚类数量增加而最大BTA聚类大小减小，证明纤维在高温下不稳定。图4：单体中的结构修饰和温度变化的影响——验证CG模型预测结构变化效应的能力。图4a：BTA单体变体的CG表示，其中侧链中的烷基疏水间隔物被系统性地缩短图4b：160 C6 BTA自组装系统的起始和最终快照图4c：不同160自组装系统的平均聚类大小，即标准C12 BTA和三种C9、C6和C3 BTA变体在室温（27°C）下的CG-MD模拟，以及标准C12 BTA在高温（95°C）下的模拟图4d：高温（95°C）下480*C12 BTA“无限”纤维在CG-MD运行期间解聚；分别显示CG-MD模拟期间的聚类数量和系统中最大BTA聚类的大小图4e：从室温下水溶液中480*BTA-CG_C无限纤维模型的CG-MD模拟中获取的平衡快照关键结论开发的BTA-CG模型成功跨越了全原子分辨率和微秒时间尺度之间的鸿沟，能够在保持关键相互作用精度的同时研究BTA超分子聚合的动态过程揭示的逐步合作聚合机制（快速疏水聚集→慢速有序重组→纤维慢速生长）为理解超分子聚合物形成提供了新的理论框架 CG模型对结构修饰（疏水侧链长度）和环境变化（温度升高）的预测能力得到了实验验证，证明其在理性设计BTA基超分子聚合物方面的价值研究提供了BTA在水溶液中自组装的多尺度时空表征，为建立结构-性质关系和理解超分子聚合物动态行为奠定了基础局限性粗粒化模型虽然保持了关键相互作用的精度，但可能丢失某些原子级细节，如具体水分子排列或精细的氢键几何模拟时间尺度（微秒级）虽然远超全原子模拟，但对于某些非常缓慢的自组装过程可能仍不足够研究主要关注BTA体系，模型的可迁移性在其他类型超分子聚合物中需要进一步验证实验验证主要集中在结构变化和温度效应，对其他环境因素（如pH、离子强度）的预测能力未充分测试粗粒化过程中对氢键方向性的处理（显式vs隐式）可能影响某些体系的精度，需要根据具体系统选择合适的模型变体对于研究超分子聚合物、自组装过程和粗粒化模拟的科研工作者，这项工作提供了一个强大且经过验证的工具，用于在保持足够精度的前提下探索超分子聚合物在水溶液中的形成机制和动态行为。结合MARTINI力场的高可迁移性，该模型可推广到其他类型的自组装系统，为超分子材料的理性设计提供了新途径。

Specific Sytems · 2026-06-11

如何从头设计具有非生物催化机制的金属酶？深度学习设计锌基酮还原酶实现高效不对称合成

如何从头设计具有非生物催化机制的金属酶？深度学习设计锌基酮还原酶实现高效不对称合成本文信息标题：De Novo Design of Miniature and Efficient Metallo-Ketoreductases 作者：Yiling Xu, Yunhao Li, Hangwen Zheng, Elliot S. Delfosse, Yuxuan Gao, David Baker, Pengfei Ji 发表期刊：Journal of the American Chemical Society 发表时间：2026年4月28日 DOI：https://doi.org/10.1021/jacs.6c00732 单位：浙江大学化学系，华盛顿大学蛋白质设计研究所引用格式：Xu, Y., Li, Y., Zheng, H., Delfosse, E. S., Gao, Y., Baker, D., & Ji, P. (2026). De Novo Design of Miniature and Efficient Metallo-Ketoreductases. Journal of the American Chemical Society. https://doi.org/10.1021/jacs.6c00732 代码与数据：设计模型数据（https://zenodo.org/records/15580524）摘要本文报道了一种深度学习引导的工作流程，用于从理论活性位点从头设计金属酮还原酶，实现通过非生物氢负离子转移机制的不对称酮还原。设计的微型酶仅含130个残基，在全细胞条件下表现出高催化性能，$k_{\text{cat}}/k_{\text{uncat}}$最高达到$1.4 \times 10^6$，转换数（TON）达到19000，对映体过量（e.e.）值最高达到98%，底物范围广，并能实现二酮的区域选择性还原。值得注意的是，设计支架对90°C处理表现出优异的热稳定性，热稳定性超过天然混杂还原酶，并对多种有机溶剂耐受。核心结论 130残基微型酶，分子量仅13.8 kDa，显著小于天然hCAII（29 kDa）催化效率：$k_{\text{cat}}/k_{\text{uncat}}$最高达到$1.4 \times 10^6$，TON高达19000 立体选择性：e.e.值高达98%，对环酮（cyclic ketones）表现优异稳定性：熔融温度$T_m$达93.8°C，耐受30%有机溶剂底物范围：dMKR本身覆盖16种酮底物，产率高达99%，e.e.值$>90\%$；后续V88A和I92L变体进一步扩展到更多环酮、芳基酮和杂芳基酮区域选择性：对1-phenylbutane-1,3-dione实现区域选择性还原背景氧化还原酶在合成化学工业中尤为重要，特别是在药物和精细化学品的对映体中间体生产中，其中对映体纯度对生物活性至关重要。尽管天然酶具有优异的催化性能，但其催化功能通常受限于天然进化的化学机制，难以直接覆盖非生物转化反应。传统酮还原酶多依赖NADPH等天然辅因子，而这篇文章关注的是硅烷供氢、锌氢中间体参与的非天然还原路径。锌氢负离子催化机制：氢负离子来源于硅烷而非溶剂，反应通过Zn-H中间体进行，而非硅烷直接插入的三元机制。具体而言，这类非自然反应利用硅烷（如苯硅烷，$\ce{PhSiH3}$）作为终端还原剂和氢负离子（hydride）供体。在催化过程中，硅烷首先将一个氢负离子转移给酶活性中心的锌离子，形成瞬态的“锌-氢中间体”（zinc-hydride intermediate）；随后，该中间体上的氢负离子再进攻（插入）酮的羰基碳，完成不对称还原。金属特异性验证显示，去除$\ce{Zn^{2+}}$后活性完全丧失，回补$\ce{Zn^{2+}}$恢复完整活性，证明dMKR是锌依赖金属酶。目前，计算策略已成功设计了用于酸碱化学的酶，但从头设计的氧化还原酶例子仍然很少。金属酶在自然界的催化反应中扮演核心角色，但从头设计金属酶面临巨大挑战，需要精确控制金属配位环境、底物结合口袋和反应中间体稳定性。本文的核心思想：能否只保留理论活性位点的关键几何关系，再从头生成一个更小、更稳定、立体选择性可预设的蛋白支架。hCAII虽然已经能通过锌氢机制还原酮，但它并不是为这个反应进化出来的：分子量约29 kDa，含较长loop和trefoil knot等结构特征，作为可移植、可重设计的工业生物催化支架并不理想。关键科学问题如何从理论活性位点模型出发，设计具有非生物催化机制的金属酶？如何在保持催化活性的同时，大幅减小酶分子尺寸并提高稳定性？如何实现对多种酮底物的高对映选择性还原，包括环酮（cyclic ketones）和二酮（diketones）？如何通过计算设计精确控制区域选择性，实现二酮的特定位置还原？创新点深度学习引导设计：结合RFDiffusionAA、ProteinMPNN和AlphaFold2，从理论活性位点出发设计微型金属酶锌氢负离子机制：重点不在于发现锌氢酮还原本身，而在于首次把这一非生物还原机制植入从头设计的微型蛋白支架微型高效酶：130残基的微型酶明显小于29 kDa的天然hCAII，并在热稳定性、溶剂耐受性和部分选择性上表现更好优异稳定性：$T_m$达93.8°C，耐受高温和有机溶剂区域可控：实现对二酮底物的精确区域选择性还原研究内容设计方法与计算流程本文采用深度学习引导的从头设计策略，没有直接改造hCAII全蛋白，而是从hCAII的QM/MM优化活性位点中抽取关键几何约束，再让扩散模型生成新的蛋白骨架。具体步骤包括：理论活性位点构建：从人类碳酸酐酶II的QM/MM优化模型出发，固定$\ce{Zn^{2+}}$配位、底物和关键催化残基的相对位置。被迁移的关键残基包括三个配位组氨酸His94、His96、His119，辅助去质子化和静电稳定的Glu106，以及稳定烷氧负离子中间体的Thr199和Thr200 蛋白骨架生成：使用RFDiffusionAA生成8000个全新蛋白骨架，每个少于155个残基，具有多样化的α/β二级结构序列设计与筛选：通过ProteinMPNN在三个温度下设计序列，生成54990个序列，经AlphaFold2预测筛选得到104个蛋白结构；随后用RIFDock对这104个骨架进行苯乙酮对接，共生成了777个对接模型（同一蛋白骨架包含不同的配体结合姿态），再按结合界面参数、底物埋藏程度和几何等条件将其筛选到148个设计模型金属位点与界面精修：用Metal3D在三个组氨酸处引入$\ce{Zn^{2+}}$，再用RosettaScripts优化配体周围残基，得到7350个设计；经过严格几何筛选、第二轮ProteinMPNN/LigandMPNN设计、ColabFold预测和FastRelax，最终选出24个dMKR进行实验测试图1：计算设计工作流程与初始筛选。（a）dMKR的计算设计管线，包括关键催化残基识别、使用RFDiffusionAA从头扩散生成蛋白支架、配体和金属对接、Rosetta和MPNN方法序列设计、Colab版AlphaFold2结构预测、FastRelax最终评估和实验测试。（b）不同扩散家族的dMKR设计对acetophenone的还原活性评估。（c）除dMKR50外，产率$>50\%$和e.e.值$>50\%$的设计展示。催化活性与稳定性表征初始筛选和稳定性测试结果如下：初始活性筛选：24个从头设计的dMKR在大肠杆菌全细胞体系中测试苯乙酮还原，dMKR1、dMKR7和dMKR13显示出显著活性，产率$>20\%$，e.e.值$>50\%$ 最优设计dMKR50：来自扩散家族VII，经His-tag替换为Strep-tag后，在全细胞催化中达到98%产率和97% e.e.值，纯化酶产量达175 mg/L培养液对映选择性可以预设：dMKR50主要给出R构型1-phenylethanol，而另一个设计dMKR53给出S构型产物。原文还统计了产率$>5\%$且绝对e.e.值$>50\%$的12个设计，其中11个的产物构型与设计模型一致，说明活性位点几何对立体化学有可预测性热稳定性优异：圆二色谱显示dMKR在80°C仍保持折叠状态，熔融温度$T_m$为93.8°C，显著高于hCAII的58.8°C；dMKR在90°C孵育60 min后仍给出95%产率和91% e.e.值，而hCAII在90°C孵育2 min后完全失活有机溶剂耐受性：dMKR在30% hexane、IPA、EtOH、DMF和DMSO中均保持活性，其中30% DMSO中产率达到$>99\%$、e.e.值为98%。与hCAII的直接对照只在30% 1,4-dioxane条件下进行，hCAII产率从79%降至17%，而dMKR仍有63%产率和97% e.e.值图2：dMKR的热稳定性和有机溶剂耐受性。（a）远紫外圆二色谱显示dMKR在25°C和80°C的二级结构信号相近。（b）热变性曲线显示dMKR的$T_m$为93.8°C，而hCAII为58.8°C。（c, d）预热后再测催化活性，橙色代表dMKR，灰色代表hCAII；dMKR在60°C和90°C处理后仍保持较高活性，hCAII迅速失活。（e, f）蓝色柱为产率，橙色柱为e.e.值；dMKR在多种30%有机共溶剂中仍能工作，DMSO和DMF甚至提高了疏水底物1aa的转化。反应机制研究通过系列实验揭示了锌氢负离子催化机制：氘代标记实验：使用$\ce{PhSiD3}$作为还原剂，产物在立体碳中心$>99\%$氘代，证实氢负离子来源于硅烷而非溶剂锌氢负离子机制确认：测试不同硅烷的还原效果，产物e.e.值不随硅烷结构变化，表明反应遵循锌氢负离子机制（即硅烷先将一个氢负离子转移给锌中心，形成锌-氢中间体，然后再插入到酮的羰基中），而非各种硅烷直接与酮反应的三元机制；空间位阻更大、供氢能力更弱的硅烷不给产物，也支持硅烷需要先与锌活性位点有效作用关键残基鉴定：丙氨酸扫描突变表明，His42、His44、His61和Glu54对催化活性和构型控制至关重要；任一组氨酸突变都会使活性消失或几乎消失。Thr84突变为Ala后产率从98%降至62%，但e.e.值基本不变，说明Thr84有贡献，但不是绝对必需位点，可能由主链酰胺氢键部分补偿金属特异性验证：金属取代实验显示，去除$\ce{Zn^{2+}}$后活性完全丧失，回补$\ce{Zn^{2+}}$恢复完整活性。Mn、Fe、Co、Ni和Cu等离子并非完全不能反应，而是只给出部分活性，因此原文的结论是dMKR是锌依赖金属酶，同时金属替换可能提供进一步调参空间图3：dMKR反应机制研究。（a）氘代同位素标记实验追踪氢负离子来源。（b）dMKR催化苯乙酮还原的总体反应机制。（c）不同硅烷类型对产物e.e.值和产率的影响。（d）关键催化残基丙氨酸突变对活性的影响。（e）$\ce{Zn^{2+}}$被其他金属离子取代后的催化活性。底物范围与区域选择性在全细胞条件下，dMKR高效还原16种酮底物，产率最高达到99%，所有例子的e.e.值均$>90\%$。底物包括多种芳基酮（带吸电子或给电子基团）、烷基酮、杂芳基酮和二烷基酮。特别值得注意的是，dMKR对1-phenylbutane-1,3-dione（1q）实现了区域选择性还原，选择性还原靠近苯环的内部羰基，产率85%，e.e.值95%，与hCAII的区域选择性（优先还原末端羰基，产率$>99\%$，e.e.值98%）相反。这里的关键并非简单的“酶更强”，而是设计模型中苯基埋藏在疏水口袋、羰基由Thr84附近氢键定位、末端羰基远离$\ce{Zn^{2+}}$中心，从而改变了哪个羰基更容易被还原。图4：dMKR底物范围与区域选择性。展示16种酮底物的还原结果，包括芳基酮、烷基酮和杂环酮，以及对1-phenylbutane-1,3-dione的区域选择性还原。定向进化优化通过定向进化进一步提升催化性能：图5：dMKR定向进化。（a, b）dMKR变体对环酮还原的催化活性评估。（c）手性环醇在药物和天然产物中的应用示例。（d）dMKR变体对芳基酮和杂芳基酮的催化性能。（e）低催化剂载量下的TON测试。（f）克级不对称放大反应。（g）dMKR_I92L的动力学参数。突变位点选择：针对环酮底物，作者采用FRISM策略，对设计模型中距离配体4 Å以内的9个残基进行定点小库突变，分别用Ala、Leu和Phe调节口袋大小和空间位阻 V88A变体优化：dMKR_V88A对2,2-dimethyloxan-4-one的产率从43%提升至90%，e.e.值从84%提升至95% 底物范围扩展：dMKR_V88A和dMKR_I92L对多种环酮和芳基酮的催化性能显著提升高TON实现：在0.0032 mol% dMKR_I92L和3当量$\ce{PhSiH3}$条件下，对1i的TON达到19000，产率61%，e.e.值94% 克级放大验证：克级放大反应在5小时内完成，产率96%（4.85 g），e.e.值94%，展示了实用潜力动力学参数动力学参数揭示了dMKR的优异催化性能：$k_{\text{cat}}/k_{\text{uncat}}$高达$1.0 \times 10^6$，$k_{\text{cat}}/K_M$达到$160 \pm 20\,\mathrm{M^{-1}\cdot s^{-1}}$，与天然或进化酮还原酶处于同一量级。动力学研究表明dMKR变体具有优异的催化性能：底物亲和力提升：dMKR_I92L对底物1i的$K_M$为$(2.1 \pm 0.2) \times 10^{-3}\,\mathrm{M}$，低于hCAII的$(1.1 \pm 0.2) \times 10^{-2}\,\mathrm{M}$，表明更高的底物亲和力催化速率：dMKR_I92L对1i的$k_{\text{cat}}$为$(3.4 \pm 0.1) \times 10^{-1}\,\mathrm{s^{-1}}$，$k_{\text{cat}}/K_M$为$160 \pm 20\,\mathrm{M^{-1}\cdot s^{-1}}$ 速率增强显著：无酶对照反应的$k_{\text{uncat}}$仅为$(3.4 \pm 0.1) \times 10^{-7}\,\mathrm{s^{-1}}$，因此dMKR_I92L对1i的$k_{\text{cat}}/k_{\text{uncat}}$为$1.0 \times 10^6$；原文摘要中最高的$1.4 \times 10^6$来自dMKR_V88A对1i的动力学结果进化变体优化：对acetophenone的还原，dMKR_V88A的$k_{\text{cat}}/K_M$为$88 \pm 8\,\mathrm{M^{-1}\cdot s^{-1}}$，比dMKR（$21 \pm 3\,\mathrm{M^{-1}\cdot s^{-1}}$）提升4.2倍，与天然或进化酮还原酶（$10$至$600\,\mathrm{M^{-1}\cdot s^{-1}}$）处于同一量级关键结论与批判性总结主要贡献建立了从理论活性位点出发的深度学习引导金属酶设计流程，为人工酶设计提供了新方法；设计的130残基dMKR在热稳定性、溶剂耐受性和部分底物的选择性方面优于hCAII，实现了分子尺寸明显缩小的同时保持高催化表现。这项工作的关键不在于锌氢中间体酮还原这条机制本身，而在于把锌氢非生物还原机制装进了从头设计的微型蛋白骨架；同时展示了克级合成反应、TON达到19000、优异热稳定性和溶剂耐受性。局限性与挑战尽管dMKR本身已涵盖16种酮底物，且进化变体进一步扩大了底物范围，但对大位阻或特殊结构底物的活性仍需优化；$k_{\text{cat}}$（约$0.34\,\mathrm{s^{-1}}$）与很多天然酶相比仍有提升空间。设计成功率仍然有限：首轮24个设计中只有3个表现出显著活性；如果按全文总结的52条筛选序列计算，36条有可检测对映选择性（e.e.值$>10\%$），但真正高性能候选仍需要二次设计、标签替换和定向进化。未来方向将设计策略应用于其他氧化还原反应，如醇氧化、烯烃还原等；设计协同双金属催化中心，实现更复杂的转化；整合QM/MM预测过渡态稳定性，提高设计成功率；探索工业化应用，包括固定化酶、连续流反应、大规模生产工艺开发。批判性评价本研究展示了深度学习在金属酶设计中的强大能力，从理论活性位点出发实现了高性能催化剂的从头设计：性能评价需要分开看：与天然hCAII相比，dMKR在分子尺寸显著减小的同时，实现了更高的热稳定性和溶剂耐受性；但不同底物上的$k_{\text{cat}}/K_M$并非全面超过hCAII，因此更准确的说法是：它在稳定性、可设计性和特定选择性上体现了从头设计的优势精确控制能力：区域选择性的精确控制充分体现了计算设计的优势，实现了与天然酶相反的选择性设计挑战：然而，设计成功率仍较低，对过渡态的精确预测和能量学评估需要进一步改进总体而言，这项工作为人工金属酶设计提供了一个清晰样例：先定义金属活性位点几何，再生成小型蛋白骨架，最后通过实验和定向进化补足活性。它的意义不在于一次性替代天然酶，而在于证明非天然氧化还原机制可以被较系统地迁移到从头设计的蛋白支架中。小编锐评：具体的催化活性的优化等，AI仍无法取代基于物理的方法、定向进化等，因为精度不够。但其实选择性之类的可以通过允许给AI更多constraint来预先实现，本质上就是一些相互作用的优化，还是很有必要做的，传统办法仍然费时。骨架的设计可能也需要更多约束和更精确吧。当然酶的kinetics等更细节的、allosteric的又是AI做不了的了。

Specific Sytems · 2026-05-22

铁锰摇摆：超氧化物歧化酶如何通过氧化还原调谐改变金属偏好

Specific Sytems · 2026-05-19

如何设计出高对映选择性的人工金属酶？David Baker团队的从头设计尝试

如何设计出高对映选择性的人工金属酶？David Baker等团队的从头设计尝试本文信息标题：从头设计对映选择性人工金属酶光催化剂：含金属多吡啶辅因子的从头设计作者：Sandip Mishra, Declan Evans, Kingsley Bortey, Husayn Bootwala, Giovanni Gonzalez-Gutierrez, Ricardo Javier Vázquez, David Baker, Jared C. Lewis 发表期刊：ChemRxiv预印本（尚未经同行评审）发表时间：2026年5月7日在线发表 DOI：https://doi.org/10.26434/chemrxiv.15002852/v1 单位：印第安纳大学分子与细胞生物化学系；霍华德·休斯医学研究所，华盛顿大学引用格式：Mishra, S., Evans, D., Bortey, K., Bootwala, H., Gonzalez-Gutierrez, G., Vázquez, R. J., Baker, D., & Lewis, J. C. (2026). De Novo Design of Enantioselective Artificial Metalloenzyme Photocatalysts Containing Metal Polypyridine Cofactors. ChemRxiv Preprint. https://doi.org/10.26434/chemrxiv.15002852/v1 摘要如果蛋白支架能把手性环境传递给简单、易得的金属光催化剂，不对称光催化就会多一种可调控的设计方式。人工金属酶由合成金属辅因子与蛋白支架组成，但支架发现长期受限于试错筛选和天然蛋白框架的功能边界。本文表明，生成式蛋白设计可以直接用于构建对映选择性的人工金属酶光催化剂。作者从头设计了能够非共价结合金属多吡啶配合物的蛋白支架，其中部分支架对Λ型金属配合物显示出明显的对映选择性结合。随后通过定向进化，作者把这些支架优化为可在[2+2]光环化中实现3:97 e.r.的人工金属酶。进一步的光物理、动力学和结构分析说明，蛋白支架既改变了辅因子的结合构型，也改变了其激发态行为和底物预组织方式。核心结论从头设计实现：本文展示了用生成式蛋白设计直接构建人工金属酶光催化支架的可行性，减少了完全依赖试错筛选的需求非共价结合策略：通过疏水口袋和氢键网络实现金属辅因子的非共价结合高对映选择性：优化后的变体在[2+2]光环化反应中达到3:97 e.r.，并且在较低辅因子载量下仍保持高选择性光物理性质被蛋白改变：辅因子结合后，寿命、发光强度和量子产率都发生了可测变化，这与催化提升直接相关结构与模拟共同支持设计模型：本文得到的是 apo 结构而非辅因子复合物晶体，但晶体结构、AF3 模型和 MD 模拟表明，设计的辅因子结合构象在溶液中是可以达到的背景人工金属酶的挑战人工金属酶概念提出已有数十年，核心思路是把均相催化剂的反应类型和蛋白的手性环境放到同一个体系里。传统方法主要依赖两大策略：将金属配合物共价连接到天然蛋白支架，或通过基因工程改造现有金属蛋白的活性位点。这两条路线都能做出有用体系，但也都受限于已有蛋白骨架和活性位点几何。共价结合策略通常需要对蛋白或配合物进行化学修饰，增加了合成复杂性和不确定性。而改造天然金属蛋白则受限于天然折叠空间的有限性——现有蛋白的活性位点几何形状难以精确匹配合成金属催化剂的配位环境需求。更重要的是，试错筛选方法效率低下，往往需要测试数千个突变体才能找到性能改进的变体。从头蛋白设计的优势在于，它可以先定义金属辅因子需要的口袋形状，再反过来生成能容纳这个辅因子的蛋白骨架。对人工金属酶来说，这一点很关键：设计目标从改造已有蛋白，转向围绕配合物生成新的结合环境。光催化反应的特殊性光催化反应在有机合成中具有重要价值，能够通过激发态金属配合物实现热化学难以达到的转化。钌和铱的多吡啶配合物是经典的光催化剂，在溶液中可以高效引发[2+2]光环化、烯烃异构化、C–H键官能团化等多种反应。然而，这些均相催化剂缺乏手性环境，无法实现高对映选择性。将金属光催化剂嵌入手性蛋白支架，理论上可以在激发态反应过程中引入立体选择性。但光催化反应涉及三线态激子、能量转移和电子转移等复杂过程，对蛋白支架的刚性和微环境要求极高。支架必须在保持辅因子结合的同时，提供足够的手性环境来区分对映过渡态。此前已有 DNA、肽和天然蛋白改造等多种人工光酶路线，但往往要依赖较重的化学修饰、天然骨架适配，或较长的筛选迭代。本文的切入点正是：如果从一开始就为金属多吡啶辅因子量身定制结合口袋，是否能更快进入高选择性空间。关键科学问题从头设计能否为金属光催化剂创建合适的结合口袋？金属多吡啶配合物体积大、形状复杂，蛋白支架能否提供精确的非共价结合位点？如何实现对映选择性结合？设计出的支架能否区分金属配合物的Λ和Δ对映体，为后续反应提供手性环境？定向进化能否优化初始设计？计算设计的支架是否具有足够的可进化性，通过实验进化继续提高亲和力、选择性和低载量下的表现？这三个问题直指人工金属酶设计的核心：能否先用计算设计把体系推到可用的功能空间，再用少量实验进化完成精修。 Λ和Δ对映体：金属多吡啶配合物具有手性对映体，用希腊字母Λ（Lambda）和Δ（Delta）表示。这两个希腊字母描述的是配体围绕金属中心的螺旋走向：当从八面体顶点望向中心金属原子时，如果三条双齿联吡啶（bpy）配体从近到远顺时针排列则为Λ型，逆时针则为Δ型。这就好比我们的左手和右手，虽然组成元素完全相同，但三维空间排列不同，互为镜像。在这项研究中，作者设计时使用的是Λ型配合物作为模板，但实际合成得到的外消旋混合物包含Λ和Δ两种对映体。创新点方法创新：将 RFdiffusion All-Atom、LigandMPNN、AlphaFold2初筛、AF3指导突变和后续定向进化串成一条完整路线，用于从头设计人工金属酶光催化支架结合策略创新：通过非共价相互作用实现金属配合物的对映选择性结合，避免了共价修饰的复杂性设计-进化融合：计算设计负责产生能结合辅因子的初始支架，定向进化再处理底物取向、局部柔性和低载量性能研究内容核心方法：Scaffold设计流程详解图S1：计算设计工作流程详情。本研究采用RFdiffusion + Rosetta的组合设计流程，分为以下几个关键步骤：辅因子选择：选择Ru和Ir的多吡啶配合物作为目标金属配合物。本文主要研究四种辅因子：Ru配合物2（$\ce{[Ru(bpy)3]^{2+}}$衍生物）、Ir配合物3（$\ce{[Ir(dF(CF3)ppy)2(bpy)]^{+}}$的二羧酸衍生物，其中$\ce{\mathrm{d}F(CF3)ppy}$为二氟三氟甲基苯基吡啶）、以及用于比较的配合物4和5。图S4：不同辅因子变体的化学结构。包括Ru配合物2、Ir配合物3（$\ce{[Ir(dF(CF3)ppy)2(bpy)]^{+}}$的二羧酸衍生物）以及用于比较的配合物4和5。配合物3带有羧酸基团，用于增强与蛋白的相互作用并帮助控制结合取向。骨架生成：使用RFdiffusion生成10万个长度为100–300个氨基酸的能结合金属配合物的蛋白骨架疏水残基填充：用Rosetta脚本将生成的骨架用疏水残基填充，改善packing 筛选标准：根据contact_molecular_surface、dSASA、holes_around_lig和interface buried SASA等指标选择高质量设计，确保蛋白-配体界面packing紧密、配合物被充分掩埋，且口袋周围没有明显空洞序列设计：使用LigandMPNN为通过筛选的骨架设计序列，以带羧酸盐的Λ2配合物为条件模板，随后用AlphaFold2检查序列是否能折回设计骨架实验验证：在大肠杆菌中表达设计蛋白，测试辅因子结合能力和催化活性。设计序列被克隆到表达载体后转化E. coli BL21Gold(DE3)，在TB培养基中培养，用IPTG诱导蛋白表达，通过SDS-PAGE验证可溶性表达骨架生成阶段作者先用DFT优化的$\ce{Λ\text{-}Ru(bpy)3^{2+}}$（Λ1）作为初始模板。DFT计算使用Gaussian16软件，采用B3LYP泛函、Grimme的GD3经验色散校正和6-31+G(d)基组，并在CPCM溶剂模型（参数设为乙醚）中优化几何结构。这个优化的辅因子结构作为条件配体输入RFdiffusion All-Atom，随后用默认全原子参数和RFD_17.pt checkpoint一共生成了100,000个、长度为100–300个氨基酸的蛋白骨架。这里的目标：先尽量多地产生能容纳金属多吡啶整体形状的候选口袋，再用界面指标筛掉明显松散或暴露的设计。初步筛选标准：这些骨架先用作者自写的Rosetta XML脚本进行疏水残基填充，以改善蛋白-配体界面的packing，再按一组已建立的界面指标筛选，包括contact_molecular_surface > 267、dSASA > 0.77、holes_around_lig > 4.95和interface buried SASA$>850\,\mathrm{Å^2}$。这里的几个指标从不同角度检查同一个问题：这个口袋是否足以稳定抓住金属多吡啶辅因子。指标原文阈值主要含义直观理解 contact_molecular_surface $>267$ 衡量蛋白和辅因子之间的有效接触表面，Rosetta会按表面距离给接触加权，因此它同时反映接触面积和贴合程度辅因子被口袋贴实地抱住 dSASA $>0.77$ fractional interface $\Delta$SASA，表示辅因子结合后损失的溶剂可及表面积比例；接近1说明更接近完全埋藏，接近0说明仍大量暴露辅因子大部分埋入口袋 holes_around_lig $>4.95$ 原文称为ligand cavity quality，反映配体周围腔体质量和局部packing状态；这里应按作者的Rosetta筛选分数理解，分数超过阈值才进入下一步口袋周围的腔体质量通过本文筛选标准 interface buried SASA $>850\,\mathrm{Å^2}$ 衡量蛋白-辅因子界面形成后被埋藏的总表面积，原文将其解释为广泛的protein-cofactor contacts 接触面足够大、由多处接触共同稳定筛选标准的物理意义：这四个阈值合在一起，实际是在筛掉三类假阳性：能装进去但露在外面的口袋、接触面积够大但贴得不紧的口袋，以及腔体质量不过关的口袋。作者想保留的是装得深、贴得紧、腔体质量合格、接触面还足够大的候选口袋。序列设计阶段通过筛选的骨架使用LigandMPNN进行序列设计，以带羧酸盐的Λ2配合物作为条件配体上下文，也就是把这个辅因子结构作为输入条件，指导序列设计生成能够与之匹配的蛋白序列。光化学兼容性约束：LigandMPNN设计时特意排除了苯丙氨酸、酪氨酸和色氨酸，因为这些芳香残基可能淬灭激发态或引入不需要的能量转移。序列设计工作流程迭代优化辅因子结合相互作用：首先，LigandMPNN为所有可设计位置生成序列和侧链构象；这里的“可设计位置”不是算法自动判定的功能位点，而是设计流程中没有被固定、允许LigandMPNN重新选择氨基酸类型的残基位置；然后基于几何标准（氢键供体-受体距离和角度截断，具体数值在正文中未明确给出）识别与辅因子Λ2羧酸盐形成潜在氢键的残基；这些氢键残基在后续设计轮次中被固定，以保持与羧酸盐取代基的有利静电相互作用。这种迭代设计-固定过程重复三次，逐步精炼结合位点架构，同时保持关键的辅因子稳定相互作用。最终生成的序列中，结合位点残基被设计为通过疏水作用、氢键和静电相互作用与配合物的特定部分相互作用，从而实现精确的定位和稳定。图1：从头设计金属多吡啶光催化剂非共价结合的计算策略。A）过去的人工光酶路线主要依赖共价偶联或把光敏基团嵌入现有支架。 B）本文转而设计可通过非共价方式容纳金属多吡啶辅因子的蛋白口袋。C）作者使用的$\ce{Ru}$多吡啶模板从 A1 到带羧酸取代基的 A2。D）RFdiffusion All-Atom 先生成口袋骨架，再由 LigandMPNN 在 A2 条件下做序列设计。 E）设计目标包括氢键网络和形状互补。F）最终保留的是一组能够容纳辅因子的不同折叠候选。候选选择与实验验证最终共有96条设计序列进入实验测试。这些序列在大肠杆菌中表达后，通过SDS-PAGE分析验证，其中63条成功以可溶蛋白形式表达（66%成功率），覆盖32种不同折叠。进一步的native PAGE显示，16条序列对应的5种折叠表现为单一寡聚状态。作者从这5类折叠中各选一个代表支架做后续辅因子结合和催化测试。设计支架的表征计算设计产生了多个候选支架，研究团队选择其中五个进行实验表征。这些支架在序列上各不相同，但都共享相同的核心设计理念。这里有一个关键问题需要回答：设计出来的支架真的能结合辅因子吗？能区分Λ和Δ吗？第一步：用透析-Cotton效应筛选能结合的支架 Cotton效应是什么？Cotton效应是指手性物质在吸收带附近出现的特征性ORD或CD信号变化。在这篇文章里，作者看的是CD谱：如果蛋白优先结合某一对映体（如Λ型），透析后保留下来的辅因子会富集该对映体，其CD谱图会在特定波长（如314 nm附近）表现出明显信号。这个信号的符号和形状可以用来判断蛋白更偏好结合哪种对映体。如果Λ和Δ以接近等量保留，它们的CD信号会相互抵消，观察到的Cotton效应就会很弱。透析-Cotton效应方法：为了定量评估蛋白支架对金属配合物对映体的选择性结合，研究团队开发了“透析-Cotton效应”方法。图S25：透析流程示意图。具体步骤为：将200 $\mu\mathrm{M}$蛋白支架与5倍过量的外消旋辅因子在50 mM MOPS、150 mM NaCl（pH 7.4）缓冲液中孵育，透析去除未结合的辅因子后记录 ArM 复合物的 CD 光谱，观察是否出现 Cotton 效应；再将 ArM 的 CD 谱图与独立制备的 Λ 和 Δ 对映体标准谱进行比对，通过匹配 Cotton 效应的符号和形状判定蛋白选择性结合的辅因子对映体，最后使用标准曲线定量计算结合对映体过量（ee）。该方法的优势在于能够直接检测对映选择性结合，无需复杂的化学衍生或分离步骤。作者首先测试了五个支架的结合选择性。$\ce{Ru}$配合物2几乎没有信号，而$\ce{Ir}$配合物3给出了明显的Cotton效应。在所有测试的支架中，DE3对Λ3的结合选择性最高，透析后达到94%的ee。为什么$\ce{Ru}$配合物2结合这么弱？这可能是因为$\ce{Ru}$配合物整体形式电荷更高（$\ce{Ru}$配合物为 $+2$，$\ce{Ir}$配合物为 $+1$），而LigandMPNN的设计流程主要基于几何形状，没有完全编码电荷效应。这反映了当前计算设计的局限性。第二步：用发光增强定量结合亲和力支架命名规则：DE3、DE18、DE52等支架名称中的DE代表“Designed”（设计），表示这些是从头设计的蛋白支架。数字3、18、52等是不同设计序列的编号。这种命名直接表明了这些支架是通过计算设计生成的，而非来自天然蛋白的改造。发光滴定方法：作者采用固定辅因子浓度、逐渐滴加蛋白支架的方法测量结合亲和力。具体而言，保持配合物3浓度恒定，向体系中连续加入不同浓度的蛋白支架，记录发光强度变化并生成结合曲线，最后用OriginPro 2021拟合得到$K_d$值。这种方法的原理在于：游离辅因子的发光较弱，而结合到疏水口袋后发光显著增强，因此发光强度直接反映了结合态辅因子的比例。通过发光滴定，作者发现支架DE3对配合物3的亲和力最强，$K_d$约为 $13\,\mu\mathrm{M}$。为了区分Λ和Δ对映体，作者用纯对映体分别测试，发现DE3对Λ3的$K_d$是$8\,\mu\mathrm{M}$，对Δ3的$K_d$是$80\,\mu\mathrm{M}$。 10倍的差异意味着DE3确实能区分这两个对映体——它对Λ的亲和力更强。这个差异也解释了透析实验的结果：结合更紧的Λ3更难被透析去除，而结合较弱的Δ3更容易被洗掉。等温滴定量热法（ITC）验证：作者还用ITC对DE3•Λ3做了独立的亲和力测量。SI中给出的实验条件为：在25 °C下，用1.5 mM的Λ3滴定0.15 mM的蛋白支架，共25次注射，每次2.02 μL，注射间隔5分钟，并用独立结合模型拟合数据。ITC测量得到$K_d$约$9\,\mu\mathrm{M}$，与发光滴定结果（约$8\,\mu\mathrm{M}$）一致。两种不同方法得到相近的结果，互相支持了亲和力测量。配合物3与蛋白支架结合后发光显著增强，寿命也延长。这一现象为直接定量结合亲和力提供了基础。为什么选择DE3作为进化起点？ DE3很快成为后续进化的主线，它在所有测试支架中表现最好：结合最强、选择性最高（94% ee）。其他支架要么结合较弱（DE18的$K_d=70\,\mu\mathrm{M}$），要么选择性较差（DE52只有5% ee），还有一些支架（如DE01、DE17等）没有明显Cotton效应。支架对 3 的总体 $K_d$ / $\mu\mathrm{M}$ 偏好对映体结合 e.e. / % 备注 DE3 13 Λ 94 选中作为进化起点 DE18 70 Λ 约 34 亲和力和选择性都弱于DE3 DE52 23 Δ 约 5 选择性太差，几乎不能区分Λ和Δ DE01/17/21 - - - 没有明显Cotton效应下一步，作者的目标是通过定向进化，把结合亲和力提得更高，同时保持或提高对映选择性。定向进化优化辅因子结合的优化：用AF3指导突变虽然DE3已经能结合辅因子，但$13\,\mu\mathrm{M}$的$K_d$还不够强。这意味着需要较高蛋白浓度才能让大部分辅因子处于结合状态；在后续反应条件里，作者常用1 mol%辅因子和20 mol% scaffold，在这些条件下约对应20:1的scaffold:cofactor比例。怎么改进？作者用AlphaFold3（AF3）生成DE3•Λ3的结构模型，然后用AF3的pTM和ipTM分数辅助判断哪些突变可能提高结合（图2D显示了AF3预测的六个关键位点）。这两个分数反映预测结构和界面相互作用的可信度；如果某个突变让AF3预测的复合物更可信，它就更值得进入实验筛选。通过系统性的单点突变筛选，作者发现苯丙氨酸突变特别有效，尤其是R65F和R85F。把这两个突变组合起来后，DE3 R65F R85F对Λ3的$K_d$降到0.42 $\mu\mathrm{M}$——这是约30倍的亲和力提升。为什么苯丙氨酸这么有用？苯丙氨酸是疏水的大侧链，可能通过填充口袋空隙、增强疏水接触，或与芳香配体形成堆积相互作用来改善结合。这是一个合理推断，但原文没有逐一证明每个突变的原子机制。小编锐评：这是计算的最后挣扎了，做不了催化。训练数据里少有这种金属配合物的话，还是得通过基于物理的方法，如FEP。。催化测试的残酷现实：结合≠催化 DE3变体能紧密结合辅因子后，接下来的问题是：它能催化吗？能区分对映体吗？结合亲和力主要告诉我们辅因子能否被保留在蛋白中；催化选择性还取决于底物在辅因子附近的取向，以及反应路径中哪一个手性产物更容易形成。上文中的e.e.（enantiomeric excess）用于描述辅因子结合的选择性，而e.r.（enantiomeric ratio）用于描述催化产物的对映比。 e.r.（对映比）是什么：e.r.表示催化反应中两种对映产物的比例，本文通常按“次要对映体:主要对映体”的形式写。例如20:80 e.r.意味着产物中次要对映体约占20份，主要对映体约占80份；3:97 e.r.则对应约94% e.e.，选择性明显更高。判断e.r.时不能只看第一个数字大小，而要看主要对映体是否占绝对优势。 d.r.（非对映异构体比）是什么：d.r.表示反应中生成的两种非对映异构体的比例。非对映异构体是指具有多个手性中心但互不为镜像关系的立体异构体。例如d.r.=1.2:1意味着产物中一种非对映异构体约占1.2份，另一种约占1份。这个指标通常用于描述具有多个手性中心的反应的立体选择性。作者选择了[2+2]光环化反应作为模型反应（图2E）。这个反应把一个平面分子（6a）环化成一个有手性的四元环产物。理想情况下，人工金属酶应该主要生成一种对映体。然而，未优化的DE3•Λ3只给出低对映选择性；在随后测试的苯丙氨酸突变体中，单突变DE3 R85F给出了最高的20:80 e.r.，仍低于实用要求。为什么会这样？这反映了仅仅实现辅因子结合并不足以保证高对映选择性催化。结合主要描述辅因子能否留在口袋里；催化还涉及底物进入、底物取向、能量转移和过渡态选择性。DE3能抓住辅因子，但口袋形状可能还不足以精确控制底物如何接近、如何反应。图2：从头设计人工金属酶支架的辅因子结合与催化。A）辅因子 3 的化学结构。B）真实 Λ3（金线）、支架 DE3（蓝线）和 ArM 复合物 DE3•Λ3（红线）的圆二色谱。C）选定支架与 Λ3 的 $K_d$、结合ee（辅因子结合的对映体过量）、优先结合的对映体以及发光寿命。D）基于 pTM 和 ipTM 分数锁定的潜在有益突变位点。E）用于进化筛选的 [2+2] 光环化反应。F）不同支架变体在筛选条件下得到的产物e.r.。变体命名规则：进化变体采用简写命名。例如“1Y”表示第1轮进化的酪氨酸突变（DE3 R85Y），“2R”表示第2轮进化的精氨酸突变（1Y Q22R），“3G/3F11/3F44”表示第3轮进化的甘氨酸或苯丙氨酸突变（2R R65G/L11F/L44F），“4FFG”表示Final组合突变（DE3 L11F Q22R L44F R65G R85Y）。这种命名简洁地标注了进化轮次和关键突变。定向进化：从“能催化”到“高选择性” 面对这个挑战，作者采用了定向进化——这是有策略的实验优化。作者采用位点饱和突变（site saturation mutagenesis）技术，使用简并NNK密码子（N=A/T/G/C，K=G/T）通过重叠延伸PCR（SOE PCR）构建突变文库。NNK密码子能编码所有20种氨基酸，同时尽可能减少终止密码子。每个目标位点构建一个饱和突变文库，转化大肠杆菌后表达突变蛋白，然后在标准[2+2]光环化反应条件下筛选e.r.。筛选采用96孔板格式，在定制400 nm LED光反应器中同时测试上千个克隆，通过UHPLC分析产物e.r.值。第一轮：从低选择性到10:90 在此前的苯丙氨酸突变中，单突变DE3 R85F给出最高的20:80 e.r.。进一步的饱和突变显示，R85Y（命名为1Y）可以把选择性提高到10:90 e.r.，这是本文进化路径中第一次达到90%以上的对映选择性。为什么R85Y这么有效？精氨酸（R）带正电荷，可能通过静电作用与辅因子的羧酸基团相互作用；但酪氨酸（Y）有酚羟基，既能形成氢键，又能通过芳香环提供π-π堆积。这个改变可能既保持了结合，又调整了口袋的形状，让底物以更有利的方式接近。第二轮：从10:90到3:97 以1Y为基础，在剩余五个位点构建文库。Q22R把结果进一步推到3:97 e.r.，已接近实用要求。得到的变体命名为2R。第三轮：把高选择性带到低蛋白用量 2R虽然选择性高，但还需要20 mol%的scaffold loading。作者把筛选条件改得更苛刻：直接在更低scaffold loading下看能否保住选择性。在2R基础上，对辅因子结合位点周围8 Å内的13个残基继续做饱和突变。筛选结果（图2F显示了不同变体的催化产物e.r.值）显示三个有益单突变：L11F（命名为3F11）、L44F（命名为3F44）和R65G（命名为3G）。这三个突变都能在1.5 mol% scaffold loading下提高选择性。组合后的4FFG（DE3 L11F Q22R L44F R65G R85Y）在1.5 mol% scaffold loading下仍能给出3:97 e.r.，说明低蛋白用量下的选择性也能通过进化保住。 scaffold loading从20 mol%降到1.5 mol%，约降低13倍，但选择性保持不变。变体关键突变代表结果为什么重要？ DE3•Λ3 - 低对映选择性能结合但选择性差 DE3 R85F R85F 20:80 e.r. 苯丙氨酸单突变中的最好结果 1Y R85Y 10:90 e.r. 首次达到高选择性 2R Q22R, R85Y 3:97 e.r. 达到实用选择性 3G Q22R, R65G, R85Y 在1.5 mol%下改善第三轮单突变之一 3F11 L11F, Q22R, R85Y 在1.5 mol%下改善第三轮单突变之二 3F44 Q22R, L44F, R85Y 在1.5 mol%下改善第三轮单突变之三 4FFG L11F, Q22R, L44F, R65G, R85Y 3:97 e.r. 降低蛋白用量13倍设计和进化的分工：计算设计把支架带到能结合辅因子的区域，定向进化再处理侧链柔性、底物预组织和溶剂效应这些难以一次算准的细节。关键在于初始设计已经足够接近功能空间，进化只需局部调整而非全局重构。催化性能与机理研究反应机理与动力学研究做到高 e.r. 之后，作者继续用稳态动力学和光谱实验追问一个更具体的问题：蛋白到底改了什么。稳态动力学结果显示，DE3•Λ3、2R•Λ3 和 2R•Δ3 都符合 Michaelis–Menten 动力学。不同变体的动力学参数对比为什么只测DE3和2R，不用那几个优化后的研究动力学：作者选择2R进行动力学和机理研究，是因为它具有高对映选择性，而后续变体（如4FFG）的主要改进是在更低scaffold loading下实现类似选择性，而非改变催化机制本身。因此研究DE3和2R就能代表从头设计和进化后变体的基本动力学特征。变体 $K_M$ / mM $k_\text{cat}$ / $\mathrm{min^{-1}}$ 催化效率 / $\mathrm{mM^{-1}\cdot min^{-1}}$ 提升倍数 DE3•Λ3 1.3 0.46 0.36 基准 2R•Λ3 0.48 0.84 1.8 约5倍 2R•Δ3 0.67 1.1 1.7 约5倍 DE3 到 2R 的变化：$K_M$ 变小了，$k_\text{cat}$ 变大了，结果就是催化效率提高。这个蛋白口袋同时提高了对映选择性和整体催化效率。虽然2R•Λ3和2R•Δ3的催化效率相似（1.8 vs 1.7 $\mathrm{mM^{-1}\cdot min^{-1}}$），但对映选择性差异巨大。使用20 mol% 2R和1 mol%辅因子时，2R•Λ3催化6a达到3:97 e.r.，而2R•Δ3只能达到11:89 e.r.。这说明辅因子对映体对反应立体化学没有直接控制作用，而是通过差异结合亲和力间接影响选择性：DE3对Λ3的亲和力远高于Δ3（见前文设计支架的表征那里），导致Δ3更容易游离并产生外消旋背景反应。光谱证据揭示机制变化光致发光表征：DE3•Λ3相比游离辅因子发光更强、寿命更长；2RF•Λ3的绝对量子产率进一步升高。这里用2RF，而不是直接用2R，是因为2R含有Tyr85，酪氨酸可能和辅因子的电子激发态发生反应，容易把光谱解释复杂化。图5：支架-辅因子相互作用影响反应选择性和激发态行为。 A）辅因子（X）和支架（Y）载量对ArM选择性的影响，因辅因子对映体不同而不同。红色方块代表Λ3，蓝色圆圈代表Δ3。 Stern–Volmer实验看的是底物6a加入后，Λ3的发光强度和寿命怎么变 B）游离Λ3与底物6a。发光强度淬灭和寿命淬灭基本重合，说明6a主要通过碰撞淬灭激发态Λ3。 C）蛋白结合后的。发光强度淬灭明显强于寿命淬灭，说明一部分Λ3和6a在激发前已经处于接近或结合状态，表现为静态淬灭。 D/E）瞬态吸收光谱（TAS）则直接跟踪Λ3激发态吸收（470 nm）随时间的衰减，纵坐标为光密度变化（log mΔOD），横坐标为时间。蓝色曲线（游离Λ3）：单指数衰减；绿色曲线（Λ3+6a）：衰减更快，斜率更陡，说明6a通过碰撞淬灭游离Λ3的激发态。红色曲线（2RF•Λ3）：双指数衰减，长寿命组分比游离Λ3延长2.2倍橙色曲线（2RF•Λ3+6a）：长寿命组分与红色曲线斜率相近，说明加入6a后激发态寿命几乎不变。两组实验相互印证，回答同一个问题：6a到底是靠溶液碰撞淬灭Λ3，还是已经在蛋白口袋里靠近Λ3。强度和寿命的物理意义：发光强度反映有多少激发态分子通过辐射跃迁回到基态并发出光子；如果周围有淬灭剂（如6a）通过能量转移把能量用于化学反应，强度就会下降。激发态寿命反映激发态本身的固有属性——即激发态分子在回到基态前平均能存活多久，这和有多少分子能激发无关。6a的淬灭就是把激发态Λ3的能量用于驱动[2+2]光环化反应。 Stern-Volmer淬灭分析 Stern-Volmer方程用于定量分析淬灭效率。有两种测量方式：稳态测量（看发光强度）： $I_0/I = 1 + K_{ISV}[Q]$ 时间分辨测量（看激发态寿命）： $\tau_0/\tau = 1 + K_{tSV}[Q]$ 其中$I_0$和$I$是无/有淬灭剂时的发光强度，$\tau_0$和$\tau$是无/有淬灭剂时的激发态寿命，$[Q]$是淬灭剂浓度。$K_{SV}$越大表示淬灭越强，它就是Stern-Volmer图的斜率。两种淬灭机制的判据：动态淬灭（碰撞淬灭）：淬灭剂在扩散过程中与激发态分子碰撞，通过能量转移把能量用于反应。$K_{ISV} \approx K_{tSV}$，因为发光强度下降和寿命缩短同步发生——激发态分子更容易失活。静态淬灭（预组织淬灭）：淬灭剂在激发前就已与发光分子形成复合物。$K_{ISV} > K_{tSV}$，因为只有一部分分子能发光（那些和6a预组织的Λ3被”锁住”不发光），但真正发光的那些分子寿命不变。样品绝对量子产率 / % 无底物寿命 / μs 有6a底物寿命 / μs $K_{ISV}$ / $\mathrm{M^{-1}}$ $K_{tSV}$ / $\mathrm{M^{-1}}$ 淬灭机制含义游离Λ3 26 0.96 0.76 2000 2000 动态淬灭 6a在溶液中随机碰撞Λ3，能量转移导致发光变暗、寿命缩短 DE3•Λ3 44 - - 约1500 约500 静态淬灭为主部分Λ3与6a在口袋中预组织，激发前就形成非发光复合物 2RF•Λ3 55 2.14 2.09 4000 主文未给出更强的预组织淬灭寿命基本不变，说明是静态淬灭；但淬灭效率翻倍 2R•Λ3 - - - 3600 主文未给出更强的预组织淬灭进化后底物更容易靠近Λ3，预组织更有效游离Λ3是纯动态淬灭：$K_{ISV}$和$K_{tSV}$都是$2000\,\mathrm{M^{-1}}$，说明6a在溶液中通过碰撞淬灭激发态Λ3，把能量用于反应。蛋白结合后出现静态淬灭特征：DE3•Λ3的$K_{ISV}$（约1500）大于$K_{tSV}$（约500），说明部分Λ3在激发前就已经和6a形成复合物。这些预组织的Λ3-6a对不发光，但那些没有预组织的Λ3寿命不变。进化后淬灭效率翻倍：2RF•Λ3和2R•Λ3的$K_{ISV}$分别达到4000和3600，是游离Λ3的两倍。这说明进化支架把底物6a更有效地预组织在Λ3周围，更多Λ3在激发前就与6a形成复合物。 2RF•Λ3的寿命不变问题：虽然$K_{ISV}$很大（4000），但激发态寿命几乎不变（2.14→2.09 μs）。这正是静态淬灭的特征——那些真正发光的Λ3分子寿命不变，但发光分子总数减少。从结构上看，这个解释和后面的AF3模型是连在一起的：Q22R可能通过离子配对帮助定向辅因子，R85Y让底物结合口袋更封闭，4FFG中的F11还可能与85Y协同包住底物。这样，Λ3不是暴露在溶液里等底物随机撞上来，而是被固定在一个疏水、较封闭的口袋中；底物6a也更容易在同一个口袋里靠近Λ3。这个环境一方面减少溶剂碰撞、构象松动等非辐射失活（延长寿命），另一方面把能量转移发生的位置提前组织好（提高淬灭效率）。图5支持的是激发态保护和底物预组织这两个结论。结构验证本文没有拿到辅因子结合态的晶体结构。真正获得的是 2R 和 2RCC 的 apo 结构。数据在 ALS 8.2.2 收集；2R 的分子置换主要借助 Arcimboldo Shredder，而 2RCC 则可以直接使用 AF3 模型完成分子置换。 2RCC的设计目的：2R的N端柔性过大导致只能解析出63个残基。为限制这种柔性，作者在2R基础上引入了V7C和Q74C突变，形成了第二个二硫键C7-C74（2RCC）。2R原本已经有一个设计的二硫键C60-C71，2RCC新增的二硫键稳定了N端结构，使得完整序列得以解析，同时保持了与2R相似的辅因子结合亲和力（$K_d$=1.8 μM vs 3.4 μM）和对映选择性（4:96 e.r. vs 3:97 e.r.）。图6：进化人工金属酶的结构分析。A）apo 2R的注释模型，其中kink角度由L74、A85和L96的Cα位置定义。 B）2R晶体结构的链A（红色，PDB ID 11EJ）与2R的AF3预测结构（透明绿色）叠加，晶体结构显示非对称单元中有一个63个残基的螺旋-环-螺旋（HLH）基序。 C）2RCC晶体结构的链A（红色，PDB ID 11EK）与2R的AF3预测结构（透明绿色）叠加，晶体结构显示完整序列、设计的C7-C74二硫键和被拉直的α-3。 D）从2RCC晶体结构链A出发的500 ns MD代表性轨迹与2R的AF3预测结构叠加，显示α-3可以回到AF3模型中的弯折位置。 E）4FFG与Λ3和底物6a结合的AF3模型，显示辅因子与底物接近，并标出4FFG中的Q22R和R85Y突变。为验证设计的辅因子结合口袋在溶液中是否可达，作者进行了500 ns分子动力学模拟。软件：AMBER（GPU加速的pmemd.cuda引擎）；力场：ff14SB 溶剂模型：TIP3P水分子，150 mM NaCl；时间步长：2 fs 温度控制：300 K，Langevin恒温器（碰撞频率$\gamma=5.0\,\mathrm{ps^{-1}}$）；压力控制：1 atm，Monte Carlo恒压器模拟时长：5条独立轨迹，每条500 ns；起始结构：从2RCC晶体结构（PDB ID 11EK）开始 MD模拟结果：从2RCC晶体结构开始的五重独立模拟轨迹显示，C末端的α-3螺旋可以恢复到设计态的弯折构象，kink角度和α-1/α-3距离都与DE3设计相似。 MD模拟解决了什么问题？2RCC的晶体结构显示α-3螺旋被“拉直”了（因为晶体中形成了二聚体），这与设计态不一致。MD模拟表明，在溶液中α-3会回到弯折的构象——晶体中的拉直更可能来自晶体堆积或二聚界面，溶液中则更接近弯折构象。这表明尽管apo晶体结构显示柔性，但设计的辅因子结合口袋在溶液中是可以达到的。实用性验证底物范围研究图3：进化人工金属酶的底物范围。展示了进化DE3变体的底物范围，包括收率和对映比：a使用4–10% v/v DMSO；b使用1 mol% Λ3和20 mol% 3P。图上标注了不同底物（6a–16b）在进化支架催化下的收率和对映选择性结果，其中主线结果主要来自4FFG•Λ3，N-甲基底物16b则使用进一步筛选得到的3P•Λ3条件。部分图S12：N-烷基取代底物的扩展研究。展示了17b-18b等更大N-烷基取代底物的反应结果，以及不同载量条件下的性能改善。图3展示了4FFG•Λ3对多种4-烯丙氧基喹啉酮底物的系统性研究，这些底物具有不同的电子和立体特征。在标准反应条件下，大多数底物实现了高化学收率和中等到优秀的对映选择性控制。底物类型代表底物收率概况 e.r. 含义、结论主模型底物 6a 高 3:97 全文的基准结果卤素/甲基取代 7b–10b 高 6:94至8:92 芳环电子环境变化对催化效率影响有限烯烃上甲基取代 12b–13b 高良好不管甲基和偕二甲基，反应烯烃附近的立体位阻不会阻碍有效结合烯烃tether甲基取代 11b 高 18:82和9:91（两个非对映体）各自表现出显著但不同的对映富集。说明手性口袋对不同非对映异构体的识别存在差异更长tether 14b–15b 良好良好尽管环尺寸更大且构象自由度增加，但仍能高效环化并具有良好的对映选择性 N-甲基 16b 可反应 61:39（4FFG）/8:92（3P） 3P•Λ3（2R E89P突变体，专门针对N-甲基底物优化），说明DE3支架可以重新优化以适应缺乏常规氢键结合模体的底物更大N-烷基 17b–18b 可反应中等也能有效环化，但对映选择性中等 N-甲基底物16b：4FFG•Λ3选择性只有61:39，但进一步筛库得到的3P•Λ3（2R E89P突变体，专门针对N-甲基底物优化）可提升至8:92 e.r. 更大N-烷基底物17b–18b：包括N-乙基和N-丙基。将辅因子和支架载量分别提高到0.5 mol%和2.5 mol%可以显著提高所有研究反应的对映选择性和收率。有趣的是，对于底物6b和16b-18b，还发现了显示相反对映选择性的变体，说明DE3支架能够生成替代的手性环境用于光催化。例如，3P•Λ3催化17b达到72:28 e.r.（相反），催化18b达到39:61 e.r.（相反） TTN与回收利用图4：新型人工金属酶表现出高总周转数和高可回收性。 A）在Penn光反应器中进行反应达到很高的总周转数（TTN）。即使辅因子载量低至0.001 mol%，仍能达到53,000的TTN，这远超大多数人工光酶的报道值。 B）通过产物萃取和重复反应实现的ArM回收利用。通过简单的液-液萃取就能分离产物，水相中的ArM可以继续用于后续反应；原文报告的是三轮反应和萃取中产率与对映选择性只小幅下降。 C）使用外消旋、市售辅因子17生成的ArM进行对映选择性光催化。即使使用廉价的市售外消旋辅因子17，3G•17催化底物6a仍能达到9:91 e.r.，虽然相比2R•Λ3（3:97）有 modest reduction，但仍保持高选择性。这大大降低了实际应用的门槛，因为无需定制手性辅因子。 TTN是什么？TTN是total turnover number，总周转数，意思是“每一个催化剂分子在整个反应中平均完成了多少次转化”。这篇文章的TTN按$\ce{Ir}$光催化辅因子计算（wrt [$\ce{Ir}$]），所以0.001 mol% Λ3在53%收率下大约对应$0.53/0.00001=53000$次周转。它和TON（turnover number）本质上是同一类指标，只是作者在强调低催化剂载量下的总周转能力时使用TTN。图4展示了ArM的实用性能。作者进一步评估了4FFG•Λ3的实用性能指标：反应场景 $\ce{Ir}$辅因子载量 / mol% 4FFG载量 / mol% 收率 / % e.r. TTN/TON 关键优势定制400 nm LED反应器 0.03 1 73 3:97 约2,300 标准条件验证 Penn/integrated光反应器，空气中 0.001 1.5 53 3:97 $53000\pm4000$ 极低辅因子用量游离Λ3，空气中 0.001 0 15 46:54 $15000\pm1000$ 对照组，几乎无对映选择性市售辅因子17，空气中 0.001 0 14 48:52 $14000\pm1000$ 对照组，几乎无对映选择性这些数字说明，这个体系已经超出基础筛选条件。低辅因子载量、高周转和空气中仍能工作，才是它更接近实际催化体系的部分。回收利用和辅因子可得性也有实验数据支持。4FFG•Λ3 的回收不需要固定化，只要把产物用乙醚萃走，剩下的水相人工金属酶可以直接继续做下一轮反应。商用外消旋辅因子 17 也能和进化支架组装成功能性 ArM，这降低了复现实验时对定制手性辅因子的依赖。关键结论与批判性总结实验结果逻辑流程图这套流程可以概括为“先定义辅因子，再生成口袋，再做实验进化”。本文已经把它跑到了$\ce{Ru}$和$\ce{Ir}$多吡啶体系，也证明了商用辅因子可以接上这条路线。 graph TB subgraph R1["第1阶段：初始设计表征"] direction LR A1[96条设计序列] --> A2[66%可溶表达 63/96成功] A2 --> A3[5种代表支架 单一寡聚状态] A3 --> A4[透析-Cotton效应筛选] A4 --> A5["DE3选中：Λ3结合ee为94%"] A5 --> A6["结合亲和力：Kd为13 μM"] A6 --> A7["催化测试：低e.r."] end subgraph R2["第2阶段：结合亲和力优化"] direction LR B1[AF3预测6个关键位点] --> B2[单/双突变筛选 A/F/R/D] B2 --> B3["苯丙氨酸突变有效"] B3 --> B4[R65F+R85F组合] B4 --> B5["Kd降至0.42 μM"] B5 --> B6["亲和力提升30倍"] B6 --> B7["催化e.r.仍低：20:80"] end subgraph R3["第3阶段：催化选择性优化"] direction LR C1[R85位点饱和突变] --> C2["1Y变体(R85Y) 10:90 e.r."] C2 --> C3["首次达到高选择性"] C3 --> C4[5个位点饱和突变] C4 --> C5["2R变体(Q22R+R85Y) 3:97 e.r."] C5 --> C6["达到实用选择性"] C6 --> C7["需20 mol% scaffold"] end subgraph R4["第4阶段：低载量优化"] D1[降低scaffold loading筛选] --> D2[13个位点饱和突变 辅因子8 Å内] D2 --> D3["发现3个有益突变"] D3 --> D4["3F11(L11F)"] D3 --> D5["3F44(L44F)"] D3 --> D6["3G(R65G)"] D4 --> D7["在1.5 mol%下 保持高e.r."] D5 --> D7 D6 --> D7 end subgraph R5["第5阶段：Final组合与验证"] direction LR E1[组合所有有益突变] --> E2["4FFG变体 L11F+Q22R+L44F +R65G+R85Y"] E2 --> E3["1.5 mol%下达到3:97 e.r."] E3 --> E4["scaffold用量降低13倍"] E4 --> E5[底物范围研究] E5 --> E6[光物理与机理研究] E6 --> E7[实用性能验证] end R1 --> R2 --> R3 --> R4 --> R5 主要影响设计策略的关键创新：传统人工金属酶设计从已知蛋白折叠出发改造现有结合位点，受限于天然折叠的几何约束。本研究的关键创新在于先定义目标配合物的理想结合几何形状，再让算法自由探索能够实现这一几何的蛋白骨架，从而在原子层面更接近金属配合物的空间要求。这种方法打破了天然折叠空间的限制，允许为金属配合物量身定制结合环境非共价结合的优势：非共价结合避免了复杂的化学修饰步骤，简化了制备流程。更重要的是，非共价结合能够主动识别并优先结合某一构型，这是实现高对映选择性的基础。在分子层面，蛋白支架通过疏水作用、氢键网络和静电相互作用形成手性环境，对Λ和Δ两种对映体具有不同的“适配度”。这种天然的手性识别能力是共价结合策略难以实现的路线已经跑通：本文把“生成式蛋白设计→非共价辅因子结合→定向进化→高对映选择性光催化”这条路线完整串了起来，证明了从头设计可以直接产生具有可进化性的功能支架。这为人工金属酶研究提供了可复用的设计范式性能和实用性同时提高：除了 3:97 e.r. 这样的选择性，本文还给出了低辅因子载量、高 TON、空气中高周转和可回收使用这些更接近真实应用的指标。特别是TTN达到53,000，远超大多数人工光酶的报道值，证明该体系已经超越了基础概念验证阶段支架兼容商用外消旋辅因子：设计的支架与商用外消旋金属配合物兼容，只需简单混合蛋白和辅因子就能组装ArM，消除了历史上将ArM研究限制在专业实验室的关键障碍。这意味着更多实验室可以复现和扩展这些结果，而不需要定制合成的手性辅因子同时调控结合亲和力、光物理性质和底物预组织：本文展示了蛋白支架如何以小分子催化剂无法实现的方式同时调节结合亲和力、光物理性质和底物预组织。量子产率从26%提升到55%，激发态寿命延长2.2倍，这些数据直接证明了蛋白环境对光催化性能的多维调控作用局限与未来方向反应类型与底物范围当前局限：本文最充分的数据仍然集中在分子内[2+2]光环化，其他反应家族是否同样容易迁移，还需要后续验证。特别是分子间反应或需要不同氧化还原电势的反应可能需要重新设计支架扩展方向：把这套支架设计路线推广到更多光催化底物，尤其是不同骨架和不同激发态机制的体系。特别是[4+2]环化、烯烃异构化和C-H键官能团化等反应是否适用，需要进一步探索结构表征与机制理解当前局限：目前拿到的是apo结构，不是辅因子结合态晶体结构，因此对辅因子和底物在口袋中的精确构象仍主要依赖AF3、光谱和MD共同支持。没有真正的cofactor-bound结构，对结合模式的理解仍是间接的改进方向：如果后续能得到cofactor-bound甚至cofactor + substrate的结构，辅因子取向和底物预组织模型会更容易验证。这将直接揭示对映选择性控制的原子级细节计算方法与金属特征当前局限：设计时原本打算结合$\ce{Ru^{2+}}$辅因子，但实际只有$\ce{Ir^{+}}$辅因子能结合。这说明金属形式电荷很重要，但当前设计流程中使用的深度学习模型没有考虑这一点。RFdiffusion和LigandMPNN主要基于几何形状，对静电相互作用的编码还不完善改进方向：结合机器学习预测进化轨迹可能进一步减少实验筛选的工作量。未来设计需要更好地编码金属配合物的电荷特征和静电相互作用支架构象与功能平衡当前挑战：与许多为刚性和良好packing而优化的从头设计支架不同，DE3及其变体在apo状态下显示出显著的构象柔性，这可能是容纳大体积疏水辅因子腔体的固有特征。这种柔性虽然有利于结合大分子辅因子，但也增加了结构预测和设计的难度设计目标：特别是如何平衡柔性与刚性，以同时实现辅因子结合和催化过渡态的精确控制，是未来设计需要考虑的重要因素辅因子兼容性当前进展：设计的支架与商用外消旋金属配合物兼容，只需简单混合蛋白和辅因子就能组装ArM，消除了历史上将ArM研究限制在专业实验室的关键障碍。商用外消旋辅因子17已经给了一个起点扩展目标：后续如果能把更多现成配合物接入，会降低复现实验和底物扩展的门槛。目标是建立广泛的辅因子兼容性库应用前景本研究确立了使用AI驱动的从头蛋白设计为非天然辅因子创建定制活性位点环境的蓝图，预示着未来可以合理设计、进化和部署立体选择性光催化剂、氧化还原催化剂和多功能杂化系统。这种方法可能扩展到所有需要手性环境的金属催化反应。这篇工作目前还是ChemRxiv预印本，很多结果已经很完整，但正式同行评审后的版本仍值得再核对一次

Specific Sytems · 2026-05-19

高通量测量、构象动力学和机器学习怎样一起解释酶活性调控

【QC的综述】高通量测量、构象动力学和机器学习怎样一起解释酶活性调控本文信息标题：酶活性调控的方法：实验与计算的最新进展作者：Qiang Cui 发表期刊：Current Opinion in Structural Biology 发表时间：2025年7月29日在线发表 DOI：https://doi.org/10.1016/j.sbi.2025.103124 单位：波士顿大学，化学系、物理系与生物医学工程系引用格式：Cui, Q. Approaches for regulating enzyme activities: Recent advances in experiment and computation. Curr. Opin. Struct. Biol. 94, 103124 (2025). https://doi.org/10.1016/j.sbi.2025.103124 摘要酶活性的调控是生命系统与生物工程的核心问题。近年来，高通量酶动力学实验与高效计算方法的快速发展，使我们得以更深入地理解控制酶活性的分子机制，并据此理性设计调控策略。本文综述了实验与计算领域的最新进展：高通量筛选技术（uHT、HT-MEK、EP-Seq）带来海量功能数据；结构集合分析揭示了活性位点并非越精准定位越好；loop动力学与最短路径图工具阐明了远端残基如何传递调控效应；机器学习则开始整合物理模型与数据驱动方法，推动酶工程从大规模筛选走向机制约束下的理性设计。核心结论两条路都要走：机制理解缩小设计空间，高通量工程（定向进化/ML）负责精细调优数据富集时代已来：HT-MEK可在数天内对数千个突变体完成动力学表征；EP-Seq一次性测数千个突变体的稳定性与活性活性位点不是全部：远端残基（>20 Å）可显著影响催化效率，活性位点刚好够用的定位策略可能是自然演化的结果机器学习尚有局限：DeepEnzyme能区分高低$k_\mathrm{cat}$突变体，但预测精度仍有很大提升空间动力学不只是平衡涨落：过渡态之后的反应路径分析（而非仅自由能景观）对于理解酶催化至关重要背景两条路：自下而上 vs 自上而下天然酶不仅催化效率高，而且活性受到精确调控——这正是生命系统复杂性的体现。然而，理性调控酶活性面临巨大挑战：序列—结构—功能的关系极其复杂，即使知道应该调哪个结构旋钮，也往往不知道该调到什么程度。酶活性调控的实践需求广泛存在于工业与医学领域。工业生物催化需要酶在非自然条件（高温、有机溶剂、非生理pH）下保持活性；精准医学要求针对特定患者突变定制酶功能；合成生物学则需要精确调控代谢通路中多个酶的相对活性——这些场景都指向同一个核心问题：我们能否通过理性设计实现对酶活性的精确调控？传统上，科学家走了两条路：自下而上（bottom-up）：先搞清催化机制，再据此理性设计调控策略。这一方法从还原论角度最有吸引力，但现实是序列—结构—功能关系极其复杂，即使知道该调什么，往往也不知该怎么调。自上而下（brute-force）：直接用定向进化或机器学习技术来调活性。近年的连续进化方法（如OrthoRep）已能将基因突变率提升至基因组的百万倍，极大扩展了定向进化的搜索空间。高效的策略是两者结合：机制理解缩小设计空间，实验筛选和机器学习负责精细调优。机制研究指明关键位点之后，定向进化和ML就能在更小的空间里找到更优解。本文并没有把机制研究和大规模筛选对立起来。恰恰相反，原文把 OrthoRep 这类连续进化技术视为重要推进，但同时强调：如果没有机制信息来约束搜索方向，哪怕突变率再高，也仍然可能把搜索资源浪费在无关区域。数据富集解决的是搜索深度，机制分析解决的是搜索方向。数据富集时代：实验技术进展图1：数据富集实验技术示例。（a）微滴微流控超高通量（uHT）筛选：每天可处理超过$10^7$个突变体（b）微流控高通量酶动力学（HT-MEK）：数天内对数千个突变体完成高质量动力学表征（c）酶邻近测序（EP-Seq）：一次性测数千个突变体的稳定性与活性（d）多态结构集合分析：结合功能实验评估催化机制模型超高通量筛选（uHT）它的基本原理是把单个细胞或单个酶变体与底物一起封装进皮升级微滴，让每个液滴都充当一个彼此隔离的微反应器。这样做最关键的好处，是把基因型—表型对应关系锁在同一个液滴里，既避免不同变体之间串扰，也把传统孔板实验的体积和成本压到极低水平。后续读出通常依赖荧光底物或可转化为荧光信号的耦联反应。活性更高的液滴会积累更强荧光，再通过类似FACS的荧光激活液滴分选（FADS）完成在线筛选。也就是说，微滴微流控真正放大的不只是反应数量，而是生成微反应器、孵育、检测、分选这一整条闭环流程。 uHT 的关键不只是提高通量，而是把基因型与表型在微滴内一一配对，再以分选流程把高活性变体快速富集出来。微滴微流控技术使uHT筛选成为现实——每天可处理超过$10^7$个突变体。这一通量对于三个方向至关重要：系统研究残基间的表观遗传相互作用（epistasis）——搞清楚突变之间的非线性效应；筛选宏基因组学文库——从自然界汲取多样性；以及增强定向进化的搜索能力。一个代表性案例是将uHT整合进定向进化流程：拯救了一个原本陷入瓶颈的人工醛缩酶，将活性提升30倍。代价是完全重建了活性位点——加入了新的催化四单元（catalytic tetrad）。这说明当序列空间搜索足够深时，可以发现完全意料之外的结构重构。微流控高通量酶动力学（HT-MEK）如果说uHT解决的是通量问题，HT-MEK解决的则是定量质量问题。在数天内对数千个PafA（phosphate-irrepressible alkaline phosphatase）突变体完成折叠稳定性、催化动力学和磷酸盐抑制的系统性表征，得到超过65万个动力学数据点和6000余个动力学与热力学常数。这意味着HT-MEK把系统性酶活性图谱带入了可操作阶段——有望像基因组测序催生功能基因组学一样，推动酶工程研究方式发生实质变化。 HT-MEK的工作流程中，突变体以微液滴形式包裹，利用荧光底物（cMUP：7-（二羟基磷酰氧基）香豆素-4-乙酸）通过酶切释放荧光信号，实现高通量动力学测量。关键发现：在PafA体系中，HT-MEK对约1036个变体同时表征了折叠稳定性、催化动力学和无机磷抑制，累计得到超过65万个动力学观测值与6000余个动力学/热力学常数。由此可将不同残基组影响不同环节具体化为三类：一类主要改变催化循环中的步骤速率。一类主要改变对不同底物类别的催化特异性。一类主要影响折叠稳定性。影响催化效率的关键位点不仅在活性位点附近，还可延伸到距活性位点约20 Å的蛋白表面，说明酶活性调控是由局部化学作用与长程结构耦合共同决定的。酶邻近测序（EP-Seq） EP-Seq利用过氧化物酶介导的单细胞精度自由基标记，在单次实验中分析数千个氧化还原酶突变体的稳定性与活性。它的实验逻辑可以拆成三步：先把酶突变体库展示在酵母细胞表面，再用抗体荧光读出表达量，把它当作折叠稳定性和展示效率的近似指标。随后让氧化还原酶在细胞表面催化底物，生成局部$\ce{H2O2}$或等效氧化信号。最后借助HRP触发tyramide自由基沉积，把荧光标签限制在产生活性的那个细胞附近。因此，EP-Seq读出的不只是宽泛的生长优势，而是单细胞尺度的局部催化活性。后续再通过流式分选和深度测序，统计不同突变体在高表达、低表达、高活性、低活性群体中的富集程度，就能同时重建表达适应度和活性适应度两张图谱。 EP-Seq 的核心价值是把表达适应度和活性适应度在同一实验中解耦读出，从而更清楚地区分稳定性效应与催化效应。在D-氨基酸氧化酶的系统分析中，EP-Seq揭示了关键的结构-功能关系：突变位点的一些空间与理化属性（如到FAD辅因子和二聚界面的距离）与活性、稳定性呈差异相关。这说明不同结构区域对两类表型的贡献权重并不相同。原文据此提出的是一种演化约束线索：以活性为中心的选择压力，可能会限制折叠稳定性的上限。因此，这里更合适的理解是支持存在约束，而不是直接证明活性提升必然导致稳定性下降的一一对应因果关系。同时，EP-Seq也识别出了远离活性位点的热点突变——这些是改善催化活性而不牺牲稳定性的理想候选位点，因为它们通过长程相互作用影响活性，而不直接破坏折叠。这使得远端调控成为可能：通过影响活性位点的静电环境或构象 ensemble 来间接调节催化，而无需直接改造活性位点本身。 65万量级的数据点还有一个直接价值：为计算模型的训练与验证提供了前所未有的训练集。过去酶工程的数据往往只有几十到几百个突变体，难以支撑统计学习方法；而HT-MEK产生的系统化数据使得构建高置信度的 genotype-phenotype 模型成为可能，也为检验计算预测的准确性提供了可靠基准。三种高通量技术各有侧重与局限，适用于不同场景：技术通量优势局限 uHT $>10^7$突变体/天规模最大，适合表观遗传研究和宏基因组筛选数据精度有限，需要后续验证 HT-MEK 数千突变体/天数据质量高，同时获得动力学与热力学常数通量相对较低 EP-Seq 数千突变体/单次实验同时分析稳定性与活性，适合权衡分析需要过氧化物酶兼容的化学反应结构集合观：从单一快照到统计分布现代结构生物学技术使我们能够系统收集酶在不同功能态下的结构数据，从而批判性地评估各种催化机制模型。关键思想是把酶看成构象的集合，而不是单一的静态结构。这种视角的转变对于理解酶催化至关重要——传统的钥匙—锁模型或诱导契合模型，本质上都只抓住了某个瞬间的结构，而真实酶始终在动态采样。酮类固醇异构酶（KSI）案例：活性位点并非越精准越好对KSI系列变体的研究采用了一套三步工作流程：第一步：用（伪）结构集合描述不同变体在构象空间中的统计分布。这里的（伪）结构集合主要指由多组X射线结构拼接得到的近似构象集合，而非长时间MD采样得到的严格热平衡集合第二步：结合NMR实验和功能数据，验证这些结构集合是否真实反映溶液中的构象分布第三步：用功能实验检验这些分布差异是否真的对应催化效率变化氧阴离子孔的催化机制：KSI的氧阴离子孔通过比水中更强的氢键稳定过渡态，从而实现催化。但某些突变会通过改变氢键网络的电子效应（如感应效应）削弱这种优势——这说明催化效率不只取决于活性位点的几何形状，还取决于电子性质的精细调控。这一研究出人意料地发现：催化残基的定位确实优于非催化残基，但并非越精准定位越好催化残基在功能循环中的构象分布变化也不大真正重要的是柔性与定位之间的平衡：既要刚到能有效催化，又不能太僵硬以至于无法完成多步质子转移这一结果否定了活性位点越精准定位越好的简单模型，说明自然演化选择的可能是刚好够用的定位策略，而非极致优化。丝氨酸蛋白酶：建立定量贡献框架在KSI研究否定错误模型的基础上，对超过1000个来自17种丝氨酸蛋白酶的X射线晶体结构进行比较分析，进一步建立了定量贡献框架。研究将酶结构特征与溶液中相应反应的特性进行半定量比较，成功建立了各种结构和能量特征对催化效率的可量化贡献，包括底物定位、氢键网络强度、以及其他结构和能量特征。虽然每个特征的单独贡献可能有限，但它们协同作用共同决定了催化效率。虽然（伪）结构集合并不完全等同于溶液中的构象分布，但这些研究说明了集合视角对于识别和评估酶活性调控因素的必要性和价值——它不仅能否定错误的机制模型，还能建立定量分析框架。工程启示集合观的工程启示在于：追求活性位点的完美静态结构可能是一个错误目标。既然催化依赖于构象集合的统计行为，那么工程的目标更应该是调控这个分布本身——例如增强某一类构象的占比，或者改变构象之间的跃迁速率，而非单纯把活性位点固定在某一位置。动力学与远端贡献：构象景观、集体运动与别构通路图2：酶动力学与远端残基对催化贡献的代表性案例。（a）蛋白质酪氨酸磷酸酶的WPD loop动力学：含催化Asp181的WPD loop动力学决定磷酶中间体水解活性，并与其他loop共同参与调控（b）最短路径图（SPM）别构网络识别：可识别多种酶中的别构调控残基；模板化AlphaFold2与MD联用后，可在约50 ns轨迹上得到可靠的SPM网络与自由能景观，并解释OB2-PfTrpB比PfTrpB更高的独立活性（c）PafA第二壳层残基的作用：QM/MM、经典MD与DFT簇模型计算表明，第二壳层残基突变主要扰动apo态，而对磷酸根转移的基态和过渡态影响较小（d）Pin1的全局动力学与过渡路径采样：自由能模拟与过渡路径采样给出不同图像——沿最小自由能路径逐步重排的氢键网络，并不等同于真实动态路径中的关键相互作用形成顺序 Loop动力学：WPD loop的故事蛋白质酪氨酸磷酸酶（PTP）是理解loop动力学与催化活性关系的经典案例。NMR实验发现，催化活性与WPD loop（含催化Asp181）的动力学行为高度相关——该loop在非活性（开放）和活性（闭合）构象之间切换。计算研究（增强采样MD + EVB模型）进一步揭示了PTP1B和YopH两种酶的关键差异：WPD loop的自由能景观完全不同，而化学步骤的过渡态能垒几乎不受影响，活性差异却可以超过一个数量级——这说明调控可以在反应步骤之外生效。这一发现已通过嵌合体实验得到验证：交换不同PTP间的WPD loop，可以系统改变嵌合酶的催化活性及pH依赖性。这一结果把loop动力学从相关性线索推进到可操作的因果杠杆——通过改变loop的力学性质，如净电荷或疏水性，可以直接调控酶的催化效率。在PTP中，loop动力学决定了底物能否及时进入活性位点、以及产物能否及时释放，属于非化学但同样关键的步骤。这意味着酶工程的靶点远不只是催化残基本身，任何影响底物/产物传输路径的构象动力学都可以成为调控活性的杠杆。最短路径图（SPM）：别构网络识别 Osuna课题组的最短路径图（shortest-path map，SPM）方法基于motif相关性分析，已成为识别别构通路残基的标准工具。其核心思想是：把蛋白质看成一张图，节点是残基，边是运动相关性的强弱；然后用图论算法找出连接两个位置之间的最短路径——这条路径上的残基，就是最有可能把远端突变影响传递到活性位点的桥梁。在PTP1B中，11个非WPD/P-loop突变（实验表明可改变$k_\mathrm{cat}$或$K_\mathrm{M}$超过50%）中有8个被SPM成功识别，余下3个距SPM别构网络也在4 Å以内——这一结果有力证明了动态网络探测的价值：即使是非活性位点突变，SPM也能提前预测其对活性的潜在影响，从而扩大了可设计的靶点范围。 SPM的另一个代表性应用是色氨酸合成酶PfTrpB的研究：该酶受TrpA亚基别构调控，本身没有独立的活性。定向进化得到独立活性变体OB2-PfTrpB后，将其与tAF2（模板化AlphaFold2）结合进行MD分析，仅用约50 ns的轨迹就生成了可靠的自由能景观与SPM网络——相比传统MD大大缩短了采样时间。关键发现：OB2-PfTrpB变体具有更高的构象异质性和更强的COMM domain闭合态采样能力，从而解释了更高的独立活性。这一研究也为未来SPM与增强采样方法的深度整合提供了思路。第二壳层残基的作用 PafA的系统性HT-MEK分析也激发了深入的计算研究：QM/MM自由能计算 + MD + DFT簇模型分析表明，第二壳层残基（如D163、Y112）的突变主要扰动的是PafA的apo态和底物结合，而非过渡态本身。计算结果与vanadate（钒酸盐）和磷酸盐过渡态类似物结合数据高度一致。活性位点水合水平的调控机制：第二壳层突变通过调节活性位点的水分子进入/排出速度，影响了活性位点的水合水平。由于磷酸根转移是亲核取代反应，活性位点水合程度的细微变化会显著影响反应能学——水既可以是催化参与者，也可以是竞争者。全局动力学与过渡路径采样过去大多数研究把动力学理解为平衡构象涨落，假设其与化学反应处于准平衡。但Pin1（催化磷酸化Ser/Thr-脯氨酰基肽键的顺反异构）的系统模拟表明：准平衡假设对快速反应（皮秒级）可能是错误的。关键差异在于：Pin1的异构化事件在本质上很快，约为皮秒级，而大多数酶运动显著更慢。因此，自由能模拟假设酶自由度在反应坐标变化时处于平衡——但这个假设对快速反应并不成立。自由能景观给出的是平均统计图像，TPS揭示的则是实际过渡路径，两者缺一不可，共同构成对酶催化动力学的完整理解。这里的准平衡假设可理解为：当反应坐标推进到任一位置时，其他构象自由度已经足够快地完成局部弛豫并接近平衡，因此可以用一条最小自由能路径来近似描述结构重排顺序。自由能模拟和过渡路径采样（TPS）给出截然不同的图像：自由能模拟（准平衡假设）：关键氢键网络与配体之间的相互作用随着反应坐标$\zeta$变化而逐渐重排 TPS（非平衡处理）：这些氢键在$\zeta$改变之前就已就位——相互作用形成于反应发生之前，而非之后要完整理解酶催化，还必须表征瞬态激发（高能）构象态，并识别哪些结构重排最有利于化学反应发生。这也是过渡路径采样等非平衡方法越来越受重视的原因。机器学习赋能酶工程图3：机器学习技术在酶催化与工程中的应用。（a）DeepEnzyme预测酶周转数：整合图神经网络与Transformer，在CYP2C9和PafA等大规模序列—活性数据集上评估性能（b）AlphaFold2-RAVE构象集合生成：整合结构预测与ML增强采样，为apo态腺苷酸激酶生成四类跨越开放和闭合构象的结构集合（c）统计模型预测功能位点：结合蛋白序列信息与稳定性模型，图中给出CYP2C9实验位点与预测位点的对照，蓝色区域表示功能位点（d）最大熵模型与稳定性—活性权衡：统计能量与设计Kemp eliminase活性位点远端区域的稳定性和活性位点区域的催化活性分别相关，支持稳定性——活性权衡的解释 DeepEnzyme：预测酶周转数图神经网络加Transformer架构的DeepEnzyme被用于预测酶的$k_\mathrm{cat}$。在6500余个CYP2C9突变体上表现良好，能清楚区分错义和无义变体的$k_\mathrm{cat}$差异，说明模型至少学到了活性存在与否的边界；但在PafA HT-MEK数据上，虽然统计差异显著（P = 0.0033），中位数差异仅约15%，远低于实验数据所揭示的高低活性变体之间的实际差距。这提示ML模型目前擅长捕捉定性趋势，但定量预测能力仍然有限。 15%的差距看似不大，却意味着模型尚无法可靠地区分中等活性与高活性变体——这正是工程应用最需要区分的区域。关键在于，CYP2C9和PafA的差异本身就说明了问题：不同酶家族、不同实验条件下的ML表现可能大相径庭。没有万能的酶活性预测模型，这与分子性质预测（LogP、溶解度等）的情形类似——通用模型和专用模型各有优势。 AlphaFold2-RAVE：构象集合生成 AlphaFold2-RAVE将结构预测与ML增强采样结合，为apo态腺苷酸激酶生成了四类构象——跨越开放与闭合两种状态。这对于研究构象动力学驱动的催化机制尤为重要，也为大规模构象采样提供了新的思路。结构预测与MD增强采样的组合正在成为构象动力学研究的重要路线，未来有望覆盖更大的蛋白空间。直接耦合分析（DCA）与最大熵模型共进化信息是另一种理解酶功能的强大武器。Ranganathan课题组的DCA利用多序列比对（MSA）中的共进化信号，提取残基间直接的相互作用信息，绕过了间接相关的干扰。用这种方法生成的非天然序列，45%在大肠杆菌中具有功能性——远高于随机设计的成功率。 Xie和Warshel的类似分析则揭示了一个不对称性：统计能量与活性位点区域的催化活性正相关，与远端区域的稳定性负相关。活性位点的残基如果偏离了共进化最优构型，主要影响催化；而骨架区域的残基如果变化，则更多破坏折叠稳定性。这一发现为稳定性—活性权衡假说提供了直接证据——而且DCA这把尺子还能用来预测哪些突变有望提升活性而不损害稳定性。功能位点预测与committor函数除了预测活性值，ML还被用于两个更具挑战性的任务：识别潜在功能/调控位点，以及建模反应坐标本身。通过将蛋白质序列的统计模型与生物物理稳定性模型结合，可以系统预测功能位点。在CYP2C9上的验证表明，这种方法能够识别新的功能热点，为后续突变设计提供候选。这一思路将ML的预测能力与生物物理的先验知识相结合，比纯序列统计更有可能筛选出真正有功能意义的位点。另一方面，ML也被用来建模committor函数——这是统计力学中定义最理想反应坐标的数学对象：对于任一构象状态，committor给出体系先到达产物态而不是先回到反应物态的概率。如果某个构象的committor接近0，说明它仍偏向反应物一侧；接近1，则说明它更偏向产物一侧；而接近0.5的构象通常最接近过渡态集合。如果能可靠地预测committor，就意味着找到了一个比简单键长、距离或自由能谷底更有动力学意义的反应坐标，从而更深入地理解催化机制。目前committor建模仍是活跃的前沿方向，主要挑战在于：它需要稀有事件的精确采样——只有极少数构象会最终越过过渡态，而ML模型必须从大量非反应构象中学会识别这些稀有例外。随着增强采样方法，如自适应偏置力或主动学习，持续进步，这一方向有望取得突破。展望数据与机理并重进入数据富集时代后，关键挑战变成：如何用分子术语理解这些数据，从而发展可指导工程的机理模型。单纯依靠物理模型计算量太大，单纯依靠ML准确性不够——两者的创造性地结合才有出路。具体来说，可扩展的自由能方法（如λ动力学）越来越高效准确，但在使用QM/MM势能时计算量仍然很大；ML模型已被用于预测催化活性，但预测精度有限。将物理模型与ML技术创造性地整合——用物理模型标定ML，用ML加速物理计算——将是未来十年的重要方向。多尺度构象动力学尤其是集体网络动力学与催化活性的关联、构象异质性与动态无序的区分，以及功能循环中构象演化的研究。Saito等人的观点可以概括为：酶动力学涉及非马尔可夫、非泊松、调控性反应动力学，理解其分子机制需要多种先进实验技术与大量MD模拟的结合。快的局部重排与慢的集体运动之间的联系——尤其是在大型别构生物分子机器，包括大型酶复合物，中的功能调控作用——需要更深入的理解。复杂环境中的酶催化酶不是在真空中工作的。生物分子凝聚体（biomolecular condensates）中的酶催化与稀溶液的差异才刚刚开始被理解——关键因素可能包括强静电作用、拥挤效应，以及底物传输的复杂性。基因型与表型之间的关系也因表观遗传效应而变得极为复杂。真实细胞环境对酶催化的影响仍缺少足够清晰的机制图像——凝聚体内部的高分子拥挤、液-液相分离界面附近的特殊化学环境，都可能从根本上改变酶活性与底物特异性。从长远看，酶活性调控的终极目标是从调控已知酶走向从头设计全新调控逻辑。当我们可以系统地表征序列—结构—动力学—活性的映射关系时，就有望发展出可预测的酶设计理论框架，类似于化学合成中已经成熟的逆合成分析思路。人工调控元件的引入为酶活性调控提供了新的维度。例如将光控开关（如LOV结构域）嫁接到酶上，用光照实时开关酶活；或利用外部自由基源，通过光敏剂或电化学方法原位产生自由基，来驱动非常规反应。随着蛋白质设计工具，如RFdiffusion和ProteinMPNN，逐渐成熟，将天然调控逻辑迁移到全新蛋白骨架或从头设计全新调控通路，可能会成为未来几年的重要方向。主要贡献提供了酶活性调控的全景式综述：从高通量实验到计算方法，从结构集合分析到动力学网络，全面梳理了领域的现状与挑战强调了机制理解与暴力工程的互补价值：自下而上与自上而下结合，才能最有效地缩小设计空间并完成精细调优清晰展示了动力学视角的重要性：loop动力学、远端残基、第二壳层效应——这些都不只是背景噪声，而是催化活性的直接调控者局限与挑战 HT-MEK等高通量技术虽然数据量大，但每种平台都有局限（通量、可操作性、兼容化学反应类型、稳健性），新技术仍在不断涌现机器学习预测精度仍不够：DeepEnzyme在中位数差异上与实验相差15%，远未达到工程应用的可靠标准物理模型与ML的整合尚处于早期阶段：如何创造性地结合两者仍有大量机会全局动力学与催化活性的关系：文中提到的相关研究（Kemp eliminase变体的集体运动差异）仍需更直接的因果证据

Specific Sytems · 2026-04-22

机器学习势函数让酶反应模拟从量子精度走向分子力学速度

机器学习势函数让酶反应模拟从量子精度走向分子力学速度本文信息标题：面向下一代计算酶催化的机器学习/分子力学酶学作者：Xujian Wang、Junmei Wang、Wan-Lu Li 期刊：Chem Catalysis 发表时间：2026年3月19日类型：Perspective综述 DOI：https://doi.org/10.1016/j.checat.2026.101658 单位：美国加州大学圣地亚哥分校 Aiiso Yufeng Li 化学与纳米工程系美国匹兹堡大学药学院药物科学系美国匹兹堡大学医学院计算与系统生物学系引用格式：Wang X, Wang J, Li W-L. Machine learning/molecular mechanics enzymology for the next generation of computational enzymatic catalysis. Chem Catalysis. 2026;6:101658. https://doi.org/10.1016/j.checat.2026.101658 摘要传统QM/MM框架虽然在酶反应模拟中取得了显著成就，但始终面临精度与效率的权衡。近年来，机器学习原子间势函数（MLIPs）的出现打破了这一僵局——它们以接近量子力学的精度、分子力学的效率，正在重塑计算酶学的版图。本文系统综述了反应性MLIP的数据集构建和训练策略，梳理了ML/MM在酶催化模拟中的最新进展，并展望了向更复杂场景扩展的机遇与挑战。核心观点框架转变：从传统QM/MM到ML/MM，计算效率提升三个数量级，实现了量子精度与分子力学效率的结合数据驱动：反应性MLIP的训练从平衡结构扩展到反应路径采样和过渡态采样，涵盖断键/成键过程物理约束：通过长程相互作用、静电嵌入等物理机制增强模型鲁棒性，减少纯数据驱动模型在复杂化学环境中的失真应用拓展：从小分子反应到全酶模拟，从单一路径到复杂催化循环，覆盖更广泛的生物催化场景背景：计算酶学的演进之路图1：计算酶学从QM和MM到下一代ML/MM框架的演进。（A）过去：QM和MM方法在精度和效率上各有优势但独立运作；（B）现在：混合QM/MM框架通过边界修正和嵌入方案，整合两种方法，实现了真实环境中酶反应的原子级模拟；（C）未来：下一代ML/MM将用MLIPs替代QM区域，结合接近QM的精度和MM的效率，并扩展能力到长程相互作用。酶是自然界最高效的催化剂，理解其催化机制一直是计算化学的核心挑战。过去几十年，量子力学/分子力学（QM/MM）混合方法彻底改变了这一领域。Warshel等人开创的QM/MM框架，用量子力学描述反应中心，用分子力学处理蛋白质环境，使得在真实溶剂和蛋白基质中模拟酶反应成为可能。然而，QM/MM始终面临着无法回避的限制：量子区域的计算开销极大，限制了可模拟的时间尺度、系统尺寸和采样效率。即便是最先进的QM/MM，模拟纳秒级的酶催化过程也需要数月计算时间，这严重制约了其在酶发现和设计中的应用。转折点出现在机器学习原子间势函数（MLIPs）的兴起。 MLIPs用神经网络等数据驱动方法拟合量子力学数据，实现了近乎量子精度的势能面，同时保持了分子力学的计算效率。将MLIPs嵌入QM/MM框架，形成ML/MM框架，计算效率比传统QM/MM快三个数量级以上。本文特别强调，这里说的快并不只是单点能计算更快，而是整个反应模拟流程的可及性被改写了：原来很难做到的长时间尺度采样、更大ML区域以及更高通量的候选比较，现在开始进入可执行范围。也正因为如此，本文把ML/MM视为计算酶学下一阶段最值得投入的基础框架，而不只是QM/MM的局部加速插件。反应性MLIP：数据与训练的双重突破图2：构建反应性ML原子间势函数的框架。左侧展示了生成反应路径数据集的策略：从平衡结构扩展到沿反应坐标和过渡态附近的采样；右侧展示了多样化的学习策略，包括两阶段训练、迁移学习和主动学习。要让MLIPs真正描述化学反应，关键在于它们能否捕捉反应路径、过渡态和断键/成键过程。早期数据集如SPICE、QM7-X、ANI-1x主要包含稳定分子的平衡结构，对反应过程的描述能力有限。里程碑出现在Transition1x和ANI-1xnr数据集的发布，它们分别代表了反应性MLIP数据集构建的两条互补路径。 Transition1x（2022年）系统采样了小分子（≤7原子）的完整反应路径，而非仅仅单一过渡态。它包含了约960万个反应路径的能量和力数据，覆盖了83种元素，采用ωB97X/6-31G(d)理论级别。这种沿反应坐标系统采样的策略确保了从反应物到产物整个连续过程的覆盖，避免了仅在过渡态附近采样的局限性。 ANI-1xnr则采用了截然不同的纳米反应器结合主动学习方法。它在MD模拟中让分子经历高温碰撞（高达数千开尔文），迫使系统探索远离平衡态的反应构型空间，然后通过不确定性估计自动选择需要高精度QM计算的新构型，迭代改进模型。最终生成的约2.6万个非平衡反应子集采用BLYP-D3/TZV2P理论级别，专门针对C、H、N、O系统。这种方法的独特之处在于它不预设反应路径，而是让系统自己撞出反应构型，更容易发现意想不到的反应通道。数据集构建的核心挑战在于全面覆盖反应坐标。简单采样平衡结构会遗漏关键的过渡态区域，导致模型在描述化学反应时失效。为此，研究者发展了增强采样、正则模式扰动等非平衡采样策略，将构型空间扩展到沿反应坐标和过渡态附近的区域。仅沿最小能量路径采样是不够的。捕获偏离路径的构型——代表势能面的高能区域——同样至关重要，因为忽略它们可能导致MLIP在ML/MM模拟中低估或高估扭曲或非物理结构的能量代价，从而造成灾难性失败。这意味着数据集必须包含足够多样的困难样本，让模型学会区分物理合理的反应路径和不合理的构型扭曲。表1：代表性MLIP数据集数据集类型描述规模计算级别元素 QM7-X 非反应性小有机分子的平衡与亚稳平衡结构约420万 PBE0/NAOs H、C、N、O、S、Cl SPICE 非反应性药物样分子与肽的可转移参考集约110万 ωB97M-D3/def2-TZVPPD H、Li、C、N、O、F、Na、Mg、P、S、Cl、K、Ca、Br、I ANI-1x 非反应性主动学习循环得到的小到中型分子约500万多级别参考 H、C、N、O QM9 反应性以平衡结构为主，含少量简单反应物种约13.4万 B3LYP/6-31G(2df,p) H、C、N、O、F OMol 反应性含反应性、带电和材料相关体系的大规模集合约1000万 ωB97M-V/def2-TZVPD 83种元素 Transition1x 反应性小分子（≤7原子）反应路径的能量和力约960万 ωB97X/6-31G(d) H、C、N、O DORTS 反应性动力学采样得到的反应轨迹与过渡态约750万 ωB97M-V/def2-TZVP H、C、N、O、P、S、F、Cl、Br、I AIMNet2-rxn 反应性反应性和带电分子，多重自旋态约470万 ωB97M-V/def2-TZVPP H、C、N、O ANI-1xnr 反应性纳米反应器+主动学习生成的非平衡反应子集约2.6万 BLYP-D3/TZV2P H、C、N、O AIMNet-NSE 特殊体系中性、离子和自由基分子约3340万 B97M-D3(BJ)/def2-TZVPP H、C、N、O、F、Si、P、S、Cl、Br、I、B、Na、K GEMS 特殊体系生物大分子片段数据集约300万 PBE0/def2-TZVPP H、C、N、O、S AQuaRef 特殊体系肽、氨基酸衍生物和小型生物分子片段约100万 ωB97M-D4/def2-QZVP/CPCM（水） H、C、N、O、S、Se AIMNet2-Pd 特殊体系含钯有机金属配合物与反应中间体约140万 B97-3c/def2-mTZVP/CPCM（四氢呋喃） H、B、C、N、O、F、Si、P、S、Cl、Se、Br、I、Pd 另一个重要进展是训练策略的革新。 AIMNet2-rxn采用两阶段训练：先在大规模稳定结构上预训练，再通过迁移学习在反应路径构型上微调。这种策略既保证了模型对稳定结构的学习，又增强了对反应过程的描述能力。主动学习也在数据集构建中扮演着越来越重要的角色。这种自适应采样策略比盲目地毯式搜索更高效，能够集中计算资源在最需要精确描述的区域。这里还有一个容易被忽略的判断：这些数据集并不是为了提供跨数据集的绝对能量参考。本文明确指出，它们使用的量子化学参考级别并不相同，所以在ML/MM里的主要作用，是为某个建模框架提供内部一致的训练和微调数据，而不是拿来直接比较不同数据集之间的绝对能量高低。举例来说，QM9用的是B3LYP/6-31G(2df，p)，而Transition1x用的是ωB97X/6-31G(d)，这两个DFT泛函和基组的差异本身就可能在某些系统上产生亚$\mathrm{kcal\cdot mol^{-1}}$级别的系统偏差。如果直接混用，很可能把方法学差异误认为模型性能差异。因此，在选择MLIP进行酶模拟时，理论级别的自洽性比单纯追求最大数据集更重要。 ML/MM在酶催化中的应用现状早期工作中，ML势函数主要作为Δ-势用于修正QM计算，形成Δ-ML QM/MM框架。所谓Δ-势，是指用ML势学习低级别QM方法（如半经验方法）与高级别QM方法（如DFT）之间的能量差，然后用这个ML修正项来提升低级别QM计算的精度。这种方法的计算瓶颈仍然在QM计算上，因此ML区域处理的原子数非常有限（65-69个），但这些研究成功证明了ML势在酶催化中的可行性。随着MLIPs的发展，框架也从以 Δ-ML QM/MM 为主，逐步走向更独立的 ML/MM。二氢叶酸还原酶和环氧合酶-1/2的早期工作证明了可行性；随后，Diels-Alderase / chorismate mutase、chorismate mutase 和 Diels-Alderase 等体系进一步把ML区域扩展到 66、208 和 212 个原子，说明ML/MM开始具备处理更真实酶环境的能力。然而，将ML/MM应用于酶催化也面临独特挑战。酶的催化效率很大程度上源于特定残基对过渡态的稳定和活化能的降低。扩展ML区域到包含关键残基，会超出典型MLIP的截断半径（通常为4-6 Å），而长程相互作用对过渡态稳定至关重要。代表性应用案例表2：ML/MM在酶催化中的代表性应用系统模型框架 ML区域备注二氢叶酸还原酶系统特异性 Δ-ML QM/MM MD 69原子证明ML势在酶催化中的可行性环氧合酶-1/2 系统特异性 Δ-ML QM/MM MD 65原子证明ML势在酶催化中的可行性 Diels-Alderase / chorismate mutase 系统特异性 ML/MM MD 66原子早期纯ML/MM框架在酶催化中的示范 Chorismate mutase UMA ML/MM扫描 208原子引入link-atom边界方案，扩展到更大的ML区域 Diels-Alderase ANI-1xnr ML/MM MetaD 212原子结合增强采样，量化突变体效应和立体选择性技术挑战与解决方案边界修正除长程相互作用外，本文还点了一个很实际的问题：边界修正。一旦为了把关键侧链纳入ML区域而切断氨基酸残基内部的共价键，传统QM/MM里那些成熟的边界处理经验就必须重新搬进ML/MM。 link-atom边界方案是处理这一问题的关键技术。当侧链与蛋白质骨架之间的共价键被切断时，link-atom方案在切断位置引入氢原子来饱和悬空键，从而避免产生不合理的边界效应。 Ohmura等人首次将link-atom方案与通用模型UMA结合，应用于chorismate mutase，使ML/MM框架能够捕获活性位点内的侧链-底物簇，展示了突变如何调控Claisen重排。虽然该工作限于反应路径扫描而非完整的分子动力学模拟，但标志着ML/MM走向通用和实用协议的重要一步。 UMA（Universal Models for Atoms）是Wood等人在2025年提出的一族通用原子模型，其元素覆盖扩展到周期表中的大部分元素，为重原子和反应化学的统一处理提供了潜在框架。虽然该模型对活化势垒的定量精度仍需进一步验证，但它在向更广泛的化学空间提供通用预测能力方面迈出了重要一步。计算效率革命 ML/MM的核心突破：通过量子精度与分子力学效率的结合，计算效率提升了三个数量级。这意味着原来需要数月的纳秒级模拟现在可以在几天内完成，改写了整个反应模拟流程的可及性。在此基础上，作者团队将反应性ANI-1xnr势函数整合到ML/MM框架中，并采用link-atom边界处理。由于自发催化事件在常规时间尺度上极其罕见，他们进一步耦合了增强采样策略来加速势垒穿越，同时保持ML区域的近QM精度。在NVIDIA L40S GPU和Intel Xeon Platinum 8462Y+ CPU的组合下，配合link-atom边界处理的力学嵌入方案，这套ML/MM设置能够在每天完成多纳秒级的MD轨迹模拟。这种计算效率使得：多个反应事件可以在一次模拟中被观察到反应路径的统计采样变得可行包含十个以上残基的反应核心可以用近QM精度建模能够解析对映体之间微妙的自由能差异定量描述底物依赖性活性和立体选择性更重要的是，在给定酶系统和一致的理论级别下，ML/MM能够实现定量的自由能预测。这标志着ML/MM从定性的机制理解工具，走向定量的预测设计平台。从系统特异性到更通用的模型 ML/MM在酶催化中的应用经历了从系统特异性模型到更通用的反应性MLIPs的演进。早期研究主要针对特定酶系统训练专门的ML势，虽然精度高但缺乏普适性。随着Transition1x、ANI-1xnr、AIMNet2-rxn等数据集，以及UMA等更通用模型和边界方案的发展，ML/MM正在走向更广阔的应用场景。这种演进带来的优势是显而易见的：无需重新训练：通用模型可以直接应用于新的酶系统，大幅降低使用门槛一致性基准：不同酶系统可以用统一的理论级别进行比较，消除了量子方法差异带来的系统偏差加速发现：结合高通量筛选，ML/MM可以快速评估大量酶突变体或底物的催化性能当然，通用性也带来了新的挑战。当ML区域超出训练数据中的分子模式时，模型的迁移能力仍需进一步验证。这也是当前ML/MM研究的热点方向之一。长程相互作用的三种解决方案模型规模扩展：MACE-OFF23家族（S/M/L）通过扩大局部相互作用覆盖范围和提升表示能力处理长程相互作用。随着模型尺寸从S增加到L，能量和力的均方根误差（RMSE）系统性下降，反映了更大截断半径和更高角动量通道带来的表示能力提升。更大的模型能够覆盖更远距离的原子间耦合，从而部分缓解长程静电描述的不足。隐式Ewald求和：从局部描述符预测隐藏原子变量，通过倒易空间求和处理长程静电相互作用。该框架的核心思想是将长程静电作用从局部MLIP中分离出来，用经典物理方法处理。它通过预测隐藏的原子变量（如部分电荷），然后在倒易空间中进行Ewald求和，从而在不牺牲局部ML表达能力的前提下提供非局域通信。在添加长程修正后，带电（CC）、混合（CP）和极化（PP）分子对的力误差显著降低，证明了这种方法对离子系统的有效性。物理一致性整合：如SpookyNet模型将核、电荷和自旋信息嵌入到消息传递框架中，并耦合解析库仑和色散修正项，实现局部和非局部相互作用的一致处理。SpookyNet的创新在于它不是简单地把长程修正拼接到局部模型外面，而是从物理原理出发，将核、电荷和自旋信息直接编码到消息传递框架中。这种做法能同时处理带电体系和开壳层系统，展示了物理约束对提升MLIP泛化能力的价值。图3：物理信息驱动的MLIPs代表性进展。（A）MACE-OFF23家族（S/M/L变体）在多个基准集上的性能对比，能量和力的均方根误差（RMSE）随模型尺寸增加系统性下降，反映了更大截断半径和更高角动量通道带来的表示能力提升；（B）Ewald求和框架内加入潜在长程（LR）项后，短程（SR）预测和总力得到明显改进，带电（CC）、混合（CP）和极化（PP）分子对的误差显著下降；（C）SpookyNet把核、电荷和自旋嵌入到消息传递网络中，并结合解析库仑与色散修正，实现局部与非局部相互作用的一体化处理。概念辨析：表示能力 vs 表达能力在MLIP文献中，经常会遇到两个容易混淆的概念：表示能力（representation capacity）和表达能力（expressivity）。虽然它们密切相关，但在技术含义上有重要区别。表示能力（representation capacity）：指神经网络能够表示多少种不同的函数或模式。它通常由网络架构的参数数量决定，如层的深度、宽度、截断半径、角动量通道数等。MACE-OFF23通过增大截断半径和增加角动量通道，提升了模型的表示能力，使其能够覆盖更远距离的原子间耦合和更复杂的相互作用模式。表达能力（expressivity）：指神经网络能够拟合或近似哪一类函数。它关注的是网络架构（包括激活函数）能够表达的函数空间的丰富程度。SpookyNet在引入显式物理项（库仑和色散修正）的同时，保持了神经网络本身拟合复杂化学环境的能力，这就是”preserving SR ML expressivity”的含义。通俗理解：表示能力好比是画布的大小——更大的画布能容纳更多的细节；表达能力好比是画笔的技巧——更高的技巧能画出更丰富的图案。两者相辅相成，但侧重点不同：表示能力强调“能装下多少信息”，表达能力强调“能学会多复杂的函数”。静电嵌入：让MLIP感知蛋白质环境在酶中，反应核心嵌入在由带电残基和氢键网络形成的静电结构化、动态极化环境中。类似于QM/MM中的静电嵌入，ML/MM应该让MLIP暴露在MM环境的正确外场和极化响应中。目前有两条互补的探索路径：物理层嵌入：将ML能量与评估经典静电的外部极化层耦合，使ML势能够响应MM环境的静电外场。Zinovjev等人的静电嵌入模型将ML/MM能量重构为解耦形式，其中真空ML能量与物理驱动的嵌入项（表示电荷-场相互作用和诱导极化）结合。该框架在约$\mathrm{2\,kcal\cdot mol^{-1}}$内重现了QM/MM嵌入能量，显著改善了对静电结构化环境的描述。外场感知模型：通过在训练中包含外部静电场，使MLIP能够感知并适应酶和溶剂系统相关的静电环境。这种方法使能量和力预测相对于无场基线提高了近一个数量级，证明了外场感知模型可以有效感知并适应与酶和溶剂相关的静电环境。理论级别的一致性挑战表2中总结的ML/MM研究都依赖于用量子参考数据训练的ML势，但这些研究使用的电子结构理论级别各不相同。这意味着报告的活化势垒、自由能和反应能即使在同一个酶系统中，也可能因为理论方法差异而无法直接比较。关键精度要求：即便在同一个系统内，亚$\mathrm{kcal\cdot mol^{-1}}$的能量差异也可能具有化学意义——这正好是酶催化中区分不同反应路径或突变效应的精度要求。而不同量子方法间的系统偏差可能掩盖这些细微差异。因此，在进行ML/MM模拟时，研究者需要谨慎选择：理论级别的自洽性：整个建模流程——从训练数据到验证到最终预测——应该使用一致的DFT泛函和基组，避免混用带来的系统误差相对能量 vs 绝对能量：如果只关心相对趋势（比如哪个突变体活性更高），理论级别差异的影响可能较小；但如果需要定量的自由能预测，就必须严格统一方法学基准测试策略：在新系统上应用通用MLIP时，最好先用小规模计算验证其在特定化学环境下的精度，而不是盲目假设通用模型就一定准确这种对方法学一致性的强调，实际上反映了ML/MM从演示可行性走向建立可信赖的预测平台的过程中必须面对的严谨性要求。超越有机体系：金属和自由基反应标准MM力场无法处理的化学场景正逐步被MLIPs攻克，这标志着MLIPs正从有机小分子走向金属催化和自由基反应的更广阔天地。这些进展表明MLIPs正朝着更复杂的催化体系扩展，包括：金属有机催化：AIMNet2-Pd成功描述了钯催化的Suzuki-Miyaura偶联反应，证明过渡金属可以纳入传统上专注于有机元素的MLIPs 自由基反应：AIMNet2-NSE能够处理开壳层体系和自由基反应机制，突破了传统力场对单电子描述的限制自旋态转变：通过定位最小能量交叉点（MECPs），MLIPs可以绘制不同多重态间的能量景观，这对于理解金属酶的催化机制至关重要复杂环境：带电和极化溶剂环境中的反应过程，通过静电嵌入和场感知模型得到更准确的描述图4：MLIPs应用于复杂催化场景的示例。（A）钯催化Suzuki-Miyaura交叉偶联反应的催化循环；（B）AIMNet2-NSE在键解离反应上的性能基准测试，ΔΔGBDE表示键解离自由能与QM参考值的偏差，RMSD表示MLIP优化结构与参考结构在反应物态和产物态上的均方根偏差；（C）用完全活性空间自洽场（CASSCF）和完全活性空间二阶微扰理论（CASPT2）计算的苯酚O-H键解离能谱，S和T分别表示单重态和三重态激发态。概念辨析物理驱动的嵌入项在Zinovjev等人的静电嵌入模型中，ML/MM能量被重构为解耦形式：真空ML能量 + 物理驱动的嵌入项。这里的“物理驱动”指的是这个嵌入项的设计不是任意的神经网络黑箱，而是基于经典静电学原理构建的，包括：电荷-场相互作用（charge-field interactions）：ML区域中的电荷与MM环境产生的静电场之间的相互作用能诱导极化（induced polarization）：MM环境的静电场使ML区域的电子云发生极化，产生的偶极-场相互作用这种物理驱动的设计使嵌入项具有明确的物理意义和可解释性，避免了纯神经网络方法可能出现的外推失败问题。最小能量交叉点（MECP）在金属酶和光酶催化中，反应往往涉及自旋态转变（spin-state transitions），例如从单重态（singlet）变到三重态（triplet）。这两个不同自旋态对应不同的势能面。最小能量交叉点（Minimum Energy Crossing Point, MECP）就是这两个势能面相交的最低能量点。为什么MECP重要：对于自旋禁阻的反应（spin-forbidden reactions），系统不能像普通反应那样越过单一势能面上的过渡态，而是必须通过势能面交叉点从一个自旋态跳到另一个自旋态。MECP的能量高度决定了这种自旋转变的难易程度，因此是理解金属酶催化机制的关键。AIMNet2-NSE模型能够定位MECPs，这意味着它不仅能描述化学键的断裂和形成，还能处理电子自旋态的改变，这对模拟含金属的酶反应至关重要。完全活性空间自洽场（CASSCF） CASSCF（Complete Active Space Self-Consistent Field）是一种高精度的量子化学方法，专门用于处理强相关电子体系（strongly correlated electron systems），如：金属配合物中的d电子、化学键断裂/形成过程中的电子、激发态和自由基。 “活性空间”（active space）指的是研究者选择的最重要的电子轨道（如金属的d轨道）和电子。CASSCF在这个选定的活性空间内进行完全组态相互作用（Full Configuration Interaction, FCI）计算，同时优化轨道和组态系数。为什么需要CASSCF：对于金属酶反应，单参考方法（如标准DFT）可能失效，因为电子在多个轨道间强烈离域。CASSCF能够正确描述这种多组态特征，提供定性的正确参考态，然后再用更高级的方法（如CASPT2）添加动态相关能修正。图4C中显示的苯酚O-H键解离能谱就是用CASSCF和CASPT2计算的，展示了如何用高精度量子化学方法验证MLIP的预测。当前挑战与未来方向 ML/MM已经从概念验证走到可以讨论定量预测的阶段。它把反应模拟能力和动态模拟逐步整合到同一计算框架中，但要真正变成稳健的酶设计工具，仍需克服几个关键挑战：核心挑战理论级别一致性：生成训练数据所用的量子化学理论级别直接决定了MLIP的精度上限。当前不同研究使用的电子结构方法差异较大，即便在同一系统内，亚$\mathrm{kcal\cdot mol^{-1}}$的能量差异也可能具有化学意义，而不同量子方法间的系统偏差可能掩盖这些细微差异统一能量框架：目前没有一个普遍接受的统一ML/MM能量分解，能够严谨地整合长程相互作用、静电嵌入和边界修正而不产生冗余。如果长程静电、极化和边界修正分别由不同模块负责，但彼此之间没有统一的守恒能量表达式，就很容易出现重复计算或漏算转移性与边界：当前MLIPs在应用于大型、异质生物分子系统时，转移能力仍有限。将催化必需的侧链纳入ML区域会引入边界复杂性，需要稳健处理边界处的相互作用和能量守恒 ML/MM最大的问题已经不再是可不可运行，而是算出来的能量是否足够干净。本文对这一点非常谨慎，这也是它一直强调single、conservative energy framework的原因。QM/MM框架中积累的经验——在单一保守能量框架中整合长程相互作用和静电嵌入——为ML/MM的发展提供了重要参考。未来发展方向物理约束架构：物理信息架构、自动化数据集生成和不确定性量化的主动学习的发展，将是使ML/MM模型既可预测又可解释的关键多尺度整合：ML/MM将进化为一个定量、原子分辨的酶设计平台，而不仅仅是最优酶模型。它将统一机制洞察、预测设计和动态模拟于单一计算框架自动化流程：随着自动化数据集生成和标准化ML/MM框架的发展，酶发现和设计工作流将变得更加高效和可重复从工具到平台：ML/MM有望从酶学专门工具发展为通用的化学转化建模平台，不仅能够理解酶催化机制，还能指导理性酶设计、底物工程和催化路径优化，为合成生物学和工业生物催化提供强大的计算支持这种从理解到设计的转变，意味着ML/MM不再仅仅是事后解释实验现象的手段，而是能够在实验之前预测和优化催化性能的前瞻性工具。当这种能力与自动化工作流结合，就有望实现计算驱动的酶工程闭环：设计→模拟→筛选→实验验证→数据反馈→改进模型，形成持续迭代的加速循环。关键结论效率革命：ML/MM比传统QM/MM快三个数量级，使大规模酶模拟和高通量筛选成为现实。这意味着原来需要数月的纳秒级模拟现在可以在几天内完成，改写了整个反应模拟流程的可及性。数据驱动：Transition1x（约960万反应路径）、ANI-1xnr（纳米反应器+主动学习）、AIMNet2-rxn（470万反应结构）等数据集奠定了MLIP描述化学键断裂和形成的基础。主动学习策略比盲目地毯式搜索更高效，能够集中计算资源在最需要精确描述的区域。物理约束与长程相互作用：MACE-OFF23（模型规模扩展）、隐式Ewald求和（长程静电）、SpookyNet（物理整合）三种路径解决了长程相互作用挑战。这些方法通过扩大局部相互作用覆盖范围、分离长程静电作用、引入显式物理项等方式，在保持计算效率的同时提升了对复杂化学环境的描述精度。静电嵌入：Zinovjev等人的框架在约$\mathrm{2\,kcal\cdot mol^{-1}}$内重现QM/MM嵌入能量，外场感知模型使能量和力预测提高近一个数量级。物理驱动的嵌入项设计避免了纯神经网络方法可能出现的外推失败问题。超越有机体系：AIMNet2-Pd（金属有机）和AIMNet2-NSE（自由基反应）展示MLIPs正突破传统MM力场的限制，拓展到过渡金属催化和自旋态转变。AIMNet2-NSE能够定位最小能量交叉点（MECPs），处理电子自旋态的改变。整合趋势：从Δ-ML QM/MM到独立ML/MM，框架正朝着更统一、更保守的能量表示发展，但需避免重复计算。建立统一的ML/MM能量分解框架是当前面临的重要挑战。

Specific Sytems · 2026-04-22

SuperMetal：扩散生成模型以亚埃精度预测蛋白质金属离子结合位点，无需预知离子数

SuperMetal：扩散生成模型以亚埃精度预测蛋白质金属离子结合位点本文信息标题：SuperMetal：用于蛋白质中金属离子位置快速精确预测的生成式AI框架作者：Xiaobo Lin, Zhaoqian Su, Yunchao Lance Liu, Jingxian Liu, Xiaohan Kuang, Peter T. Cummings, Jesse Spencer-Smith, Jens Meiler 发表时间：2025年单位：Vanderbilt University Data Science Institute（美国），University Leipzig（德国）引用格式（不加粗）：Lin, X., Su, Z., Liu, Y. L., Liu, J., Kuang, X., Cummings, P. T., Spencer-Smith, J., & Meiler, J. (2025). SuperMetal: a generative AI framework for rapid and precise metal ion location prediction in proteins. Journal of Cheminformatics, 17, 107. https://doi.org/10.1186/s13321-025-01038-9 代码：GitHub - XiaoboLinin/SuperMetal 摘要金属离子是大量蛋白质中不可或缺的辅助因子，对酶活性和蛋白质相互作用至关重要。鉴于其关键作用和催化效率，准确、高效地识别金属结合位点对阐明其生物功能至关重要，并对蛋白质工程和药物发现具有重要意义。为应对这一挑战，本文提出了SuperMetal，一种利用基于得分的扩散模型与置信度模型相结合的生成式AI框架，能够高精度、高效率地预测蛋白质中的金属结合位点。以锌离子为例，SuperMetal优于现有最先进模型，实现了94%的精确率和90%的召回率，锌离子定位在实验确定位置的 $0.52 \pm 0.55$ Å范围内。SuperMetal展示了快速预测能力（约2000个残基的蛋白质不到10秒），且不受蛋白质规模增大的显著影响。值得注意的是，SuperMetal不需要关于金属离子数量的先验知识（不同于AlphaFold 3），且框架在原理上可扩展至其他金属离子或用作探针框架来识别其他类型的结合位点，如蛋白质结合口袋（但目前模型仅在锌离子数据上进行训练，因此适用范围仅限于锌离子）。核心结论在精确率-召回率曲线上，SuperMetal在相同召回率下始终优于Metal3D：100%精确率对应约70%召回率（Metal3D仅约30%）金属离子定位的MAD（平均绝对偏差）为 $0.52 \pm 0.55$ Å，中位数仅0.37 Å，且置信度越高的预测空间精度越好预测速度约2000个残基不到10秒，而Metal3D约需500秒（约快60倍），且运行时间不随蛋白质规模指数增长 Case study中对5IN2和6BTP两个蛋白均实现100%精确率和100%召回率，AlphaFold 3在未指定正确离子数时表现不稳定背景约三分之一的PDB蛋白质结构含有金属离子，锌离子尤为突出，约与10%的人类蛋白质结合。锌的生物学功能极为多样：参与超过300种酶的催化活性，横跨全部六大酶类——氧化还原酶（如酒精脱氢酶ADH）、转移酶（如RNA聚合酶）、水解酶（如碳酸酐酶CA）、裂合酶、异构酶和连接酶锌指蛋白作为转录因子，通过锌指结构域识别DNA序列，调控基因表达；XPA等DNA修复蛋白含锌结构域，参与核苷酸切除修复参与细胞增殖、细胞周期调控和细胞间通讯，锌依赖性蛋白在信号级联中发挥关键作用锌簇结构域作为结构支架稳定蛋白质折叠，许多锌指结构的稳定性依赖锌离子的存在锌稳态由两个家族的锌转运蛋白精密调控：ZIP家族（SLC39A）介导锌离子从细胞外或细胞器内流入细胞质，ZnT家族（SLC30A）介导锌离子从细胞质流向细胞外或细胞器内。锌稳态失调与多种疾病相关——锌缺乏可引发嗅觉味觉障碍、免疫功能紊乱和发育迟缓，锌过量则与神经退行性疾病（如阿尔茨海默病中的锌聚集）相关。从药物发现角度，精确定位金属结合位点是金属蛋白抑制剂设计的基础。许多重要药物靶点依赖锌离子发挥催化功能：碳酸酐酶（CA）用于青光眼治疗，其活性中心含锌离子基质金属蛋白酶（MMP）家族用于癌症转移抑制，锌离子位于催化结构域组蛋白去乙酰化酶（HDAC）用于癌症表观遗传治疗，抑制剂与锌离子直接结合靶向这些位点的抑制剂设计需要原子级别的精确坐标。例如，经典锌结合基团（ZBG）如异羟肟酸在HDAC抑制剂中发挥关键作用，其与锌离子的结合几何直接影响抑制剂的potency和selectivity。然而，通过湿实验直接确定金属结合位点成本高昂、耗时费力： X射线晶体学需要高质量的单晶，且可能因晶体堆积改变金属位点构象 NMR光谱虽能提供溶液态信息，但对大蛋白复杂且低灵敏度因此，计算预测方法成为理解金属依赖生物过程、支持蛋白质工程和药物设计的重要工具现有计算方法大致分为四类，各有优劣：方法类别代表工具优势局限模板法 MIB、MIB2 对已知模式精确难泛化到新颖结合位点序列法 M-Ionic 计算高效缺乏原子层面精细描述结构法 Metal3D、BioMetAll 亚埃精度、结构感知体素化带来计算瓶颈，旋转敏感物理法 QM/MM模拟理论精确计算开销过大，不适合常规设计 Metal3D是目前公认的最佳工具，能在亚埃精度下预测锌位置，但存在关键局限：体素网格的计算成本随分辨率呈三次方关系，提高分辨率带来急剧的开销需要对训练样本进行旋转数据增广来缓解对输入结构朝向的敏感性每个残基独立预测局部密度，无法充分利用全局蛋白质结构信息更重要的是，Metal3D需要为每个残基周围的16×16×16 Å3体素块预测金属密度，再进行全局聚类。这种局部预测加全局后处理的方式在蛋白质较大时计算开销急剧升高，且难以捕捉长程相互作用：提高分辨率（如从0.5 Å提升至0.25 Å）会带来8倍的计算量增长，而降低分辨率又可能损失定位精度每个残基的体素预测是独立进行的，无法充分利用远距离残基的协同作用相比之下，扩散模型近年在蛋白质设计、小分子对接（如DiffDock）等领域取得显著进展，其连续空间操作、SE(3)-等变框架和概率生成视角为金属离子预测提供了全新思路。现有方法面临三个核心瓶颈：第一，Metal3D的体素化方案使计算成本与分辨率呈三次方关系，2000个残基的蛋白质需要约500秒，在高通量场景下完全不可用，且随蛋白质越大性能差距越显著；第二，传统3D-CNN需要对训练样本进行旋转增广来降低过拟合风险，这增加训练成本，限制结构泛化能力；第三，AlphaFold 3在预测金属离子结合时需提前指定离子数量，而真实应用中这一信息通常未知，指定数量错误会导致预测质量急剧下降。创新点将金属离子位置的预测重新表述为生成建模问题，学习条件概率分布的得分函数，绕过直接估计配分函数的困难，并避免了VAE和GAN分别面临的近似最大似然和对抗训练不稳定等问题在连续的三维空间中操作，天然处理旋转和平移不变性，无需旋转数据增广，且支持全蛋白质结构的多尺度表示（粗粒化 + 全原子）独立训练一个置信度分类器，根据样本MAD是否小于5 Å判断候选位置质量，从而在精确率与召回率之间提供可调节的权衡通过DBSCAN聚类机制自动确定离子数量，比AlphaFold 3更贴近实际应用场景研究内容数据集与训练 SuperMetal使用ZincBind数据库，该数据库从RCSB PDB中提取了经过质量控制的锌结合位点，共包含19,154个非冗余位点（来自19,103个PDB文件）。质量控制标准包括：每个锌位点至少有两个配位残基和三个配位原子排除表面非功能性锌结合位点通过结构相似性和序列比对进行聚类，确保训练集中不包含高度相似的重复位点考虑蛋白质结构中的对称性单元，避免将生物组装中的对称重复位点误认为独立位点从中提取10,253个含一个或多个符合标准位点的PDB文件，超过3000个残基的结构被排除（这些超大蛋白质在生物体系中相对罕见）。数据集划分如下：数据集规模用途训练集约8,900个结构从剩余数据中随机采样验证集 1,000个结构超参数调优和早停测试集 350个结构涵盖Metal3D原始测试集及额外随机采样数据泄露防止：为确保公平对比，测试结构与SuperMetal和Metal3D训练集均不相似（基于结构相似性和序列同源性），避免了数据泄漏问题。训练硬件环境为Nvidia DGX A100，推理测试使用单CPU核心和一个Nvidia A100 40GB GPU。 SuperMetal的三阶段预测流程 SuperMetal的预测管线由三个核心模块串联组成： graph TB subgraph S1["1.几何图构建"] direction LR A["蛋白质3D结构\n（PDB）"] --> B["异构几何图\n（残基节点/原子节点/金属节点）"] end subgraph S2["2.扩散模型采样"] direction LR C["随机初始化\n100个候选金属位置"] --> D["反向SDE去噪\n（学习得分函数Sθ）"] --> E["候选金属\n位置集合"] end subgraph S3["3.置信度过滤与聚类"] direction LR F["SE(3)-等变GNN\n置信度评分"] --> G["阈值过滤\n（剔除低置信预测）"] --> H["DBSCAN聚类\n（ε=5 Å）"] --> I["最终预测位置\n（每簇取中心点）"] end S1 --> S2 --> S3 阶段一：蛋白质几何图构建将蛋白质结构表示为异构几何图，节点分为三类：残基节点（以 $\alpha$-碳为中心的粗粒化表示）、原子节点（全原子结构）和金属离子节点。边根据不同类型节点间的距离截断设置，且截断距离随扩散时间步骤动态变化——早期（$t$ 接近1，噪声大）用较大截断半径捕捉长程相互作用，后期（$t$ 接近0，噪声小）缩小截断半径聚焦局部精细结构，由此构建能感知局部原子环境和全局蛋白折叠拓扑的多尺度表示。节点特征使用ESMFold（Evolutionary Scale Modeling，蛋白质语言模型）的嵌入进行增强，以提供进化信息和序列上下文。阶段二：基于得分的扩散采样——SuperMetal的核心引擎正向扩散过程将真实金属离子位置逐步演化为高斯噪声，方差调度为 $\sigma(t) = \sigma_{\min}^{1-t} \cdot \sigma_{\max}^{t}$，正向SDE为： [\mathrm{d}\mathbf{x} = \sqrt{\dfrac{\mathrm{d}\sigma^2(t)}{\mathrm{d}t}}\, \mathrm{d}\mathbf{w}] 模型学习得分函数 $S_\theta(\mathbf{x}, \mathbf{y}, t) \approx \nabla_{\mathbf{x}} \log p_t(\Delta r \mathbf{y})$，即条件对数概率密度相对于金属位置的梯度，物理意义是金属离子从当前位置趋向有利位置所应移动的方向向量。得分函数的估计避免了直接计算概率分布的归一化常数（配分函数），这在连续高维空间中通常是难以处理的。训练目标为最小化预测得分与真实得分之间的 $L_2$ 距离期望值（得分匹配损失），期望值对训练数据中金属位置的真实分布求平均。 [L_\theta = \mathbb{E}{p(\mathbf{x})} \left[ \left| \nabla{\mathbf{x}} \log p_t(\Delta r \mathbf{y}) - S_\theta(\mathbf{x}, \mathbf{y}, t) \right|_2^2 \right]] 损失函数解释：这一设计避免了直接计算全局概率分布的归一化常数（配分函数），而是转为学习金属离子在特定时间步趋向真实结合口袋的“梯度场”。这种基于得分匹配的训练方式，在连续三维空间上比VAE的架构限制或GAN的对抗训练更加稳定。共训练400个epoch，使用Adam优化器，初始学习率为0.01并采用余弦退火调度至接近0，批量大小根据GPU内存调整（通常为8-32个蛋白质-金属复合物）。推理时，100个候选金属离子从标准正态分布随机初始化（$\mathbf{x} \sim \mathcal{N}(0, I)$），通过学习到的反向SDE迭代去噪： [\mathrm{d}\mathbf{x} = \left[ f(\mathbf{x}, t) - g^2(t) S_\theta(\mathbf{x}, \mathbf{y}, t) \right] \mathrm{d}t + g(t) \mathrm{d}\mathbf{w}] 其中漂移项 $f(\mathbf{x}, t) = 0$，故简化为纯得分匹配过程。数值实现采用欧拉-丸山方法，将连续时间SDE离散化： [\mathbf{x}{i+1} = \mathbf{x}_i + g^2(t_i) S\theta(\mathbf{x}_i, \mathbf{y}, t_i)\Delta t + g(t_i)\sqrt{\Delta t} \cdot \epsilon] 公式的通俗解释：去噪过程类似一个逐步“降温”的优化过程。100个初始随机分布的候选离子，由于漂移项设定为零，它们每一步都沿着网络预测的得分场“陡坡”向低谷（真实位点）移动，同时伴有轻微的噪声扰动；随着时间步推移，这些候选离子最终会收敛聚集成几个高置信度的位点簇。下图展示了扩散模型的理论基础：正向SDE将真实金属离子位置（左上）逐步扩散至随机位置（右上），通过神经网络预测各中间时间步的得分函数，再通过反向SDE从随机位置恢复到真实结合位点（从右到左的去噪过程）。图6：基于得分的生成扩散模型理论示意图。灰色蛋白质（上方）展示了金属离子原始位置周围的原子结构。正向连续时间SDE将真实金属离子位置（左上）演化至随机位置（右上），深度学习神经网络预测每个中间时间步的得分，使反向SDE过程（去噪）能够重建金属离子的有利位置。阶段三：置信度过滤与聚类阶段三包含两个独立训练的组件：置信度模型独立训练的SE(3)-等变分类器为每个候选位置输出标量置信度分数，预测该位置的MAD是否小于5 Å（通过交叉熵损失训练的二分类器）。训练数据生成方式为：对每个训练复合物，使用训练好的扩散模型采样多个候选金属位置，计算每个候选位置与真实金属位置的MAD。若MAD小于5 Å则标记为正类（“好”位置），否则标记为负类（“坏”位置）。5 Å的阈值选择基于经验——在金属结合位点预测中，5 Å通常被认为是可接受的精度范围，足以捕捉金属离子的正确结合位点而不过于宽松。 DBSCAN聚类低于设定阈值 p 的候选位置被过滤掉，剩余高置信度位置通过DBSCAN算法（$\varepsilon = 5$ Å，最小样本数为2）进行聚类，每个簇的质心即为最终预测的金属离子位置，由此自动确定离子数量。DBSCAN的参数选择基于以下考虑： $\varepsilon = 5$ Å：与置信度模型的MAD阈值保持一致，确保聚类时的空间尺度与质量判断标准一致最小样本数设为2：在扩散采样过程中，真实的金属结合位点通常会有多个候选位置聚集在其周围，单个孤立预测更可能是假阳性下图直观展示了这一推理过程：从时间 $t = T$（正态分布随机位置）出发，随着系统向 $t = 0$ 演化，候选金属离子逐步向生物学有意义的位置迁移，最终经置信度过滤和聚类得到精确预测。图S2：SuperMetal金属离子预测过程的可视化。从 $t = T$ 时刻正态分布随机初始化的金属离子位置出发（最左），随着反向扩散过程推进至 $t = 0$，候选金属离子逐渐向蛋白质内生物学有意义的结合位点聚集；最终通过置信度过滤和DBSCAN聚类得到最终预测位置。相较于补充材料中的可视化，正文图1通过具体的复合物结构，全景展示了扩散与聚类在真实蛋白质环境下的表现：图1：SuperMetal预测流程示意图。橙色球代表采样的候选锌离子，蓝色为蛋白质结构（示例来自PDB中的2J9R）。扩散过程从随机初始化的候选位置出发，通过反向去噪逐步收敛到金属结合位点附近。 SE(3)-等变表示与多尺度特征网络图S1：SuperMetal模型架构概览左侧（a）为嵌入与交互层：中心节点 $a$（黄色）与周围节点 $b$（蓝色）之间的消息传递，节点经ESMFold嵌入和正弦时间嵌入初始化；边特征由距离高斯平滑和扩散时间编码构成；操作符 $\otimes_w$ 表示 $SO(3)$ 不可约表示的球面张量积，路径系数 $w$ 由MLP计算右侧（b）为输出层：经过多轮交互更新的金属离子属性分别送入两条分支——扩散分支输出得分函数（用于反向去噪采样），置信度分支输出二分类标签（用于过滤低质量候选） SuperMetal架构（SI Figure S1）基于DiffDock的SE(3)-等变卷积网络改进而来，输入包括当前金属离子坐标 $\mathbf{x}$、蛋白质结构 $\mathbf{y}$ 和扩散时间 $t$，输出SE(3)-不变的预测向量。整体流程包含以下四个关键步骤：异构图构建：节点包含金属离子、蛋白质残基（以 $\alpha$-碳为中心）和蛋白质原子三类。边根据距离阈值构建，且阈值随扩散时间动态变化——早期（$t$ 接近1，噪声大）使用较大的截断半径以捕捉长程相互作用，后期（$t$ 接近0，噪声小）缩小截断半径以聚焦局部精细结构。金属离子之间的边被排除，因为金属-金属距离通常较大且非直接相互作用节点与边的特征编码：节点初始化时融合类别信息（残基类型、原子类型等）和ESMFold蛋白质语言模型嵌入（提供进化信息和序列上下文），再经正弦扩散时间嵌入增强后通过MLP映射为标量特征。边特征则对节点间距离做高斯平滑编码，同样拼接正弦时间嵌入后经MLP处理 SE(3)-等变消息传递：利用球谐函数 $Y(\hat{r}{ca})$ 表示边向量方向，通过不可约表示的球面张量积（$\otimes_w$）捕捉几何关系。权重 $\psi{ca}$ 由MLP根据边嵌入和节点标量特征计算，每个节点聚合来自邻近节点的消息并平均更新。这种设计确保模型对蛋白质的刚体旋转和平移操作保持等变性，无需数据增广即可天然处理任意朝向的输入结构多尺度层次交互：残基与金属离子间的交互按距离分为粗粒化（远距离，仅 $\alpha$-碳）和全原子（近距离）两个精度层。远距离时只用粗粒化表示，近距离才引入全原子结构，这种分层设计避免了构建“金属-全蛋白原子”的巨大完全图，大大减少了计算开销。经过多轮交互层迭代后，更新后的金属离子特征被送入最终层，输出扩散得分或置信度分类结果精确率-召回率分析 SuperMetal的核心优势：在更大召回率范围内维持更高精确率，两者不再像以往那样只能此消彼长。评估指标定义如下：若预测位置落在实验确定位点5 Å范围内则视为正确预测（真阳性，TP），精确率（Precision）$= \mathrm{TP}/(\mathrm{TP}+\mathrm{FP})$，召回率（Coverage）$= \mathrm{TP}/(\mathrm{TP}+\mathrm{FN})$。5 Å的距离阈值在金属结合位点预测领域被广泛采用，原因如下：金属-配体键长通常在2-3 Å范围（如锌-氮键约2.0 Å，锌-硫键约2.3 Å），5 Å的容差足以覆盖配位几何的微小变化 X射线晶体结构的分辨率通常在1.5-3.0 Å，原子坐标本身就有一定不确定性从药物设计角度看，5 Å精度已足够将抑制剂定位到金属结合位点的正确区域通过调节各模型的概率截断阈值（SuperMetal用置信度阈值 p，Metal3D用体素概率阈值 t），绘制精确率-召回率权衡曲线。在实际应用中，用户可根据需求调节阈值——若需最小化假阳性（如后续实验成本高昂），可提高阈值牺牲召回率；若需最大化发现潜在位点（如初步筛选），可降低阈值容忍更多假阳性。 Metal3D达到100%精确率时，召回率约30%；SuperMetal在相同精确率下，召回率约70%——几乎是Metal3D的两倍。在召回率77%时，SuperMetal保持近100%精确率，Metal3D已降至约93%；在召回率88%时，Metal3D精确率约84%，而SuperMetal约95%。这一差距说明SuperMetal在覆盖更多真实金属位点的同时，假阳性比例明显更低。图2：SuperMetal与Metal3D的精确率-召回率曲线。紫色线为SuperMetal，绿色线为Metal3D。曲线上标注了各自的概率截断值（SuperMetal用 p，Metal3D用 t）。空间定位精度位点预测的存在性判断之外，还需考察预测坐标是否足够准确。对真阳性预测计算MAD（平均绝对偏差）： [\text{MAD} = \dfrac{1}{n} \sum_{i=1}^{n} |\mathbf{x}_i - \hat{\mathbf{x}}_i|] SuperMetal在 $p = 0.1$ 时，MAD为 $0.61 \pm 0.66$ Å（中位数0.37 Å），随着阈值提高至 $p = 0.9$，MAD改善至 $0.44 \pm 0.58$ Å（中位数0.23 Å）。置信度越高，空间精度也越高，且MAD分布随阈值升高而收窄，说明置信度分数确实捕捉到了预测质量的真实差异。在 $p=0.999$ 时，中位数MAD降至0.23 Å，这意味着高置信度预测的金属离子位置与实验确定的坐标平均仅相差约四分之一埃，已接近晶体结构解析的典型精度极限。相比之下，Metal3D的MAD则随阈值升高反而增大（从0.36 Å升至0.87 Å），可能是高阈值下只保留了难以精确定位的非典型位点（如表面弱结合位点或部分占据位点），这些位点本身就是实验不确定性较大的区域。两种方法的置信度机制存在本质差异——SuperMetal的置信度与实际精度正相关，而Metal3D则相反。图3：SuperMetal与Metal3D在不同概率截断下MAD的小提琴图。紫色为SuperMetal，绿色为Metal3D。白色圆圈为中位数，黑色方框为四分位范围，须线延伸至1.5倍四分位距。SuperMetal的MAD分布随阈值升高而收窄，Metal3D则相反。计算速度两种方法都在单CPU核、相同GPU（Nvidia A100 40 GB）下对比测试。Metal3D的运行时间随蛋白质大小近指数级增长，2000个残基的蛋白质约需500秒；SuperMetal无论蛋白质大小始终在10秒以内，约快60倍。这种效率差距在更小的蛋白质上已存在（500残基时Metal3D约需100秒，SuperMetal约5秒），且随规模增大愈发显著。超高效率源于多尺度层次交互策略：金属离子距残基较远时只使用粗粒化表示（仅 $\alpha$-碳节点），近邻才引入全原子结构，避免构建巨大的全局图。这种分层设计确保了只有真正重要的局部原子-金属相互作用才被精细建模，大大减少了图中的节点和边数量。相比之下，Metal3D的体素化方案将复杂度与体素数量三次方挂钩，体素分辨率越高（如从0.5 Å提升至0.25 Å），计算量增加8倍，随蛋白质增大必然急剧升高。此外，SuperMetal支持将特别大的蛋白质分段预测再合并结果，使得原则上没有规模限制（前提是内存充足）。图4：SuperMetal与Metal3D计算时间随蛋白质规模变化的散点图。紫色虚线（SuperMetal）和绿色虚线（Metal3D）为多项式拟合趋势线，仅用于示意趋势方向。 Case Study：与AlphaFold 3的对比在两个含锌蛋白质上进行了三方对比：5IN2（来自Onchocerca volvulus的胞外Cu/Zn超氧化物歧化酶，含2个锌位点）和6BTP（骨形态发生蛋白1与羟肟酸抑制剂复合物，含2个锌位点）。 AlphaFold 3有一个特殊限制：必须提前指定输入锌离子的数量，而SuperMetal和Metal3D均无此要求。实验分别给AlphaFold 3输入1、2、6个锌离子（从左到右），结果汇总如下：方法 5IN2精确率 5IN2召回率 6BTP精确率 6BTP召回率 Metal3D 33% 50% 100% 50% SuperMetal 100% 100% 100% 100% AlphaFold 3（1个锌） 100% 50% 100% 50% AlphaFold 3（2个锌） 100% 100% 50% 50% AlphaFold 3（6个锌） 33% 100% 17% 50% SuperMetal在两个蛋白质上均实现100%精确率和100%召回率，证明了其在复杂场景下的鲁棒性。三个关键观察： AlphaFold 3的输入依赖性：结果高度依赖输入数量的准确性——输入数量正确时（5IN2给2个）可达100%/100%，但数量错误时精确率立即崩溃（6个锌输入时5IN2精确率降至33%） 6BTP的结构预测误差：即使给出正确数量，AlphaFold 3精确率也只有50%，说明还存在结构预测本身的误差（AlphaFold 3只能接受序列输入，无法直接使用已知PDB结构） Metal3D的局部预测局限：在5IN2上仅有33%精确率，明显不足。6BTP的case尤其有启发性：骨形态发生蛋白1（BMP1）属于虾shellin样金属蛋白酶家族，其锌结合位点位于催化结构域深处，周围环绕着多个二级结构单元——这种复杂的局部环境可能对基于局部体素密度预测的方法（如Metal3D）构成挑战，也说明端到端的结构预测+金属定位策略在复杂金属酶上仍有局限性。图5：5IN2和6BTP锌离子结合位点预测可视化对比。颜色编码：灰色为实验确定的锌离子，青色为Metal3D预测，橙色为SuperMetal预测，蓝色为AlphaFold 3预测。蛋白质结构以绿色（Metal3D/SuperMetal输入）和黄色（AlphaFold 3输入）显示。金属离子5 Å半径内的透明绿色区域高亮局部原子环境。从左至右，AlphaFold 3分别输入1、2、6个锌离子。关键结论与批判性总结性能优势：SuperMetal在精确率、召回率和MAD等指标上均优于Metal3D。高召回低假阳：在维持近100%精确率的同时，召回率几乎是Metal3D的两倍，能发掘更多有效位点。空间定位可靠：预测置信度越高，其空间定位误差（MAD）越小，克服了常规方法中置信度与精度脱节的问题。实用性与可扩展性：计算高效：分层的多尺度图表示避免了全原子图的巨大开销，大型蛋白的推理时间维持在10秒以内。无需先验条件：与AlphaFold 3必须指定预测几个离子不同，该框架不依赖金属离子数量的先验知识，更适合真实的靶点筛查任务。现存局限与挑战：类型限制：模型仅基于ZincBind数据库训练，对于变配位数和复杂氧化还原态的其他过渡金属（如铜、铁）仍需重新训练与验证。微环境缺失：目前仅考虑蛋白质提供的配位环境，未整合水分子、辅因子或RNA等要素，而这些在真实的酶催化中心往往十分关键。 Apo泛化性：从Holo（结合态）泛化至结构有变化的Apo（无结合态）蛋白，其表现仍需实验论证。未来方向：作者指出，基于相同的得分匹配逻辑和SE(3)-等变架构，该流程可以进一步扩展到水分子预测、蛋白质-配体口袋识别及大分子界面分析等其他结构生物学任务中。

Specific Sytems · 2026-04-20

ERAM让酶促反应建模真正走向多模态与任务无关

ERAM让酶促反应建模真正走向多模态与任务无关本文信息标题：通过多模态关系学习实现准确且任务无关的酶反应建模作者：Yuansheng Huang, Lanqing Li, Wenjia Qian, Jiahui Yu, Huifeng Zhao, Xiaorui Wang, Odin Zhang, Guangyong Chen, Shukai Gu, Pheng-Ann Heng, Tingjun Hou, Yu Kang 发表时间：2026年3月30日单位：浙江大学药学院（中国杭州）、浙江实验室生命科学计算研究中心（中国杭州）、香港中文大学计算机科学与工程系（中国香港）、新加坡国立大学计算学院（新加坡）、华盛顿大学 Paul G. Allen 计算机科学与工程学院（美国西雅图）引用格式：Huang Y, Li L, Qian W, Yu J, Zhao H, Wang X, Zhang O, Chen G, Gu S, Heng PA, Hou T, Kang Y. Accurate and task-agnostic modeling of enzymatic reactions through multimodal relational learning. Acta Pharmaceutica Sinica B. 2026. https://doi.org/10.1016/j.apsb.2026.03.052 代码与资源： Web服务器：http://cadd.zju.edu.cn/eram/ 摘要酶功能预测在合成生物学和药物发现中起着关键作用。然而，现有方法往往关注单一任务，缺乏统一框架来捕捉酶、底物和产物之间的复杂相互作用。本文提出了ERAM（Enzymatic-Reaction-Aware Molecular representation learning），一种通过多关系学习进行准确且任务无关的酶反应建模框架。ERAM将酶反应表示为知识图谱三元组，并将来自蛋白质语言模型的酶表示与小分子表示对齐。通过双粒度对比学习，ERAM在酶检索任务中比最先进的CREEP方法获得了28.31%的更高平均精度（MAP）。在底物预测任务中，ERAM在两个数据集上比ESP方法分别实现了35.53%和22.97%的更高马修斯相关系数。值得注意的是，ERAM可以在无需额外训练的情况下进行无监督结合位点预测，相比RXNAAMapper获得了42.36%的更低假阳性率和70.59%的更高重叠分数。实验结果表明，ERAM在三个任务上的有效性，为酶功能分析提供了统一的表示学习框架。核心结论统一预训练表示：ERAM用同一套酶反应表示支撑酶检索、底物预测和结合位点分析，减少了为每个任务单独设计模型的需求知识图谱式反应建模：把酶反应写成底物—酶—产物三元组后，蛋白序列和小分子可以在同一嵌入空间中对齐双粒度对比学习：底物或产物替换对应更大的几何间隔，酶替换对应更小的几何间隔，模型据此学习不同层次的功能差异注意力具备生物学指向性：酶编码器和小分子编码器都能把高注意力集中到结合位点或反应位点附近背景酶是生物体内最重要的催化分子之一，也是绿色合成、代谢工程和合成生物学的核心工具。想要真正用好酶，研究者不仅要知道它属于哪个 EC 类别，还需要知道它能识别什么底物、能生成什么产物，以及催化残基大致位于哪里。功能注释是否充分，直接决定了这些序列能不能进入后续设计和应用流程。困难在于，酶功能注释的速度远远赶不上序列积累的速度。UniProt 知识库已经包含超过 2500万条酶序列，但只有 0.91% 有人工注释。传统实验路线又慢又贵，很难靠逐一测定去填平这条序列—功能鸿沟。现有方法大致可以分成两类：一类是为某个单一任务设计专门模型，例如只做 EC 分类、只做底物预测，或者只做位点识别；另一类则尝试利用预训练蛋白模型和反应表示来做检索或匹配。前者往往任务碎片化，后者则容易只利用单一模态，难以完整表达酶—底物—产物这个催化单元。文中拿来对照的几条路线也很典型：CREEP对应专门的酶反应检索，ESP对应底物预测，RXNAAMapper对应无监督位点映射。这里的核心问题是：能否将酶反应建模为多关系数据，让酶、底物和产物的嵌入在同一几何框架下交互？如果能做到这一点，同一个模型就能支持多种下游任务，研究者也就不用在不同工具之间来回切换。这个问题之所以重要，是因为在真实的酶工程流程中，科学家通常会连续问多个问题：这个反应由哪些酶催化？这些酶能接受哪些底物？催化位点大概在哪里？如果能用同一套表示空间回答这些问题，工作流会明显更顺畅。关键科学问题酶功能的统一表示问题：酶功能不是单一的序列属性，而是由底物、酶和产物共同决定的关系属性。如何将这种三元关系映射到一个统一的嵌入空间里，是整篇论文要解决的核心问题多模态对齐问题：蛋白质序列（氨基酸）和小分子（SMILES/3D结构）处于完全不同的表征空间。如何让这两种模态在同一个嵌入空间中对齐，而不是简单地拼接或投影，是技术上的一大难点。简单来说，这就像要把中文和英文翻译到同一个语义空间里，让模型理解酶和它的英文描述是同一个东西。任务无关性边界问题：任务无关更准确的含义是什么？是真正的零样本学习，还是统一预训练表示后在不同任务上微调？这个问题直接影响对模型能力的评价和实际应用场景的界定创新点知识图谱式反应建模：将酶反应形式化为底物—酶—产物的三元组，在嵌入空间中满足头 + 关系 ≈ 尾的平移关系，把蛋白和小分子真正放进同一个几何问题里双粒度对比学习：区分粗粒度负样本（替换产物，破坏反应可行性）和细粒度负样本（替换酶，影响催化效率），分别对应不同大小的几何边界，让模型学习不同层次的功能差异交叉注意力机制：将底物信息注入酶编码器，使同一条酶序列在面对不同底物时可以形成不同表示，捕捉酶的广谱性和诱导契合效应统一的预训练框架：用同一套酶反应表示支撑检索、底物预测和位点分析三个任务，减少了为每个任务单独设计模型的需求 ERAM的核心想法：把酶反应写成底物—酶—产物三元组，再用统一的嵌入空间去学习这些实体之间的关系。这样得到的表示既能支持检索，也能迁移到其他下游任务。更完整的技术细节和对照表请见附录。研究内容数据集与任务设置理解这篇论文，先要把两个基础问题搞清楚：数据是怎么过滤的、任务到底在测什么。这两点如果不说清，后面的检索、底物预测和位点分析就会混在一起看。数据来源是 UniProtKB/Swiss-Prot 和 RHEA。经过过滤后，最终数据集包含 254,106 个反应样本、197,352 条独特酶序列、1718 个 EC 编号和 3048 个化学反应，训练／验证／测试按 8:1:1 划分。这里有几条过滤规则特别关键，因为它们直接决定了模型的适用边界：过滤维度条件含义序列长度超过 1024 aa 的酶序列去掉受 ESM-2 编码长度限制分子大小超过 256 个原子的小分子去掉受 Uni-Mol 编码范围限制反应平衡性底物和产物完全相同的反应去掉保证三元组平移关系有意义 EC 频次出现少于 10 次的 EC 样本去掉保证训练稳定和正样本数量这组设置有一个很实际的后果：ERAM主要验证的是频次足够、定义相对清楚的酶反应。它能保证训练稳定，但也意味着模型对真正长尾EC、极少见反应类型和更复杂体系的能力，没有在这篇论文里被直接展开。把下游任务拆开看，也会更清楚：任务输入输出真正检验的能力产物检索底物 + 酶候选产物排序是否学到正确的反应映射酶检索底物 + 产物候选酶排序是否学到反应级功能表示底物预测酶 + 候选底物二分类或打分表示迁移后是否保留催化相容性位点分析酶序列 + 底物SMILES 注意力热区内部表示是否含有功能位点信息这样看就很清楚：检索任务是表示学习的直接考试，底物预测更像迁移测试，位点分析则更像可解释性测试。三者都重要，但证据强度本来就不该被等量齐观。核心方法：ERAM框架设计图1：ERAM框架与方法概述。（A）模型结构概览：酶编码器包含冻结的ESM-2骨干、自注意力块、交叉注意力块、MLP和均值池化；小分子编码器由冻结的Uni-Mol、自注意力块、MLP和均值池化组成；底物和产物共享同一个编码器。（B）知识图谱中反应物（底物）、酶和产物之间的关系，以及小批量数据的三元组损失函数，其中 $d(e_q, e_t)$ 表示查询嵌入与目标嵌入之间的欧氏距离。（C）双粒度对比学习：产物被替换的样本归类为粗粒度负样本（大边界），酶被替换的样本归类为细粒度负样本（小边界）。（D）酶原型学习过程：通过计算酶嵌入与原型的余弦相似度交叉熵来更新编码器，再使用动量方法（如指数移动平均）更新原型。 ERAM由两条主分支构成。小分子编码器把底物和产物转成 SMILES，再用预训练的 Uni-Mol 生成原子级表示；酶编码器则把氨基酸序列输入 ESM-2，得到残基级表示。两边最终都会被投影到同一个嵌入空间里——你可以把这个空间想象成一个多维坐标系，相似的分子或酶会靠得更近。交叉注意力模块让酶编码器在处理酶序列时，能够关注底物相关的部分，这样同一条酶序列在面对不同底物时可以形成不同表示。这个设计对应的，其实就是论文反复强调的酶广谱性（一个酶能催化多种底物）和诱导契合（底物结合后酶构象发生变化）：底物不同，酶的有效表示也应该不同，否则很难把同一酶催化不同底物的差异学出来。 ERAM把一个酶反应概念化为知识图谱三元组：底物是头实体，酶是关系，产物是尾实体。知识图谱就像社交网络，节点是实体，边是它们之间的联系。训练目标：要求底物嵌入加上酶嵌入后尽量接近产物嵌入（图1B），也就是头实体加关系约等于尾实体。你可以把这个理解为向量空间中的国王减男人再加女人约等于王后。这一步把蛋白和小分子真正放进了同一个几何问题里。更关键的设计是双粒度对比学习和酶原型学习。双粒度对比学习：区分两种不同层次的负样本。粗粒度负样本替换产物，会直接破坏化学平衡、让反应完全不可行，因此用大margin γ₁=12 作为距离下界；细粒度负样本替换酶，酶作为催化剂只影响反应速率而不改变化学平衡，因此用小margin γ₂=3 作为距离下界。这个区分很重要，因为从化学平衡角度看：换产物等于换反应（完全错了），换酶等于换催化剂（反应还能进行，只是速率不同）。具体loss函数形式如下。给定底物嵌入 $h_s$、酶嵌入 $h_e$、产物嵌入 $h_p$，模型学习满足平移关系 $h_s + h_e \approx h_p$。训练目标是最小化正样本距离，同时最大化负样本距离： [\mathcal{L}{\text{total}} = \mathcal{L}{\text{coarse_neg}} + \mathcal{L}{\text{fine_neg}} + \mathcal{L}{\text{other}}] 其中： [\mathcal{L}_{\text{pos}} = \min |h_s + h_e - h_p|] [\mathcal{L}{\text{coarse_neg}} = \max(0, \gamma_1 - |h_s + h_e - h{p’}|), \quad \gamma_1 = 12] [\mathcal{L}{\text{fine_neg}} = \max(0, \gamma_2 - |h_s + h{e’} - h_p|), \quad \gamma_2 = 3] 这里 $h_{p’}$ 是错误产物嵌入，$h_{e’}$ 是错误酶嵌入。粗粒度loss要求错误产物距离至少为12（换产物=换反应），细粒度loss要求错误酶距离至少为3（换酶=换催化剂）。酶原型学习为每个酶类别（不是单个酶）学习一个代表性向量（原型）。具体来说，原型初始化为同一类别内所有酶嵌入的均值，训练过程中通过动量方法（如指数移动平均）持续更新。在每次迭代中，编码器通过计算小批量内酶嵌入与对应原型的余弦相似度交叉熵来优化，使同类酶的嵌入更接近各自的原型。这就像给每个酶类别建立了一个移动的标杆，即使同一个酶在不同反应中出现，模型也能通过原型识别出它们属于同一类别。消融实验显示，去掉原型学习后酶检索MAP从 $0.8202$ 降到 $0.8014$，说明原型学习对建立稳定的酶级表示特别重要。方法：知识图谱引导的关系学习图2：嵌入空间可视化。（A）ERAM 学到的酶表示的二维 T-SNE 投影；（B）预训练 ESM-2 酶表示的二维 T-SNE 投影。每个点代表一个酶的嵌入表示，随机选取 15 个酶类别用不同颜色高亮。（C）ERAM 学到的酶表示（灰色）与小分子表示（红色）的联合二维 T-SNE 投影。（D）酶表示的模长分布。（E）小分子表示的模长分布。图2提供了关键的直观证据：ERAM 学到的表示比 ESM-2 更加语义紧凑和一致。原文这里先把训练集分子映射到 512 维潜在空间，再用 T-SNE 压到二维。对比图2A和图2B，随机高亮的 15 个酶类别在 ERAM 表示空间中形成了更清晰的聚类边界，同色点更集中；而在 ESM-2 表示空间里，这些类别更分散、重叠也更明显。原文据此的判断是：ERAM 在训练过程中学到了更紧凑、更一致的功能语义表示，而不只是保留了序列层面的相似性。图2C更重要，因为它直接对应这篇方法设计的核心。酶和小分子被放进同一个共享表示空间里，但并没有混成一团：酶表示形成较紧的灰色聚类，小分子表示则更分散，并从外围包住这些酶簇。原文把这一现象解释为：模型确实把酶和小分子的功能差异编码进了表示里，因此两类对象在共享空间中呈现出可分但相关的结构。图2真正想说明的是：双粒度对比学习把两类“错误”分成了不同尺度。单纯替换产物，会让反应在知识图谱三元组里出现更大的不匹配；替换酶，通常更多影响反应速率，而不一定立刻破坏可行性。沿着这条思路，原文进一步推断小分子表示的模长应该显著大于酶表示，图2D和图2E给出的分布正是对这一点的定量支持。结果1：检索任务给出了最核心的证据图3：涉及同分化合物的酶反应产物检索结果。同分异构体（isomeric compounds）是酶反应检索中最具挑战性的场景——这些化合物分子式完全相同，仅在原子连接或空间排列上略有差异，传统化学描述符难以区分。图3展示了ERAM如何处理这类难题：通过反应物与酶的组合表示，在候选同分异构体中精确找到正确产物。图中的 distance 就是欧氏距离——底物与酶的组合嵌入到每个候选产物的距离，距离越小排名越前，正确产物距离最小、排在第一。图3包含6个反应示例（A-F），覆盖EC1-EC6的酶类别（EC7转位酶的底物和产物相同，故不在此列）。例如图3A展示了Methionine-R-sulfoxide reductase催化的甲硫氨酸氧化反应，ERAM准确识别了手性变化；图3E展示了Phyllocladan-16-alpha-ol synthase催化的GGDP类型B环化反应，同样精确识别了产物。这些案例直观证明：ERAM学到的表示能够捕捉酶对同分异构体的精确选择性，而分子式相同不足以混淆模型的判断。正文最重要的一句在摘要里：ERAM 的酶检索 MAP 相对 CREEP 提高了 28.31%。表1进一步给出了不同序列同一性测试集上的完整结果：序列同一性范围产物MRR 产物Hit@1 酶MAP 完整测试集（0–100%） 0.9836 0.9701 0.8202 70–80% 0.9980 0.9961 0.9684 60–70% 0.9988 0.9980 0.9733 50–60% 0.9982 0.9968 0.9752 40–50% 0.9949 0.9898 0.9723 0–40% 0.9952 0.9903 0.9770 序列同一性是指测试集中的酶序列与训练集中的酶序列的相似程度。用MMseqs聚类氨基酸序列后，将测试集分成5组：0-40%表示测试集与训练集差异最大（最远缘），70-80%表示相似度很高（接近训练数据）。指标含义：MRR（平均倒数排名）衡量正确答案的平均排序位置；Hit@1是top-1准确率；MAP是平均精度均值。这三个指标都是越高越好。这组结果有两个看点。第一，完整测试集上的产物检索已经非常强，MRR 和 Hit@1 分别达到 0.9836 和 0.9701。第二，低序列同一性子集并没有明显拖垮表现，作者据此认为 sequence identity 对模型影响较小。更重要的是，论文按 EC 大类统计了酶检索 MAP，并与基线方法 Reactyme 和 CREEP 进行了全面对比： EC子集 Reactyme MAP CREEP MAP ERAM MAP ERAM提升（相对Reactyme） ERAM提升（相对CREEP） EC1（氧化还原酶） 0.5688 0.7246 0.7874 +38.44% +8.65% EC2（转移酶） 0.7033 0.8089 0.8913 +26.73% +10.18% EC3（水解酶） 0.6747 0.7708 0.9465 +40.31% +22.80% EC4（裂合酶） 0.7388 0.7858 0.8102 +9.68% +3.11% EC5（异构酶） 0.7801 0.8037 0.8433 +8.11% +4.93% EC6（连接酶） 0.8627 0.8075 0.9513 +10.28% +17.82% EC7（转位酶） 0.7794 0.6866 0.9395 +20.56% +36.86% w/o EC（无EC注释） 0.4238 0.4992 0.8180 +93.01% +63.86% 这张表格清晰地展示了三个关键结论：第一，ERAM在所有EC门类上都全面优于基线方法。第二，w/o EC子集的提升最为惊人——这对实际应用至关重要，因为真实世界中大量酶缺乏EC注释。第三，不同EC门类的难度差异明显：EC1和w/o EC最难（候选产物多样性高），EC3、EC6、EC7相对容易。图4：Reactyme模型、CREEP和ERAM在酶检索任务中的性能比较。（A）不同序列同一性范围下的酶检索MAP，ERAM在低序列同一性（0-40%）时优势最明显，基线方法性能急剧下降。（B）不同EC门类下的酶检索MAP，ERAM在所有EC门类上全面优于基线方法。BCE表示使用二元交叉熵损失训练，Contra表示使用对比损失训练。这张图印证了表1和表2的定量结论。结果2：底物预测验证了表示的可迁移性图5：底物预测任务中的模型性能。这张图要回答的核心问题是：ERAM学到的表示是否真的理解了酶-底物相容性，还是只记住了训练数据中的相关性？为了检验这一点，论文设计了三种越来越严格的数据划分策略：（A-C）Nitrilase底物预测在随机划分、序列划分和底物划分下的ACC、ROC-AUC和MCC。（D-F）Aminotransferase底物预测在相同三种划分下的性能对比。ERAM在所有划分策略下都优于ESP方法，特别是在最严格的底物划分下优势更明显。图5的关键发现是：ESP在底物划分下性能急剧下降，而ERAM下降相对平缓。这说明 ERAM 学到的不只是底物与酶的共现统计，而是更接近酶反应层面的催化相容性。三种数据划分策略的难度递进，数据集划分比例为7:1:2（训练/验证/测试），三种策略统一用此比例，验证集同样按相应维度做了拆分：随机划分（Random split）：完全随机打乱，训练集和测试集可能包含相同酶的相似底物。这是最容易的设置，检验的是基本拟合能力。序列划分（Sequence split）：按酶的氨基酸序列划分，确保训练集和测试集的酶序列不同。这相当于见过这个酶的兄弟姐妹，但没见过这个酶本人，检验的是对新酶的泛化能力。底物划分（Substrate split）：按底物分子结构划分，确保训练集和测试集的底物结构不同。这是最难的设置，相当于完全没见过这类底物，检验的是对酶-底物相容性的深层理解。注：关于底物划分具体怎么实现——骨架聚类、分子指纹相似度还是其他方式——论文正文里没有展开，这是方法描述里的一个空白。这里要先说清：底物预测不是零样本读取。零样本是指模型在没有见过任何训练示例的情况下直接预测，但2.5.4节明确写到，底物预测阶段先用训练集对 ERAM 做了微调（fine-tune）——具体做法是让酶嵌入靠近正确底物、远离错误底物，然后根据验证集 MCC 确定距离阈值，再用这个阈值给测试集打标签。所以论文标题里的任务无关，更准确的含义是：同一套预训练表示可以迁移到不同下游任务，而不是完全不训练直接预测。这两者是不同的——零样本要求模型在测试时没有任何相关监督信号，而 ERAM 在底物预测上仍然用了有监督微调。数据集 ERAM MCC ESP MCC 提升幅度 Nitrilase 0.712 0.525 35.53% Aminotransferase 0.689 0.560 22.97% 因为主文这里更多是两个代表性数据集和百分比提升，还没有像检索任务那样给出成体系的子集分析和消融闭环。结果3：注意力权重可以落到已知结合位点上图6：ERAM在已注释酶上的结合位点注意力分布。左侧展示酶氨基酸序列的注意力分数可视化（序列logo），右侧显示UniProtKB中注释的酶结合位点；高注意力残基与已知结合位点高度一致。（A,B）磷酸核糖基转移酶（A1AXP4和B5BDQ2）。（C）腺苷酰硫酸激酶（A6KXG9）。（D）NAD激酶（Q49897）。这段要验证的是：模型在没有额外使用结合位点标注训练分类器的情况下，高注意力区域能否对应到已知底物结合位点附近。四个例子的序列位置如下： A1AXP4（磷酸核糖基转移酶）：高注意力分数集中在第124至132位（DDVITVGTA），对应5-磷酸-α-D-核糖1-二磷酸（PRPP）的结合位点 B5BDQ2（同一家族）：高注意力分数落在第88至96位（DDLVDTGGT），同样对应PRPP结合位点 A6KXG9（腺苷酰硫酸激酶）：高注意力分数集中在第34至41位（GLSGSGKS），对应ATP结合位点 Q49897（NAD激酶）：高注意力分数落在第204至209位（TAYAFS），对应NAD+结合位点这些序列 logo 和 UniProtKB 标注高度吻合。更准确地说，这里没有额外使用结合位点监督信号：注意力来自酶编码器在反应表示学习中的内部权重分布，后处理时再把高注意力区域和已知位点标注对照。 ERAM 的酶编码器包含一个 transformer block，其中有 7 个注意力头。训练时这 7 个头没有预设的位点任务，学完之后自然关注序列的不同位置。训练完成后，论文在 PLIP 基准上逐一比较 7 个头的 Overlap 和 FPR，完整结果见附录（SI表S6）。Overlap（重叠分数）是注意力预测位点与真实结合位点的交并比，越高越好；FPR（假阳性率）是非结合残基被误标的比例，越低越好。注意力头 Overlap FPR Head 1 68.58% 44.12% Head 2 69.14% 43.94% Head 3 69.31% 43.77% Head 4 69.56% 43.49% Head 5 70.59% 42.36% Head 6 70.64% 45.14% Head 7 70.85% 45.28% Head 7 的重叠分数最高，但 FPR 也最高；Head 5 只低了 0.26 个百分点的重叠分数，却把 FPR 压到所有头里最低。论文因此选择 Head 5 进入后续评估。放到 PLIP 基准里比较时，ERAM 的 Overlap 达到 70.59%，FPR 为 42.36%；相较 RXNAAMapper 和 Pfam-based 方法，它同时给出更高的重叠分数和更低的假阳性率。结果4：对缺乏高质量注释的酶做位点预测图7：A0A1D8PI71（角鲨烯合酶）的位点分析。A0A1D8PI71 属于甾醇合成途径（ergosterol biosynthesis pathway），参与该途径的后期步骤。由于没有晶体结构，文章先用 AlphaFold2 预测蛋白结构，再用 AutoDock Vina 与 NADP 对接，PyMOL 可视化结果。如图所示，高注意力残基落在结合口袋内；再用 BLAST 确认蛋白属于类异戊二烯生物合成酶家族，Y178、A183、V186、G187、L190、G216、L219、R226 等高注意力残基与该家族中经过实验验证的保守结合位点完全吻合。结果5：小分子编码器也学到了反应位点图8：小分子编码器注意力权重的可视化。模型将注意力分配到发生化学反应的活性位点以及参与反应的重要官能团上，说明小分子编码器也学到了与反应相关的化学知识。酶编码器和高注意力残基对应，小分子编码器和反应位点对应，两者都说明 ERAM 学到的不是简单的序列相似性或分子相似性，而是更接近谁和谁发生催化作用、在哪些位置发生的表征。这篇论文虽然把任务无关写在标题里，但真正值得关注的地方其实是：同一套表示在多个层面都能读出化学和生物学结构。结果6：消融实验告诉我们哪些设计最重要论文的表3给出了最关键的一组消融结果：方法产物MRR 产物Hit@1 酶MAP 含义 Margin-Fine 0.9773 0.9655 0.8325 所有负样本统一用细粒度边界（小margin） Margin-Coarse 0.9669 0.9502 0.7525 所有负样本统一用粗粒度边界（大margin） w/o Prototype 0.9829 0.9696 0.8014 去掉原型学习模块 Self-Attn 0.9781 0.9593 0.6755 用自注意力替代交叉注意力 ERAM 0.9836 0.9701 0.8202 完整模型（双粒度+原型+交叉注意力）这张表有三处值得留意：交叉注意力很关键：Self-Attn 的酶 MAP 只有 0.6755，明显低于 ERAM，说明底物信息注入酶编码器至关重要原型学习主要拉高酶检索：原型学习为每个类别学习一个代表性向量。去掉原型后，产物检索变化不大，但酶 MAP 从 0.8202 降到 0.8014，说明原型学习对酶级表示特别重要，就像给每个酶建立了一个标准档案一样双粒度学习的收益并不平均：ERAM 明显优于 Margin-Coarse，但与 Margin-Fine 非常接近，说明细粒度负样本已经能覆盖相当一部分收益因此，更客观的说法是：双粒度设计至少避免了统一大边界带来的明显退化，但它相对 Margin-Fine 的额外收益主要体现在产物检索，酶检索上的优势没有被拉得很开。这里其实藏着全文最值得追问的一点：如果只保留细粒度负样本，模型已经能拿到非常接近的结果，那么双粒度设计的额外价值究竟主要体现在哪些反应类型、哪些检索场景，论文还没有讲到完全闭环。关键结论与批判性总结和现有方法放在一起看，ERAM到底新在哪里如果只看摘要，很容易把 ERAM 理解成又一个把蛋白和小分子拼在一起的模型。但把正文里的几个基线放在一起看，它的区别其实很清楚。CREEP 的重点是酶反应检索，ESP 的重点是底物预测，RXNAAMapper 的重点是无监督位点映射。 ERAM想做的，则是让这三件事共用同一套预训练表示。这也是为什么这篇论文真正有价值的地方，不只是几个百分点的提升，而是它提出了一种统一入口：先用酶反应级表示作为基础，再把不同任务当作不同读取方式，而不是为每个任务从头建一个模型。这个想法有现实价值。因为在酶工程场景里，研究者通常不会只问一个问题，而是会连续地问：这个反应可能由哪些酶催化，这个酶可能接受哪些底物，真正起作用的位点又大概在哪里。如果这三件事都要切换模型，工作流会非常碎；如果它们能回到同一套表示空间，后续分析就会顺很多。三个任务放在一起，ERAM到底证明了什么如果把全文最重要的几组结果连起来看，ERAM真正证明的是下面这条证据链：检索任务证明统一表示本身确实有信息量，底物预测证明这套表示可以迁移到另一类判别任务，位点分析证明模型内部信号和真实功能区域存在对应关系。检索任务是最直接的验证，因为它直接考察反应级嵌入空间是不是站得住；底物预测往前走了一步，证明这些表示能迁移到判别任务；位点分析再往前走一步，说明模型内部注意力并不是完全无生物学意义。这个逻辑总体是成立的，但证据强度并不完全对称：检索任务证据最强，底物预测次之，位点分析最需要后续实验补强。这篇论文没有真正回答什么最明显的一条边界来自数据筛选：出现少于 10 次的 EC 样本在建库前就被去掉了。这一步对训练稳定当然有帮助，但也意味着 ERAM 还没有直接回答极低频 EC 怎么办、训练时完全没见过的功能类别怎么办。位点分析虽然已经很有启发性，但它解决的是模型内部信号是否能和已知功能区域对上，还没有解决这些高注意力残基是不是因果位点。如果后续能补几组突变实验，这一部分的说服力会立刻上一个台阶。而且是对接做的，不是真有结构（图6不知道怎么来的），而且只展示了特定例子，没有系统的Benchmark。 ERAM把底物、酶和产物压进同一套表示空间，本身就默认了一个前提：很多酶反应可以被一个相对统一的三元组框架概括。对经典单酶反应，这个前提通常成立；但对多酶复合物、强依赖辅因子的体系或者更复杂的反应网络，这篇论文还没有展开。论文本身也在结论里提到：将酶的结构信息纳入训练过程有望进一步提升表示质量，但目前模型依赖的是预训练嵌入，还没有利用结构层级的几何约束。把本文放回实际工作流里看，它最适合扮演的角色不是终局预测器，而是一个统一的前端筛选器。研究者可以先用它做酶检索，再用同一套表示去筛底物兼容性，最后再把高分样本的注意力区域拿去辅助位点设计。这种定位有两个好处：信息在同一套表示空间里流动，不用在多个模型之间来回切换；就算后面仍然要接结构建模、分子对接或突变实验，前面的搜索空间也已经被明显压小。还缺什么，才能把这篇论文再往前推一步从正文和附录里能直接看出的缺口，主要有四类：效率评估：主文没有报告训练时间、推理速度和显存占用，大模型在实际部署中的成本仍不清楚长尾 EC 测试：当前数据筛选会压缩低频 EC，后续需要更直接地检验少样本或零样本能力失败案例系统分析：文中提到多反应酶、层级分类和 R 基团等难点，但主文没有把错误模式拆开讲实验验证闭环：位点分析如果能接上突变实验，解释力会明显更强小编锐评：侯老师他们还是画图不错的，也比较有chemical intuition，学习一下酶领域常见的任务和指标吧，定性的能用来注释的也算一类。原来用ESM和UniMol，就算是一种“预训练过了”的感觉？后面的组合似乎也不复杂，cross-attention都是protein-ligand的常规操作了。还得是有真正的互作信息。但是这种也不是基于物理的，结合位点的片段或motif相似其实也是能抄的，attention找结合位点和原子能整对，也是ESM和UniMol和这类框架的共同贡献。其实生物研究里面也不那么要求全新的反应也能弄对。所以这个领域可能还是有一点提升空间的，尤其那个未知类别的。反倒是能把已知可能结合位点（甚至文本描述信息）融入进去来预测构象是比较有意思的。详细技术细节、完整子集结果和更精简的对照表请参见：附录

Specific Sytems · 2026-04-20

ERAM框架技术附录

ERAM框架技术附录本文信息标题：通过多模态关系学习实现准确且任务无关的酶反应建模作者：Yuansheng Huang, Lanqing Li, Wenjia Qian, Jiahui Yu, Huifeng Zhao, Xiaorui Wang, Odin Zhang, Guangyong Chen, Shukai Gu, Pheng-Ann Heng, Tingjun Hou, Yu Kang 发表时间：2026年3月30日单位：浙江大学药学院（中国杭州）、浙江实验室生命科学计算研究中心（中国杭州）、香港中文大学计算机科学与工程系（中国香港）、新加坡国立大学计算学院（新加坡）、华盛顿大学 Paul G. Allen 计算机科学与工程学院（美国西雅图）引用格式：Huang Y, Li L, Qian W, Yu J, Zhao H, Wang X, Zhang O, Chen G, Gu S, Heng PA, Hou T, Kang Y. Accurate and task-agnostic modeling of enzymatic reactions through multimodal relational learning. Acta Pharmaceutica Sinica B. 2026. https://doi.org/10.1016/j.apsb.2026.03.052 代码与资源： Web服务器：http://cadd.zju.edu.cn/eram/ 本附录收纳主文没有展开的任务设置、表格结果和方法细节。主文档：ERAM：任务无关的多模态酶反应建模 A. 数据与任务设置 A.1 数据处理流程数据来自UniProtKB/Swiss-Prot和RHEA。论文对原始样本做了四类过滤：筛选维度具体要求序列长度去掉长度超过1024 aa的酶序列分子大小去掉原子数超过256的小分子反应平衡性去掉底物和产物完全相同的反应样本频次去掉EC编号出现少于10次的样本最终数据集包含254,106个反应样本、197,352条独特酶序列、1718个EC编号和3048个反应，训练／验证／测试按8:1:1划分。精读注记：这套筛选能保证训练稳定，但也意味着论文没有直接检验真正长尾EC的能力。更稳的说法是，ERAM在出现频次足够的EC类别上表现稳健，而不是已经覆盖整个酶空间。 A.2 产物检索指标给定底物和酶，从候选产物池中检索出正确产物。涉及两个核心指标： MRR（Mean Reciprocal Rank，平均倒数排名）：计算所有测试样本正确答案排名的倒数的平均值。简单来说，如果正确答案排在第1位得1分，第2位得0.5分，以此类推。MRR越高，说明模型把正确答案排得越靠前 [MRR = \frac{1}{ Q } \sum_{i=1}^{ Q } \frac{1}{\text{rank}_i}] Hit@1：计算正确答案排在第1位的测试样本占比。如果第1个推荐就是正确答案计为1，否则为0。Hit@1越高，说明模型的top-1准确率越高 [\text{Hit@1} = \frac{1}{ Q } \sum_{i=1}^{ Q } \mathbb{1}(\text{rank}_i = 1)] A.3 酶检索指标给定底物和产物，从候选酶池中检索出正确酶。由于每个反应可能存在多个可行酶，评估排序质量需要用MAP： MAP（Mean Average Precision，平均精度均值）：对于每个查询，按排序位置计算精度的加权平均，再把所有查询的AP求平均。MAP越高，说明模型在多个相关酶的排序中表现越好 [MAP = \frac{1}{ Q } \sum_{q=1}^{ Q } AP_q] 其中每个查询的平均精度为： [AP_q = \frac{1}{n_{\text{target}}} \sum_{k=1}^{n} P(k) \cdot \text{rel}(k)] $P(k)$ 是前k个结果的精度（正确答案占比），$\text{rel}(k)$ 指示第k个结果是否为相关酶（是为1，否为0），$n_{\text{target}}$ 是相关酶总数。通俗理解：$AP_q$回答的是这个查询的所有正确答案，平均排在多靠前。例如有3个正确答案分别排在第1、3、5位，那么第1位精度1/1=1，第3位精度2/3≈0.67，第5位精度3/5=0.6，AP=(1+0.67+0.6)/3≈0.76。正确答案越靠前，AP越接近1；越靠后，AP越接近0。 A.4 底物预测底物预测部分，主文其实给了几条很实用的细节。先看数据集本身：数据集规模本文补充说明 Nitrilase 240 个数据点覆盖 12 个酶与 20 个底物的全部组合 Aminotransferase 原始 450 个数据点以 0.1 U/mg 作为活性阈值做二分类，去掉与ERAM预训练重叠的数据后保留 444 条论文还明确说明，ESP里用过的 glycosyltransferase 底物预测数据集这次被排除了，因为糖受体有多个可能的糖基化位点，会导致产物不固定，不适合当前这套反应建模方式。在划分方式上，主文只明确给了三种策略：随机划分（Random split）按酶的氨基酸序列划分（Sequence split）按底物划分（Substrate split）这两个主数据集都被划成训练 / 验证 / 测试 = 7:1:2。也就是说，底物预测阶段是有单独验证集的，后面分类阈值也是从验证集上选出来的。这里最需要说清的一点是：原文只写了 splitting by substrates，没有进一步展开按底物划分到底是按骨架聚类、分子指纹相似度、Tanimoto 阈值，还是别的结构划分算法。所以现在最稳的表述只能是：论文明确存在 substrate split 这个更严格的设置这个设置的目的，是让训练集和测试集在底物层面解耦但主文和 SI 都没有写清具体的分子结构划分算法换句话说，可以确定它不是简单的随机划分，但还不能根据本文进一步写成按骨架聚类或按分子指纹聚类。除了 Nitrilase 和 Aminotransferase，作者又在 SI 里测了 OleA thiolase family 和 DUF849 family。Figure S7 只给了图，没有额外展开划分算法，但它至少说明底物预测的迁移性不是只在两个主数据集上单次成立。关键发现仍然是：ESP在底物划分下性能下降更明显，而ERAM下降相对平缓，这支持了ERAM学到的是催化相容性，而不只是训练集里的统计共现。 A.5 结合位点分析不额外训练位点分类器，直接读取注意力头，评估Overlap和FPR。作者比较了多个注意力头，主文最终采用的是Head 5：注意力头 Overlap FPR 备注 Head 7 70.85% 45.28% 重叠略高，但假阳性更多 Head 5 70.59% 42.36% 主文采用的平衡点这也是摘要里与RXNAAMapper比较时使用的ERAM结果。 A.6 三个任务分别在回答什么问题任务输入输出真正在检验什么酶检索底物 + 产物候选酶排序统一表示是否真的学到反应级关系产物检索底物 + 酶候选产物排序模型能否区分很接近的化学转换底物预测酶 + 候选底物二分类或打分预训练表示迁移后是否仍保留催化相容性位点分析酶序列 + 底物上下文注意力热区表示里是否自发带出功能位点信息把这四件事放在一起看，就能明白为什么作者先把检索放在最前面：检索是表示质量的直接测试，底物预测和位点分析更像迁移测试与可解释性测试。 B. 消融实验：哪些模块真在起作用 B.1 表3完整结果（检索任务）方法产物MRR 产物Hit@1 酶MAP Margin-Fine 0.9773 0.9655 0.8325 Margin-Coarse 0.9669 0.9502 0.7525 w/o Prototype 0.9829 0.9696 0.8014 Self-Attn 0.9781 0.9593 0.6755 ERAM 0.9836 0.9701 0.8202 B.2 底物预测消融（SI表S4和S5）主文只给了两个数据集的MCC对比，SI补充了完整消融，包含一个主文表3里没有的变体——Unbalanced（不平衡数据集，即正负样本数量不均衡）：表S4 Nitrilase底物预测消融：方法 Random ACC Random MCC Sequence MCC Substrate MCC Margin-Fine 0.9167 0.7939 0.6924 0.4275 Margin-Coarse 0.7291 0.2273 0.7105 0.3689 w/o Prototype 0.8958 0.7406 0.5046 -0.0242 Unbalanced 0.8958 0.754 0.3125 -0.0308 Self-Attn 0.8958 0.754 0.8726 0.5465 ERAM 0.9375 0.8529 0.7105 0.5538 表S5 Aminotransferase底物预测消融：方法 Random ACC Random MCC Sequence MCC Substrate MCC Margin-Fine 0.8667 0.546 0.7145 0.7145 Margin-Coarse 0.8556 0.6425 0.5502 0.5021 w/o Prototype 0.8111 0.5552 0.6404 0.7145 Unbalanced 0.8667 0.6714 0.6147 0.74 Self-Attn 0.7667 0.5048 0.5627 0.663 ERAM 0.8667 0.6714 0.7194 0.74 精读注记：Unbalanced变体在Nitrilase的底物划分下MCC接近0甚至为负，说明正负样本不均衡时底物划分几乎完全失效——这进一步说明，底物划分的难度本身已经很大，如果再加上类别不平衡，模型根本找不到可用的信号来区分底物兼容性。 B.3 注意力头对照（SI表S6）注意力头 Overlap FPR Head 1 68.58% 44.12% Head 2 69.14% 43.94% Head 3 69.31% 43.77% Head 4 69.56% 43.49% Head 5 70.59% 42.36% Head 6 70.64% 45.14% Head 7 70.85% 45.28% Head 8 70.72% 44.95% Self-Attn 的 FPR 高达 61.60%，远高于 ERAM 的 42.36%——说明没有交叉注意力时，注意力信号几乎是随机散布，假阳性大幅增加。 B.4 结合位点预测消融（SI表S7）方法 Overlap FPR Margin-Fine 69.71% 43.16% Margin-Coarse 70.32% 43.16% w/o Prototype 70.36% 51.11% Unbalanced 68.56% 44.17% Self-Attn 70.18% 61.60% ERAM 70.59% 42.36% 读表注记：Self-Attn 的 FPR 高达 61.60%，说明没有交叉注意力时注意力信号几乎随机散布。双粒度设计（ERAM vs Margin-Fine/Margin-Coarse）和原型学习（ERAM vs w/o Prototype）均对压低 FPR 有贡献。 C. 泛化结果：序列同一性和EC子集 C.1 不同序列同一性测试集序列同一性范围产物MRR 产物Hit@1 酶MAP 完整测试集（0–100%） 0.9836 0.9701 0.8202 70–80% 0.9980 0.9961 0.9684 60–70% 0.9988 0.9980 0.9733 50–60% 0.9982 0.9968 0.9752 40–50% 0.9949 0.9898 0.9723 0–40% 0.9952 0.9903 0.9770 作者据此认为sequence identity 对 ERAM 影响较小。这组结果的阅读重点不是低同一性一定更容易，而是低同一性子集并没有表现出明显塌陷。 C.2 不同EC子集上的酶检索MAP EC子集 Reactzyme CREEP ERAM EC1 0.5688 0.7246 0.7874 EC2 0.7033 0.8089 0.8913 EC3 0.6747 0.7708 0.9465 EC4 0.7388 0.7858 0.8102 EC5 0.7801 0.8037 0.8433 EC6 0.8627 0.8075 0.9513 EC7 0.7794 0.6866 0.9395 w/o EC 0.4238 0.4992 0.8180 值得注意的是w/o EC子集。主文明确写到，ERAM在这个最难子集上相对Reactzyme和CREEP仍有明显优势，说明它并不完全依赖显式EC标签来做检索。 C.3 这两张泛化表应该连起来看序列同一性表回答的是：训练集里没见过的远缘酶，会不会立刻让检索失效 EC子集表回答的是：换到不同功能大类后，模型是不是只在某一类酶上有效两张表一起看，ERAM更像是对样本分布变化不太敏感，而不是已经学会了任何新酶都能预测 D. 与其他方法的对照，只保留最核心的数字 D.1 主文最可靠的对照结论任务对照方法 ERAM结果论文给出的结论酶检索 CREEP MAP相对提升28.31% 统一预训练表示优于专门检索模型底物预测 ESP MCC分别提升35.53%和22.97% ERAM在迁移后仍保持优势结合位点分析 RXNAAMapper FPR 42.36%，Overlap 70.59% 注意力信号比纯反应侧方法更贴近真实位点 D.2 这三组对照分别回答了什么与CREEP对比：回答统一表示能否胜过任务专用检索模型与ESP对比：回答这套表示迁移到底物预测后是否仍有信息量与RXNAAMapper对比：回答注意力是否真的含有位点相关信息 E. 对抗式精读：从审稿人视角最该追问的三件事 E.1 论证链条里最薄的环节在哪里检索任务：主文给了完整子集结果、基线对照和消融实验，证据最完整底物预测：结论主要依赖两个主数据集和摘要中的提升百分比，证据次之位点解释：当前仍以注意力、结构映射和保守位点对照为主，证据最薄 E.2 论文隐含了哪些前提预训练表示足够强：否则冻结的ESM-2和Uni-Mol很难支撑后续统一空间学习反应三元组足以概括催化功能：这对很多经典单酶反应成立，但对更复杂体系未必够注意力高分与功能重要性相关：这是一个合理假设，但还没有被实验级证据完全坐实 E.3 如果我是审稿人，我最想补什么长尾EC或新EC的直接测试：否则缩小序列—功能鸿沟的外推仍然偏保守更细的失败案例分类：尤其是多反应酶、层级分类和R基团相关错误突变验证：只要能补上几组高注意力残基的活性实验，位点分析这一部分会更硬 Q&A ERAM 的任务无关到底是什么意思：这里更准确的说法是统一预训练表示。酶检索可以直接用嵌入距离完成，底物预测需要在预训练表示上继续微调，结合位点分析则是从训练好的酶编码器注意力中读取信号。双粒度对比学习是不是这篇最关键的创新：它很重要，但不能说收益在所有指标上都压倒性。表3显示 ERAM 明显优于 Margin-Coarse，说明统一大边界不合适；但 ERAM 和 Margin-Fine 非常接近，说明细粒度负样本已经能覆盖相当一部分收益。结合位点预测为什么能叫无监督：因为模型没有额外用结合位点标签训练一个分类器，而是直接读取酶编码器的注意力分布。这个说法在方法定义上成立，但它和已经得到实验级解释仍然是两回事。

Specific Sytems · 2026-04-20

透明质酸硫酸化，多糖的构象特征决定其皮肤渗透能力

透明质酸硫酸化，多糖的构象特征决定其皮肤渗透能力本文信息标题：多糖的构象特征在皮肤渗透中的作用——透明质酸及其硫酸化衍生物的实验与分子模拟研究作者：Francesco Cilurzo, Giulio Vistoli, Chiara G. M. Gennari, Francesca Selmin, Fabrizio Gardoni, Silvia Franz, Monica Campisi, Paola Minghetti 发表时间：2014年（Chemistry & Biodiversity, Vol. 11, pp. 546–561）单位：意大利米兰大学制药科学系、药理与生物分子科学系；Fidia Farmaceutici S.p.A. 引用格式：Cilurzo, F., Vistoli, G., Gennari, C. G. M., Selmin, F., Gardoni, F., Franz, S., Campisi, M., & Minghetti, P. (2014). The Role of the Conformational Profile of Polysaccharides on Skin Penetration. Chemistry & Biodiversity, 11, 546–561. https://doi.org/10.1002/cbdv.201300130 摘要透皮给药是一种成熟且有吸引力的给药途径。然而，药物的皮肤吸收受到角质层的限制。文献数据表明，生物大分子有能力渗透人体皮肤，尽管其透皮渗透似乎受制于与小分子截然不同的物理化学参数。本研究旨在考察透明质酸（HA）及其硫酸化衍生物（HAS）通过人体表皮的体外扩散特性。实验测试了低分子量和中分子量的HA以及两种硫酸化程度的衍生物。体外研究表明，硫酸化聚合物比相应的HA渗透性更好，尽管它们的极性大大增加；而无论硫酸化程度如何，渗透量都随聚合物分子量的增加而显著降低。使用荧光标记多糖的实验还表明，透明质酸对角质细胞有很高的亲和力，可能主要通过跨细胞途径穿过角质层。分子动力学研究揭示了所观察到的渗透现象可以通过监测多糖的构象特征来合理解释：渗透性与多糖采取伸展且灵活构象的能力直接相关。核心结论硫酸化增强渗透，但极性却增加：硫酸化衍生物（HAS）的渗透量高于未修饰的HA，尽管硫酸根基团大大增加了分子的极性和亲水性——这违背了小分子透皮吸收的常规规律（亲脂性越强渗透越好）。分子量是决定性因素：低分子量样品的渗透量约为对应中分子量样品的10倍，且这一效应不受硫酸化程度的影响。渗透途径更偏向跨角质细胞而非细胞间脂质网络：CLSM成像显示HAF（FITC标记的HA）在角质细胞区域呈较均一绿色着色，而不是只沿脂质间隙分布，说明它更可能与角质细胞成分发生明显相互作用。 HA在溶液中采取紧凑的左手螺旋构象：MD模拟证实，非硫酸化HA形成由氢键网络稳定的规则螺旋，这种结构较为刚硬。适度硫酸化使HA变得伸展且灵活：低硫酸化程度（约1% mol）的HA链失去螺旋结构，呈现高度伸展且动态变化的构象，其回转半径显著增大；而更高硫酸化程度（2.5% mol）则因电荷增多形成离子对网络，反而变得更为紧凑。渗透量与回转半径正相关：归一化的回转半径越高，24 h累计渗透量越大，说明伸展灵活的构象有利于多糖在皮肤中扩散。背景透皮给药与皮肤屏障透皮给药可以避免肝脏首过效应、提高患者依从性，是一种理想的给药途径。但皮肤最外层的角质层是一个多层“砖墙”结构——扁平的角化角质细胞（砖块）嵌入在由神经酰胺、胆固醇酯和脂肪酸组成的亲脂性网络（灰浆）中。对于小分子药物而言，亲脂性和分子尺寸是决定透皮渗透能力的关键因素：分子量小于500 Da、油水分配系数适中者更容易穿透。然而，生物大分子（如多糖、蛋白质）的透皮渗透研究非常有限。普遍认为，它们的大分子体积和强氢键能力会严重限制被动扩散。但矛盾的是，多糖（如肝素、软骨素、透明质酸）已被广泛用于皮肤护理和治疗产品，其渗透过程却鲜有定量研究。现有文献甚至相互矛盾：有的报道HA因高亲水性和刚性的无规卷曲构象而无法穿透角质层，另有人发现在体实验中放射性标记的HA能在30分钟内到达真皮层。透明质酸：从保水剂到潜在透皮载体透明质酸（HA）是由D-葡萄糖醛酸和N-乙酰-D-葡糖胺交替连接而成的线性多糖，在皮肤中天然存在，具有保湿、抗氧化、促进伤口愈合等多种功能。HA的硫酸化衍生物（HAS）则因其抗凝血、抗炎等活性受到关注。本研究的关键问题是：为什么带强负电的硫酸化HA（极性更大）反而比未修饰HA更容易穿透皮肤？作者假设答案不在于分子的“极性”或“大小”本身，而在于多糖的构象特征——即分子在溶液中的伸展程度和柔性。为了验证这一假设，他们结合了体外Franz扩散池实验、共聚焦显微镜成像和全原子分子动力学模拟。关键科学问题硫酸化程度如何影响HA的透皮渗透量？低硫酸化（1% mol）与高硫酸化（2.5% mol）是否有差异？分子量的影响是否与硫酸化程度耦合？低分子量（约6.5 kDa）与中分子量（约170-200 kDa）的渗透量差异有多大？ HA是通过细胞间脂质途径还是跨细胞途径渗透？共聚焦显微镜能否直接观察到多糖在皮肤中的分布？ HA的构象如何随硫酸化和分子量变化？在原子水平上，硫酸根基团如何改变糖苷键的扭转角分布和整体链的折叠？构象特征与渗透量之间是否存在定量关系？能否用回转半径、末端距等参数预测渗透能力？创新点首次系统比较不同分子量和硫酸化程度的HA的透皮渗透，并定量测定了24 h累计渗透量。首次使用FITC标记的中分子量HA进行CLSM成像，直接可视化多糖在皮肤中的分布途径。首次通过全原子MD模拟分析硫酸化对HA构象的影响，此前的研究仅涉及极短寡糖（2-4个重复单元），且从未考察硫酸化效应。提出“构象渗透假说”：伸展灵活的多糖链比紧凑螺旋结构更容易在皮肤中扩散，这一机制可能适用于其他生物大分子。研究内容实验方法皮肤来源与处理皮肤来源：人体腹部皮肤，取自30-50岁欧亚女性美容手术捐赠者。皮肤在去除后24小时内密封于真空塑料袋中，-20°C冷冻保存。表皮制备：使用前室温解冻，仔细去除多余脂肪。皮肤切成约2.5 cm²的方块，浸入60°C水中1分钟后，用镊子轻轻分离表皮与真皮组织，光学显微镜检查确保无缺陷。 Franz扩散池实验扩散池设置：使用6.0 mL受体室，受体液为脱气蒸馏水含100 mg/mL NaN3作为防腐剂，温度控制在37°C水浴循环使膜表面温度维持在32±1°C。实验操作：供体室加入1 mg/mL HA或HAS溶液，在24 h后测定累计渗透量（Q24）。原文特别指出，由于分析灵敏度限制，作者无法可靠测定通量和滞后时间，因此全文比较主要围绕Q24展开。 CLSM成像方法样品准备：使用FITC标记的中分子量HA（HAF，Mw≈190 kDa）作为样品，碘化丙啶（PI）标记角质细胞间隙。成像流程：在0.5、1、2、3、4、24 h不同时间点从Franz池取下膜，水洗后用胶带（3M Transpore）去除未吸附的渗透物，进行共聚焦显微镜成像。同时设置5 mg/L游离FITC溶液作为对照实验。 MD模拟方法模拟参数：使用NAMD 2.7软件和CHARMM v36力场，采用Gasteiger原子电荷，在16核Tyan VX50系统上运行。截断半径设为10 Å，配对列表每20次迭代更新一次，每20 ps保存一帧轨迹共500帧（覆盖10 ns）。模拟流程：作者以NMR结构 2BVK 为起点，构建HA20母链，再在N-乙酰葡糖胺C6位引入硫酸基得到HA20S5和HA20S10，并额外构建HA10用于链长对照。每条链先通过聚类Monte Carlo生成2000个候选构象，但这一步只是前处理筛构象，不是2000条MD轨迹。作者随后选取最低能构象做最小化，并把它作为后续MD起点。对水相而言，共模拟了4个模型：HA10、HA20、HA20S5和HA20S10，每个模型各进行1条10 ns MD轨迹。升温阶段从0 K到300 K持续30 ps（10 K/ps），随后进入10 ns监测阶段；每20 ps存1帧，因此每条轨迹得到500帧。所有最小化采用共轭梯度算法直至rms梯度达到0.01 $\mathrm{kcal\cdot mol^{-1}\cdot \mathring{A}^{-1}}$。此外，作者还在$\ce{CHCl3}$中对HA20和HA20S10各补做了1条10 ns轨迹，用于比较疏水环境下的构象趋势。实验设计与材料本研究涉及6种透明质酸样品，其关键参数和24 h累计渗透量（Q24）汇总于表1。表1：透明质酸（HA）及其硫酸化衍生物（HAS）、FITC标记HA（HAF）的主要特征及24 h累计渗透量（Q24） | 名称 | 硫酸化程度 [% mol] | Mw [kDa] | 多分散指数 | Q24 [nmol/cm2] | | — | — | — | — | — | | HA | 0 | 6.7 | 1.35 | 1.0 ± 0.6 | | HA | 0 | 170.2 | 1.59 | 0.1 ± 0.0 | | HAS | 1 | 6.8 | 1.25 | 4.9 ± 0.8 | | HAS | 1 | 181.3 | 1.48 | 0.6 ± 0.2 | | HAS | 2.5 | 6.4 | 1.45 | 2.4 ± 1.0 | | HAS | 2.5 | 200.1 | 1.39 | 0.2 ± 0.1 | | HAF | 0 | 190.3 | 1.43 | 0.1 ± 0.0 | 注：HAF的Q24值极低，因其分子量大且标记了FITC，但CLSM成像仍可检测其分布。结果一：硫酸化促进渗透，但分子量是更强的影响因素使用Franz扩散池，以人体表皮为膜，测定各样品24 h后的累计渗透量。由于检测灵敏度限制，作者只能可靠比较Q24，不能进一步给出稳健的通量和滞后时间。在这个前提下，实验结果有两个核心发现。硫酸化先增强后减弱渗透：表1数据显示，对于低分子量样品（约6.5 kDa），1%硫酸化使Q24从未修饰HA的1.0 $\mathrm{nmol/cm^2}$增至4.9 $\mathrm{nmol/cm^2}$，提升接近5倍；当硫酸化程度继续升至2.5% mol时，Q24又降回2.4 $\mathrm{nmol/cm^2}$。中分子量样品保持同样排序：未修饰HA为0.1，1%硫酸化升至0.6，而2.5% mol时又降至0.2。分子量主导效应更强：把低分子量和对应中分子量样品逐对比较，会发现前者的Q24大约始终是后者的10倍，即1.0对0.1、4.9对0.6、2.4对0.2。也就是说，硫酸化会调节渗透能力，但不会抹掉分子量本身的强限制作用。结果二：CLSM显示HA主要通过跨细胞途径渗透为了可视化HA在皮肤中的分布，作者使用FITC标记的中分子量HA（HAF，Mw≈190 kDa）进行共聚焦显微镜成像。图1显示：未处理的皮肤用碘化丙啶（PI）染色后，可见角质细胞区域以及表皮死细胞核的红色信号（图1a）。HAF处理30分钟后，角质层中出现绿色荧光信号（图1b），2小时后达到平衡（图1c）。原文的证据链其实是：角质细胞区域整体呈均一绿色着色，而不是只在细胞间脂质缝隙中出现条带状信号。因此作者推断，HAF与角质细胞成分有较强亲和力，并很可能主要经跨角质细胞路径通过角质层。图1：CLSM图像显示HAF在人角质层和表皮中的分布随时间变化。 a) 游离碘化丙啶在角质细胞间隙和表皮死细胞核中积累（红色）；b) 应用HAF溶液30 min后，角质层中出现绿色荧光；c) 2 h后达到平衡。原文强调，绿色信号主要对应角质细胞整体着色，提示HAF更可能与角质细胞组分发生明显相互作用。图2的z-stack投影进一步比较了HAF（图2a）和游离FITC（图2b）的分布。原文图注指出，绿色荧光可对应HAF或FITC在皮肤表面沟槽中的积累，但正文进一步说明，HAF样品中的角质细胞整体呈均一绿色，而游离FITC只有表层轻微荧光且基本不随时间变化。这说明真正与角质层组分发生明显相互作用的是HA骨架，而不是FITC本身。图2：z-stack投影显示应用30 min后的分布。 A) HAF：绿色信号主要对应角质层区域，并伴随角质细胞整体着色；B) 游离FITC：仅有轻微表面荧光。红色为PI染色信号，黄色至黄绿色区域表示HAF与组织信号重叠。此外，高效液相色谱检测显示，游离FITC在15 min的第一次采样时就已出现在受体液中，而HAF要到6 h后才首次检出，并在24 h时才能定量。色谱图中仅检测到HAF单一峰，无其他荧光信号，表明HAF在渗透过程中未被显著切割或降解。结果三：MD模拟揭示硫酸化诱导构象从紧凑螺旋向伸展柔性转变图3：透明质酸的重复单元结构。显示非硫酸化HA的重复单元，即(1→4)-β-D-葡萄糖醛酸-(1→3)-N-乙酰-β-D-葡糖胺。作者构建了四种寡糖模型进行10 ns全原子MD模拟：寡糖模型重复单元数硫酸化程度硫酸根位置用途 HA10 10 0% - 短链对照 HA20 20 0% - 代表未修饰HA HA20S5 20 1% 每4个N-乙酰葡糖胺的C6位1个硫酸根低硫酸化模型 HA20S10 20 2.5% 每2个N-乙酰葡糖胺的C6位1个硫酸根高硫酸化模型监测三个构象描述符：回转半径（Rg）：描述分子大小和形状，反映链的紧凑程度末端距（d）：链两端之间的直线距离，衡量链的伸展程度 φ和ψ扭转角的synclinal几何比例：φ和ψ是糖苷键的两个二面角，分别定义为Ha-Ca-O-C(i+1)和Ca-O-C(i+1)-H(i+1)，描述相邻糖环之间的旋转自由度。synclinal（-90°至+90°）表示扭转角处于允许的折叠构象范围非硫酸化HA采取紧凑的左手螺旋模拟结果显示，HA10和HA20均呈现规则的左手四重螺旋（图4a）。这种螺旋由广泛的氢键网络稳定，包括葡萄糖醛酸的羧酸根与相邻葡糖胺的乙酰胺基之间的相互作用，以及溶质-溶剂相互作用。HA20的归一化回转半径（0.78 Å/单元）小于HA10（1.03 Å/单元），表明长链更紧凑——螺旋轴长约1.0 nm，环直径约1.2 nm，每圈含4个二糖单元。这一结果与NMR和X射线实验数据高度一致。在扭转角分布上，ψ几乎100%保持synclinal构象，而φ的synclinal比例约为60%（表2），说明糖苷键的柔性主要来自φ角。表2：MD模拟的主要参数平均值 | 寡糖 | φ synclinal [%] | ψ synclinal [%] | 回转半径 [Å]（归一化） | 末端距 [Å]（归一化） | | — | — | — | — | — | | HA10 | 60.0 | 100 | 10.32 ± 1.05 (1.03) | 26.91 ± 4.34 (2.69) | | HA20 | 61.5 | 100 | 15.67 ± 8.37 (0.78) | 25.89 ± 8.57 (1.29) | | HA20S5 (1% 硫酸化) | 53.8 | 97.4 | 25.92 ± 1.43 (1.29) | 59.62 ± 6.07 (2.98) | | HA20S10 (2.5% 硫酸化) | 64.1 | 97.8 | 21.51 ± 3.88 (1.08) | 46.67 ± 4.15 (2.33) | 低硫酸化（1%）使链伸展且高度灵活 HA20S5（1%硫酸化）的模拟结果显示，该链完全失去了螺旋结构，呈现高度伸展且极其灵活的构象（图4c）。其回转半径（25.92 Å，归一化1.29）和末端距（59.62 Å，归一化2.98）均显著大于非硫酸化HA20（15.67 Å和25.89 Å）。更重要的是，末端距的动态曲线（图5b）显示HA20S5在约50 Å到70 Å之间反复大幅波动，表明链在高度伸展和部分折叠之间不断变换——这是高柔性的直接证据。从扭转角看，HA20S5的φ角synclinal比例从非硫酸化的61.5%降至53.8%，说明φ角更多采取反式（anti）构象，这正是链伸展的原因。图4：MD模拟中透明质酸构象的代表性快照。 a) 非硫酸化HA20的折叠螺旋结构（轴长约1.0 nm，环直径约1.2 nm，每圈4个二糖）；b) HA20S10（2.5%硫酸化）的中间构象，失去螺旋但仍较紧凑，两端折叠形成椭圆形；c) HA20S5（1%硫酸化）的伸展柔性结构。图5：动态曲线。 a) 回转半径；b) 末端距。灰色虚线：HA20（非硫酸化）；黑色线：HA20S5（1%硫酸化）；灰色线：HA20S10（2.5%硫酸化）。HA20S5的末端距在50-70 Å间大幅波动，表明高度柔性。高硫酸化（2.5%）反而变得紧凑 HA20S10（2.5%硫酸化）同样失去了螺旋结构，但其构象比HA20S5更紧凑（图4b）：回转半径21.51 Å（归一化1.08），末端距46.67 Å（归一化2.33）。其φ角的synclinal比例回升至64.1%，与非硫酸化HA接近。这一反常现象的解释是：当硫酸根基团数量适中时（1%），静电斥力占主导，迫使链伸展；但当硫酸根基团更多时（2.5%），相邻负电荷之间可能形成离子对网络（通过Na+桥接），反而稳定了折叠构象。这与文献中聚电解质在中等电荷密度下最伸展的观察一致。需要注意的是，文中关于“高硫酸化时可能形成Na+介导的离子对网络”这一步，主要还是基于构象结果的机理推断，并没有进一步做专门的离子配位统计或自由能分析来直接验证。在氯仿中模拟保持相同趋势为了模拟皮肤疏水环境，作者还将代表性链放入CHCl3中进行对照模拟。结果显示，非硫酸化HA仍保持紧凑螺旋，而低硫酸化链仍保留伸展无序趋势；两类体系之间的差异略有缩小，作者将其归因于溶剂摩擦增大，但整体构象排序并未改变。关键结论与批判性总结主要发现与机制将表1的Q24与表2的构象参数对比，可以发现清晰的趋势：样品构象特征 Rg归一化低分子量Q24 中分子量Q24 HA20（非硫酸化）紧凑螺旋 0.78 1.0 0.1 HA20S5（1%硫酸化）伸展柔性 1.29 4.9（最高） 0.6 HA20S10（2.5%硫酸化）中间构象 1.08 2.4 0.2 本研究提出假说，多糖的构象（而非简单的分子量或极性）可能是决定其皮肤渗透能力的关键因素。归一化回转半径越大，24 h扩散量越高——伸展柔性的多糖链可能更容易适应角质层、角质细胞以及更下层组织之间不断变化的微环境，从而降低扩散过程中的构象代价。小分子透皮吸收的经典规则是分子量越小、亲脂性越强，渗透越好。但实验中1%硫酸化样品的渗透量约为未修饰HA的5倍，尽管硫酸化显著增加了极性和水溶性。MD模拟提示，硫酸基打乱了原有螺旋氢键网络，并通过静电作用改变糖苷键扭转分布，使链更伸展、更灵活。当硫酸化程度进一步提高至2.5%时，链反而重新折叠成椭圆形紧凑构象——原文解释为链端折叠以最小化硫酸根之间的静电斥力，这与聚电解质在中等电荷密度时最伸展、高电荷密度时因静电相互作用而收缩的现象一致。因此，存在一个最佳的硫酸化程度（约1% mol）。 CLSM成像显示HAF在角质细胞区域呈均一着色，而游离FITC没有类似分布，提示HA可能主要经跨角质细胞路径扩散，但这一推断尚未通过直接实验验证。MD模拟帮助解释了这些渗透数据（但也没完全打通逻辑），将焦点转向多糖柔性：可以通过化学修饰（如硫酸化、羧甲基化等）调控构象，使其呈现伸展、柔性的状态，从而可能增强渗透。局限性模拟链长远短于实验样品：MD模拟最多20个重复单元（约8 kDa），而实验中的低分子量HA也有6.7 kDa（约30个单元），中分子量高达170-200 kDa。模拟结果能否完全外推至长链仍需谨慎。模拟时间较短：10 ns的模拟对于长链多糖的全局构象采样可能不足，更长的模拟（如微秒级）或增强采样方法可以验证平衡构象分布。缺乏直接的构象-渗透定量模型：虽然观察到了趋势，但未建立如“回转半径每增加1 Å，渗透量增加X倍”的定量关系。未来可结合更多的实验样品（不同硫酸化梯度）和更长的模拟来构建预测模型。皮肤模型的简化：体外Franz扩散池使用分离的人表皮，缺乏活性皮肤的代谢和血流清除机制，可能影响渗透动力学。未来方向模拟更长链（50-100个重复单元）：使用粗粒化模型或更高效的GPU加速MD，验证长链是否仍保持伸展构象。测试其他化学修饰：如羧甲基化、磷酸化、乙酰化等，探究是否也能通过改变构象来增强渗透。结合自由能计算：计算多糖在不同构象下穿透脂质双层的自由能垒，从热力学角度验证伸展构象的优势。动物实验验证：在活体皮肤中验证FITC标记的硫酸化HA的渗透深度和分布。对于从事化妆品、透皮贴剂或大分子给药的研究者，在设计多糖载体时，不应只盯着分子量和亲水性，更要关注其溶液构象——让分子“伸展开”可能比让它“变小”更有效。小编锐评：需要保留的一点谨慎是：本文的MD部分更适合被看作构象趋势解释，而不是已经充分收敛的统计采样。尽管如此，它提出的“构象决定渗透”这一核心视角，至今仍然值得在多糖类透皮体系设计中认真对待。跨细胞途径这个跟我们contradict了，这我也很难评。全原子真好啊。。

Specific Sytems · 2026-04-17

透明质酸外用镇痛：联合促透剂打开皮肤屏障的新策略

Specific Sytems · 2026-04-16

酶工程新时代的基石：物理建模如何突破定向进化的天花板

酶工程新时代的基石：物理建模如何突破定向进化的天花板本文信息标题：酶工程新时代中的物理建模作者：Christopher Jurich, Qianzhen Shao, Xinchun Ran, Zhongyue J. Yang 发表时间：2025年4月24日在线发表（Nature Computational Science）单位：范德堡大学（Vanderbilt University）引用格式：Jurich, C., Shao, Q., Ran, X. & Yang, Z. J. Physics-based modeling in the new era of enzyme engineering. Nat. Comput. Sci. 5, 279–291 (2025). https://doi.org/10.1038/s43588-025-00788-8 摘要酶工程正在进入一个以计算策略整合为特征的新时代。虽然生物信息学和人工智能方法已被广泛用于加速功能增强型突变体的筛选，但基于物理的建模方法（如分子力学和量子力学）在许多目标中是必不可少的补充。在本文中，我们强调了基于物理的建模如何通过探索当前进展、未解决的挑战以及工具开发的新兴机遇，帮助计算酶工程领域充分发挥其潜力。核心结论定向进化存在固有局限：依赖高通量筛选的定向进化难以处理蛋白酶（自水解）、光酶（利用光进行催化的酶，需要恒定光照设备）、植物源/哺乳动物酶（异源表达困难）等体系，也容易陷入进化死胡同。基于物理的建模填补关键空白：量子力学（QM）、分子力学（MM）和QM/MM方法可以在原子分辨率上计算任意有三维结构的酶体系的实验相关性质，不受酶来源或操作条件限制。设计原理的提炼与自动化：通过分析酶的结构、静电、动力学和热容等特征，可以归纳出定量的设计原理，并借助高通量工作流（如EnzyHTP、SubTuner）自动筛选突变体。物理建模与机器学习形成共生关系：物理建模为ML提供有化学意义的描述符（如电场、结合能、底物定位指数），ML则帮助降维、生成过渡态几何构型、加速动力学模拟。亟需高质量的基准数据集：与结构预测领域的 CASP 类似，酶工程领域需要盲测式的功能预测竞赛和标准化数据库，以公正评估计算方法。背景酶工程的工业化需求与定向进化的辉煌酶工程的目标是让酶为合成、治疗和可持续性服务。工业界对工程化酶的需求强劲，预计未来十年复合年增长率在5%至6%之间。一个理想的未来是：计算协议能够以定量精度定位功能性野生型酶及其工程化变体，从而以最少的筛选工作实现生物催化开发，同时降低经济和环境成本。历史上，定向进化一直主导着该领域。通过迭代诱变和高通量筛选，定向进化已成功创造出无数用于化学合成、环境污染物降解或升级回收以及治疗的酶。然而，定向进化依赖高通量实验筛选，这使其在多个场景下难以应用：副反应不可忽略时：例如蛋白酶会自我水解，难以构建筛选体系。需要专门设备时：例如光酶（利用光进行催化的酶）需要恒定光照且无污染的特殊装置。工程目标不匹配时：例如微型化（在保持高活性的同时减小酶的大小）无法通过高通量删除或截短可靠实现；工业生物合成中高低温度适应性的改造，由于生物条件与工业条件（温度、pH等）的普遍不匹配，也难以用高通量筛选解决。表达系统受限时：植物源和哺乳动物酶在大肠杆菌中表达困难或具有免疫原性，无法用于常规高通量筛选。更令人警醒的是，定向进化常把催化过程当成黑箱，容易陷入进化死胡同——一旦被困，即使再筛选$10^9$个变体也无法改善效率。Blazeck等人报道的一个人源免疫治疗酶（犬尿氨酸酶）就遇到了这种情况，借助对酶结构和催化机制的理解，找到了另一条改进路径——即通过改变策略（如改变优化目标、设计不同的突变组合）绕过了之前无法突破的限制。图1：基于物理的计算方法作为实现酶工程全部潜力的途径中间列（传统酶工程）：在提高细菌、非膜结合酶的催化效率方面表现出色顶部（传统方法的局限）：定向进化依赖高通量筛选，难以处理蛋白酶（自水解）、光酶（需要恒定光照）、植物源/哺乳动物酶（异源表达困难）等体系，容易陷入进化死胡同右列（基于物理的计算酶工程）：更通用的方法，能够避免传统方法的常见陷阱，并扩展到更广泛的酶性质和系统计算方法的崛起与物理建模的不可替代性计算方法为酶工程提供了突破这些局限的路径。尽管生物信息学和人工智能（AI）被越来越广泛地应用，但由于酶序列-结构-功能关系数据的数量和质量普遍不足，基于物理的分子建模技术仍然不可或缺。 QM和MM方法在理论上可以应用于任意具有原子分辨率三维结构的体系，无论酶来源于细菌、植物还是哺乳动物，无论其偏好何种操作条件（高温、低温、极端pH）。通过物理建模，从头酶设计已经展示了第一性原理方法创造催化新自然反应的人工酶的能力。虽然这些人工骨架通常还需要用定向进化进一步优化（从而再次打开进化死胡同的大门），但从头设计活动证明了虚拟的、基于物理的设计能够提供理性设计独有的骨架，这是计算酶工程的一个概念性里程碑。综述内容 The role of physics-based modeling in enzyme catalysis 图2：基于物理的原理的生命周期。左上：通过观察天然和工程化酶中具有所需功能特征（如高效率或冷适应）的来源，推导出基于物理的原理。示例包括工程化Kemp eliminase（KE，灰色，PDB ID 8usi）、冷适性腺苷酸激酶（蓝色，PDB ID 1p3j）和天然高效人红细胞过氧化氢酶（灰色，PDB ID 1dgf）右上：通过物理建模（QM、MD、QM/MM）识别、量化和理解物理现象。MD模拟全酶-溶剂复合物（PDB ID 3nir），QM模拟简化活性位点簇（紫色QM区域，黑色球体为冻结边界原子），QM/MM对酶不同区域应用多层级理论右下：将设计原理编码为产生明确、定量功能预测的通用理性设计规则左下：应用设计规则对有益突变（红色球体）排序，推荐实现特定功能目标（如通过过渡态稳定化或基态去稳定化提高效率）设计原理一：结构与拓扑结构启发的酶工程最为直观——当活性位点与底物形状互补时，催化效率更高。例如：保守的鸟嘌呤结合位点广泛驱动核酶的选择性。儿茶酚-O-甲基转移酶中的一个残基通过定位S-腺苷甲硫氨酸辅因子来达到理想的供体-受体距离。细菌芳胺脱羧酶的活性位点残基通过调节疏水口袋的大小来适应不同底物。拓扑工程侧重于选择突变以促进底物结合，或改善隧道可及性以加速反应物/产物的扩散。通过突变连接活性位点与酶表面的隧道中的残基，可以调节底物和水到达活性位点的能力。这一原理已在实验中广泛验证，并用于隧道的从头设计。此外，改变表面带电残基的数量可以调节酶的pH最适性。大多数酶在中性pH附近进化，而耐受非生物常见pH条件为在碱性或酸性环境中更快进行的反应打开了大门。改变pH最适性是一个尚未充分利用的工程策略。结构信息工程的一个关键挑战是：仅仅稳定基态相互作用是不够的——酶还必须确保协调的相互作用将底物定位在能够生成产物的反应性构象上。AlphaFold3可以预测底物-酶复合物，但稳定基态相互作用并不等同于稳定过渡态。设计原理二：静电（电场）静电是酶催化的核心机制之一。Linus Pauling提出酶通过稳定过渡态实现催化，Ariel Warshel进一步证明，酶的预组织静电效应是催化的主要贡献来源。预组织静电效应：活性位点在反应前就已经排布成有利于过渡态的电场构型。实验验证与电场计算 Boxer课题组利用振动斯塔克位移光谱（vibrational Stark effect spectroscopy）直接在活酶中测量活性位点电场强度，发现在酮类固醇异构酶（KSI）中活性位点电场高达$15~\mathrm{MV/cm}$，远强于溶剂环境。更关键的是，电场强度与催化速率之间存在定量关系：电场越强，过渡态稳定化越显著，催化效率越高。电场可以用库仑定律近似计算——基于固定电荷MM、可极化MM或QM方法得到的原子电荷，将酶环境产生的电场$\mathbf{F}{\mathrm{env}}$投影到反应键的偶极矩$\mathbf{u}{\mathrm{bond}}$上，得到电场稳定化能： [E_{\mathrm{ES}} = -\mathbf{F}{\mathrm{env}}\cdot \mathbf{u}{\mathrm{bond}} \quad (1) E_{\mathrm{ES}} = \int \rho (\mathbf{r})V_{\mathrm{env}}(\mathbf{r})\mathrm{d}^3 \mathbf{r} \quad (2)] 其中$\rho$是电子密度，$V_{\mathrm{env}}$是静电势。这一原理已在KSI、Kemp eliminase、P450、二氢叶酸还原酶等多种体系中得到广泛验证。从理解到设计 Head-Gordon课题组将静电理解转化为可操作的设计原理。在Kemp eliminase中，他们发现单个突变就可以有效地微调投影到催化键上的电场大小，从而系统性地设计出高效Kemp eliminase——这是首次通过电场工程实现酶活性的人工提升。对枯草芽孢杆菌酯酶Bs2的改造则展示了另一条路径：引入天冬氨酸残基稳定过渡态偶极矩，将水解酶转化为酰胺酶。这些案例共同说明：电场是一个可以直接用于指导突变设计的工程量。SubTuner正是基于这一原理，将电场优化作为三个设计假设之一：通过活性位点电场稳定过渡态的偶极矩。挑战：底物取向与远程效应其一，底物取向的微小改变会迅速抵消预期的静电增益——如果突变改变了底物在活性位点的定位方式，即使电场强度增加了，实际催化效果也可能下降。其二，远程突变对电场的影响难以预测：远端残基的电场贡献需要通过MD轨迹分析来评估，而这类分析的计算成本不低。基于侧链互信息的残基耦合分析提供了一种识别不太可能扰动底物动力学的电场介导残基的方法。设计原理三：蛋白质动力学静态结构只能告诉我们酶在某个瞬间的样子，而真实的酶时时刻刻都在振动和摆动——这些运动是催化机制的一部分。蛋白质动力学启发的酶工程，正是要利用这些动态信息来指导突变设计。构象集合观：从单一快照到概率分布传统观点把酶活性位点看成固定的钥匙-锁关系。但实际上，酶在不断于不同构象之间切换，每个构象有不同的能量和比例（概率分布）。Yabukarski等利用X射线衍生的构象集合（从多个晶体结构或低温晶体学数据中提取），直接量化了活性位点的定位分布；Du等则用构象集合揭示了丝氨酸蛋白酶催化的真正起源——其催化三联体（Asp-His-Ser）的空间排布在构象集合中高度偏置在有利于催化的区域。这说明酶活性不仅取决于最优构象长什么样，还取决于整个构象集合的统计分布。 Hur和Bruice进一步指出，底物进入活性位点后，必须先采用一种特定的构象——各化学键的方向和距离都恰好有利于反应发生——才算是准备好了。在分支酸变位酶中，NAC概率越高，催化速率越快，二者直接相关；这一原理已被成功用于工程化Kemp eliminase和荧光素酶。对Kemp eliminase的进一步分析引入了底物定位指数（substrate positioning index，SPI）：衡量底物可及面积与活性位点溶剂可及面积之比，反映活性位点的松紧程度。SPI与自由能垒呈火山型分段线性相关——活性位点太松（SPI过高）或太紧（SPI过低）都会降低活性，存在一个“刚刚好”的最优点，而非越高越好。近攻击构象（NAC）：各化学键的方向和距离都恰好有利于反应发生的底物构象。酶的催化作用之一，就是通过活性位点的空间约束，把底物稳定在这种构象上，降低它达到NAC的能垒。动力学网络：突变是怎么从远端传递到活性位点的？ MD模拟可以揭示残基之间的相关运动——当一个残基移动时，哪些残基会跟着动？这些信息可以用来构建动力学网络（network of correlated motion）。Osuna课题组的最短路径图工具是这个方向的重要成果：它把蛋白质看成一张图（节点=残基，边=运动相关性强弱），然后用图论算法找出连接两个位置之间的“最短路径”。这条路径上的残基，就是最有可能把远端突变的影响传递到活性位点的桥梁。换句话说，如果你想在远离活性位点的位置做突变来影响催化，最短路径图可以告诉你应该选哪几个残基。一个典型案例是祖先荧光素酶AncHLD-RLuc的工程化：MD分析发现，环区的柔性变化可以通过动力学网络传递到活性位点，改善配体结合和催化活性。这说明远程突变未必是碰运气，而是有物理规律可循的。飞秒级蛋白运动与化学活化网络飞秒级蛋白运动也是近年关注的热点。酶中最快的振动发生在飞秒（$10^{-15}$秒）尺度，恰好与化学键形成/断裂的过渡态时间尺度重叠——那么，这些超快运动是否真的能推动反应？答案是：有可能，但目前证据仍不充分。 Frost等人用过渡路径分析（transition-path analysis，TPA）分析人源嘌呤核苷磷酸化酶（PNP）时发现，一个远端残基的振动相位恰好与活性位点的化学转化同步——也就是说，这个远端残基在飞秒尺度上的一推一拉和化学键断裂/形成的时间精确吻合，表明动力学效应可能在催化中扮演着直接角色。 QM/MM准经典轨迹模拟则揭示了另一个现象：在SpnF催化的Diels-Alder反应中，反应体系穿越过渡态之后，并不只有一条路可以走——它会在多个产物通道之间选择。QM/MM准经典轨迹模拟显示，这种反应后分叉（post-TS bifurcation）的选择受活性位点疏水残基的动能贡献影响，最终决定了产物选择性，而非仅由过渡态能垒决定。这些现象共同构成了化学活化网络（chemical activation network）的概念框架：酶不只是提供一个稳定的静电环境，而是通过多层次（从飞秒振动到皮秒构象变化）的动态协调，主动引导反应走向。理解这张网络，将为工程化生物催化剂开辟全新的设计维度。设计原理四：热容与温度适应性酶的最适温度看似只是活性-稳定性平衡的结果，但实际上背后还有更深的物理机制——热容（heat capacity）。非阿伦尼乌斯行为与热容机制经典阿伦尼乌斯行为认为，温度越高，反应速率越快，直到蛋白质热变性。但嗜冷酶（如嗜冷α-淀粉酶AHA）、古代重建的腺苷酸激酶等表现出非阿伦尼乌斯行为——它们在某个温度达到活性顶峰，高于或低于此温度活性都会下降。这说明温度依赖性不只是热稳定性问题，还和活化热容 $\Delta C_p^\ddagger$（过渡态与基态之间的热容差）直接相关。换句话说，热容才是决定最适温度的关键变量，而非蛋白质稳定性本身。 Åqvist课题组进一步揭示了AHA低温最适温度的物理根源：在较高温度下，酶-底物复合物会意外地采用一种无活性的构象——底物虽然结合在活性位点，但构象不具有反应性，正是这种假结合拉低了整体活性。陷阱构象：底物虽然结合在活性位点，但构象不具有反应性，无法进行催化反应。AHA活性下降的真正原因是陷阱构象的增多，而非蛋白质变性。从热容到冷适应工程从热力学角度看，负的活化热容意味着过渡态比基态更有序。AHA的策略是平衡活化焓$\Delta H^\ddagger$和活化熵$\Delta S^\ddagger$：维持较低的活化焓（降低反应能垒），但同时接受更负的活化熵（反应过程中损失更多构象自由度）。在低温下，$T\Delta S^\ddagger$项的贡献较小，低活化焓主导，整体活化自由能$\Delta G^\ddagger = \Delta H^\ddagger - T\Delta S^\ddagger$仍然较低，因此反应能够高效进行。这恰好对应了嗜冷酶的整体特征：在低温下，高柔性反而帮助底物顺利结合和转化。基于热容的框架，可以从分子动力学模拟直接计算酶效率。van der Ent等人进一步证明，通过计算预测 $\Delta C_p^\ddagger$，可以主动设计酶反应的最适温度——找到那些能平移其温度曲线的突变。对多结构域工业酶（催化结构域+碳水化合物结合模块CBM），单结构域经验不直接适用。最新研究表明，可以通过引入连接子增加结构域分离指数（一个由MD推导的描述符，精确量化结构域之间的分离程度）来实现冷适应——延长连接子使结构域分离，增加活性位点柔性，从而在低温下保持活性。这是一条绕过单结构域经验局限的可行路径，已在纤维素酶中得到验证。高通量计算工作流：从CADEE到SubTuner 为了将设计原理自动化、规模化地应用于突变筛选，研究者开发了多个高通量工作流。图3：高通量工作流在酶工程中的作用。核心信息是：工作流的覆盖面还不够。 a子图：传统计算酶工程工作流的通用模式。以野生型酶-底物复合物为起点（酶显示为蓝色，底物为粉色），构建突变体库。每个突变体（红色点）部署到独立结构上，对每个突变体和野生型（WT）进行构象采样（通常用MD），计算物理描述符（RMSD、EF、$\Delta G_{\text{bind}}$、SPI等），对每个构象计算并求平均，最后根据构象平均描述符与野生型的比较对突变体排序 b子图：现有工作流主要集中在通过突变优化速率效率，但其他功能目标（如智能库构建、嵌合酶融合、新自然反应工程、基因组酶发现）仍有待开发图3的左侧工作流之所以能走通，关键在于每一步都锚定在物理可观测量上：RMSD反映结构变化幅度，电场度量对过渡态的静电稳定化，$\Delta G_{\text{bind}}$描述底物结合能，SPI反映活性位点松紧度。这些描述符从原子模拟里直接算出，是物理量而非经验打分，理论上可以在不同酶体系之间迁移。但现实是，大多数工作流目前只覆盖速率优化这一类目标。右侧列出的几类任务——智能库构建（如何选最有信息量的突变组合）、嵌合酶融合（如何拼接不同酶的结构域）、新自然反应工程（如何从头设计催化新反应的活性位点）、基因组酶发现（如何在大规模序列中快速筛选）——每一个都要求工作流能回答的问题不只是哪个突变更稳定，而是哪个设计策略真正改变化学路径。相关工具与数据库 Rosetta：强大的蛋白质建模套件，提供能量函数和多种设计协议，是计算酶工程的基础工具之一。 AlphaFold2/3：虽然主要用于结构预测，但其高精度的结构模型可作为物理建模的输入。Brown等指出，AlphaFold预测可作为构象Boltzmann分布的近似，但存在一定局限性。 KLIFS：激酶结构数据库，提供激酶-配体相互作用的功能位点信息，有助于工程化激酶的底物特异性。 BioFragment Database（BFDb）：QM衍生的蛋白相互作用能数据库，为ML模型训练提供可解释的物理描述符。 IntEnzyDB：集成结构-动力学酶学数据库，正在弥补序列-结构-功能数据的缺口。 CADEE（2017） CADEE（计算机辅助定向进化）是第一个专门为基于活化能（通过经验价键理论EVB自由能微扰和伞形采样计算）排序和推荐突变体而设计的平台。它突破性地实现了自动化，但其性能对EVB力场的参数化质量敏感，缺乏实验数据时需要专家输入，且主要支持EVB方法。 EnzyHTP（2022） EnzyHTP是一个通用的高通量酶建模平台，完全使用Python编写，自动化了酶工程的每一步：准备、诱变、几何采样和事后分析。它支持任意分子建模任务，包括MD、QM、配体对接、轨迹分析等。EnzyHTP更像一个模块化面包板，其他工作流可以构建在其之上。 SubTuner（2025）基于EnzyHTP构建的SubTuner，是一个专门用于工程化酶催化非天然底物的计算工具。它基于三个假设：有益突变必须（1）热稳定，（2）能够结合限速过渡态，（3）通过活性位点电场优化稳定过渡态的偶极矩。在数百个突变体和多种底物上评估，SubTuner在命中率、功能增强速度和有益多突变设计的多样性方面优于现有AI模型。 SubTuner的真正价值不只是三条规则本身，而是将热稳定性、过渡态结合和电场优化三个物理条件压缩成一个可执行工作流。工作流终于开始显式回答为什么这个突变可能有用。但SubTuner也指出了当前工作流的Pareto优化困境：在计算成本与突变体排序精度、智能库构建方案、功能评分之间取得平衡，这些问题仍然没有解决。更精确、更全面往往意味着更贵、更慢；更快则可能牺牲命中率和多突变设计的多样性。这是今天高通量物理建模最现实的瓶颈之一。 EnzyHTP、SubTuner都是本文作者的工作物理建模与机器学习的共生关系图4：物理建模与ML建模的共生关系。左侧（物理建模）：MD模拟、电子结构理论和其他分子建模技术（PDB ID 3nir）产生描述符，如Rosetta能量项、结合能和电场稳定化能中间（特征与架构）：物理描述符可直接作为ML模型输入。物理建模也启发了编码结构信息的ML架构，例如主链结构编码（灰色线）或创建输入层直接对应酶残基的结构感知架构右侧（ML建模）：ML帮助从高维数据中提取催化相关特征，例如识别反应性几何构型、聚合动力学数据（$x_0 \rightarrow x_1 \rightarrow \dots \rightarrow x_n$, $\psi^2$, $P(x)$）图4把物理建模和机器学习之间的关系从谁替代谁改写成了双向供给。物理模型产出的电场、结合能、Rosetta能量项和过渡态信息可以直接变成ML的输入特征；ML又能帮助压缩高维模拟结果、生成过渡态几何、甚至近似QM/MM势能面。本文的立场是：未来强模型更可能来自物理约束和数据驱动的耦合，而非单纯的端到端替代。物理建模赋能ML 结构特征提升ML性能：将MD衍生的构象描述符（如$\text{RMSF}$、主成分）纳入模型，改善了对牛肠激酶突变效应的预测。EnzyKR使用活性位点-反应物相互作用编码结构特征，成功预测了水解酶动力学拆分中的优势对映体。 QM衍生描述符：对接得分、QM衍生电荷等使得分类器能够准确预测细菌腈水解酶的底物混杂性。结构感知图神经网络：将Rosetta能量项和序列同一性整合到结构感知蛋白图卷积网络中，改善了对蛋白酶特异性的预测。然而，获取与实验表征的活性和选择性数据相链接的高质量酶-底物复合物结构是一个实际挑战。酶突变和不同底物的组合爆炸使得单纯依赖AI方法不切实际。大规模数据集如ProteinGym提供适应性值，但物理化学相关性有限。集成序列-结构-功能数据库（如IntEnzyDB）正在出现，但规模仍远远落后于社区需求。 ProteinGym更适合做蛋白fitness预测，而非直接支持酶工程里的物理建模。原因有两层：第一，它缺少底物、反应机制和酶—底物复合物结构这些关键信息；第二，不同实验条件下测得的fitness值反映的是不同物理性质，不同assay反映的物理量并不完全可比。所以ProteinGym对ML很有价值，但想训练真正理解催化机制的模型，数据还是不够物理。 IntEnzyDB则试图把序列、结构、动力学和功能放进同一张表，目标是让研究者能在同一平台上查到酶的动力学参数、复合物结构和功能注释。对酶工程来说，真正缺的不是更多活不活的标签，而是这些活性背后的物理机制——在什么底物、什么条件、什么构象下，活性由什么机制驱动。 ML赋能物理建模过渡态几何生成：等变扩散模型可以从反应物和产物的结构出发，生成高精度的气相过渡态几何结构。将其扩展到考虑活性位点和溶剂分子的相互作用是一个活跃方向。 ML势函数加速模拟：AI2BMD框架使用基于蛋白片段QM计算训练的ML势，实现了媲美纯QM精度的动力学模拟，成本大幅降低。从高维MD中提取催化意义：在酮醇酸还原异构酶（KARI）中，ML模型分析了底物转化事件，从大量候选的键长、键角和二面角中自动识别出与反应性强烈相关的几何参数。将此技术推广到更多体系，有望提炼出关于配体几何如何影响反应性的普适理解。讨论为什么物理建模是关键？尽管定向进化和高通量筛选的能力令人印象深刻，但这只是一个中间步骤。最终目标是开发能够解决任何工程目标、应用于任何酶系统的方法。基于物理的建模凭借其独特能力——从第一性原理直接预测实验可观测量、阐明分子机制、识别关键分子描述符作为设计原理——在推动下一代酶工程方法中扮演着不可或缺的角色。当前挑战计算成本：MD和QM/MM可能需要数天时间。硬件上，量子计算可能成为下一代电子结构模拟的引擎，但真正的量子优势尚未实现。算法上，AI加速的高精度能量计算和采样（如ML势函数、生成式自由能映射）展现出巨大潜力。缺乏标准化基准：与传统计算化学有成熟的基准集（如热化学预测）不同，计算酶工程面临一个不断变化的目标。一些模型系统（如Kemp eliminase）已成为事实上的基准，但从单一酶得出结论存在偏差。软件工程的可持续性：许多软件包在开发活跃期过后即停止维护——本意是做通用工具，结果却沦为只能处理最初那几个特定案例的系统（无专业化）。社区缺乏软件工程指南。欧洲生物信息学基础设施ELIXIR及其FAIR原则（可查找、可访问、可互操作、可重用）是参考模板。Loschmidt Lab公开了15个软件工具和3个数据库，是个榜样。这三条里，基准测试缺失可能是最根本的问题。本文专门提到2023年的Protein Engineering Tournament，把它视为一个重要起点：不同团队对同一批酶活性做预测，最后统一公开结果。酶工程现在最缺的是可重复、可横向比较、可定期更新的盲测体系，而非单篇案例。没有这种共同试卷，方法论文就很容易陷入各自挑数据、各自挑指标、各自宣称更强的循环。大数据不等于好基准：真正需要的是既有规模、又保留微观物理特征的数据集——比如活性位点几何、电场、结合模式和反应障碍之间能互相对上的数据。没有结构化数据库很难做可靠benchmark，没有可维护的软件就很难持续更新数据库和benchmark——这是整个社区基础设施的问题，而非单纯的数据问题。所以本文提出的Critical Assessment of Enzyme Functional Prediction，本质上是想给酶工程造一个类似CASP的共同战场。它不只是为了排榜单，更是为了逼着社区统一任务定义、数据格式、评价指标和失败案例的报告方式。对这个领域来说，这一步甚至可能和某个新模型本身一样重要。未被充分探索的物理现象质子耦合电子转移（PCET）：是无数高效酶反应的基础，但如何预测有益突变仍理解有限。氢隧穿：大豆脂氧合酶中远端蛋白运动如何激活氢隧穿已被研究，但设计原理尚未提炼。飞秒级蛋白运动：可能影响在相当时间尺度上发生的过渡态轨迹。反应后分叉：决定产物选择性的关键因素，在SpnF催化的Diels-Alder反应中已展示。短暂的手性中间体：在手性和非手性产物都产生的酶中，这些短暂中间体可能蕴含着关于选择性和活性的新设计规则。这一节点出现有工作流的盲区，像PCET、氢隧穿和飞秒级蛋白运动，都牵涉到非常快的电子—核耦合过程，很难被简单的打分函数或静态结构特征吸收。反应后分叉关心的是过渡态之后轨迹会滑向哪个产物通道，而非单一过渡态够不够低。很多今天常用的工作流擅长回答这个突变会不会更稳定、更会结合，却还不擅长回答这个突变会不会改变真正的化学路径。 AlphaFold与结构建模的作用 AlphaFold2和AlphaFold3的出现深刻改变了酶工程的研究范式。Du等利用AlphaFold2生成的构象集合揭示了丝氨酸蛋白酶催化的起源，这表明AI预测的结构可以服务于物理机制研究。然而，Brown等指出，AlphaFold预测可作为构象Boltzmann分布的近似估计，但存在一定偏差：预测的构象分布可能过于集中或遗漏某些重要构象。因此，AlphaFold最适合作为物理建模的起点，而非终点。其损失函数并不编码化学合理性，训练目标是让预测结构靠近实验晶体结构——这意味着它学到的是哪个构象在晶体里最常见，而不是哪个构象在催化意义上最重要。对于酶工程来说，后者才是关键。如果活性位点附近的某个关键构象在晶体数据里出现频率很低，AlphaFold很可能完全忽略它——即便这个构象恰好是过渡态前后最关键的窗口。真正的设计验证仍需通过MD或QM/MM模拟来检验，这些方法才显式包含了力场和能量面。从头酶设计的新突破基于物理的从头设计已经创造出能够催化新自然反应的人工酶，这是计算酶工程的里程碑。然而，这些人工骨架通常活性较低，需要后续的定向进化来优化。概念验证成立，但离终局还远。人工设计的酶骨架能在无天然酶引导的情况下实现全新反应，这一点已经打破了必须依赖自然界已有模板的思维定式。但骨架的初始活性通常只有天然酶的几百分之一甚至更低，需要大量突变筛选才能接近工业可用水平。这个gap不只是筛选效率的问题，而是反映了我们对如何从第一性原理直接构造高活性位点的理解仍然不完整。 Burns等的BioFragment Database提供了一个新思路：通过QM计算建立标准化的相互作用能数据库，使物理描述符可以作为ML模型的特征，从而加速设计过程。BioFragment Database这类资源之所以重要，正是因为它们试图把从结构到活性这个映射变得更系统化——用QM计算出的标准化相互作用能来教模型什么样的残基排布才真正有利于过渡态稳定，而不是靠直觉。本文主要贡献提供了基于物理的建模在酶工程中的全景式路线图：从设计原理（结构、静电、动力学、热容）到高通量工作流（CADEE、EnzyHTP、SubTuner），再到与ML的共生关系，涵盖了领域的现状、痛点和未来方向。明确指出了定向进化的局限性：物理建模是互补技术，尤其在处理难搞系统和避免进化死胡同时，并非要否定定向进化。首次系统总结了SubTuner等新一代工作流的设计哲学：基于热稳定性、过渡态结合和电场优化的三原则，展示了物理建模在非天然底物工程中的强大能力。提出了建立酶功能预测盲测竞赛的倡议：模仿CASP，这将极大推动计算方法的客观评估和迭代改进。强调了软件工程可持续性的重要性：呼吁社区建立代码开发的最佳实践和长期维护机制。局限性物理建模的计算成本仍然是主要瓶颈：虽然ML加速有希望，但尚未达到广泛可用的程度。基准数据集严重缺乏：现有数据库（如ProteinGym）缺乏底物、反应机制、酶-底物复合物结构等关键信息，无法公平评估基于物理的工具。许多设计原理尚未在高通量工作流中实现：例如PCET、飞秒动力学、反应后分叉等，仍停留在学术研究层面。软件可持续性问题普遍存在：大部分工具由博士生/博士后开发，他们毕业后维护往往停止，导致社区碎片化。未来方向建立Critical Assessment of Enzyme Functional Prediction：定期、盲测、多目标的酶功能预测竞赛，将极大推动领域标准化。开发集成物理描述符的大规模数据库：类似BioFragment Database（QM衍生相互作用能）的模式，为ML提供有化学意义的特征。将生成模型（如ProteinMPNN）与催化相关物理特征（电场、动力学）条件化：直接设计具有初始活性的酶，而非仅稳定骨架。探索量子计算在酶模拟中的应用：虽然量子优势尚未确定，但早期应用已展示在蛋白结构预测中的潜力。将ML加速的QM/MM和过渡态生成推向常规应用：使高精度势能面计算不再是专家特权。定向进化只是中间步骤，物理建模才是解锁酶工程全部潜力的关键。对于那些希望跳出黑箱筛选、真正理解并设计酶的科研人员，本文提供了从第一性原理出发的系统框架。而对于计算化学家，本文则清晰地指出了软件工程、基准数据集和未探索物理现象这三个最值得投入的方向。

Specific Sytems · 2026-04-16

甲基丙烯酸酯聚合物如何作用于细菌外膜：粗粒化分子动力学给出的四阶段机制

甲基丙烯酸酯聚合物如何作用于细菌外膜：粗粒化分子动力学给出的四阶段机制本文信息标题：通过粗粒化分子动力学模拟探索甲基丙烯酸酯聚合物与细菌外膜的相互作用作者：Eduardo R. Almeida、Vinicius Firmino dos Santos、Madeleine Ramstedt、Thereza A. Soares 发表时间：2026年4月7日单位：圣保罗大学（巴西）、于默奥大学（瑞典）、奥斯陆大学与 Hylleraas Centre（挪威）引用格式：Almeida, E. R., Firmino dos Santos, V., Ramstedt, M., & Soares, T. A. (2026). Exploring the Interactions Between Methyl Methacrylate Polymers and the Bacterial Outer Membrane via Coarse-Grained Molecular Dynamics Simulations. Journal of Chemical Information and Modeling. https://doi.org/10.1021/acs.jcim.6c00729 源代码：https://github.com/BioMat-USP-RP/Input-files-for-CG-simulations-of-polymers-and-bacterial-outer-membrane 摘要聚合物刷涂层为对抗医疗器械中的细菌黏附与生物膜形成提供了一种有前景的策略。然而，不同刷层化学组成如何与细菌膜相互作用的详细分子层面理解仍不完整。在本研究中，我们使用粗粒化分子动力学模拟（steered molecular dynamics 与 umbrella sampling），研究了四种甲基丙烯酸甲酯衍生聚合物——pDMAEMA（弱阳离子）、pMETAC（强阳离子）、pMEDSAH（两性离子）和 pSPMA（阴离子）——与大肠杆菌细菌外膜（OM）模型的相互作用与转运过程。模拟揭示了一个四步转运过程：接近、黏附、渗入和内化，并由不同的热力学与动力学特征所表征。阳离子聚合物与外膜表面表现出明显有利的黏附，尤其是与 LPS 分子的糖类内核结构域，这主要归因于有利的静电相互作用。在这些带正电聚合物的转运过程中，还可观察到 LPS 单元被拖拽至细菌外膜内叶的现象。相比之下，两性离子与阴离子聚合物表现出较不有利的黏附，这与其抗污行为一致。该方法提供了一个计算框架，可在分子细节层面解析与聚合物-膜相互作用相关的自由能图景与结构扰动，包括对动力学上不利过程的预测，例如聚合物向膜细胞内区域的渗入与内化。这些结果为理解水合、电荷与聚合物结构如何影响细菌膜相互作用提供了机制见解，并推动了抗污与抗菌表面涂层的分子设计。核心结论阳离子体系界面吸附更强：pMETAC 和 pDMAEMA 在黏附力与黏附自由能上均更占优。水合作用决定抗黏附特征：pMEDSAH 与 pSPMA 在后期保持更高水合，降低深层膜耦合。跨膜过程动力学受限明显：所有体系在膜中心附近都面临不同程度的渗入势垒。强吸附不等于顺利穿膜：approach 与 adhesion 可自发发生，但 permeation 与 internalization 都是动力学不利步骤。阳离子链会牵引膜组分重排：明确观察到 LPS 被正电聚合物拖向内侧，并在后期形成瞬态 nanopores。材料设计应分目标优化：表面捕获能力和跨膜推进能力需要拆开设计，单一电荷指标无法覆盖全流程行为。背景分子刷涂层被广泛用于医疗器械表面的抗黏附与抗菌改性，因为它们可以通过化学组成调控在生理介质中的稳定性、生物相容性和界面功能。以亲水聚电解质刷为例，体系通常分为强聚电解质和弱聚电解质两类，前者在宽 pH 范围维持带电，后者则随环境 pH 改变电离状态并形成可切换界面。对产业端而言，这决定了导管、植入物和传感界面在血液、血清、唾液等复杂体系中的失效模式；对学术端而言，这意味着刷层化学、水合结构与生物相互作用之间需要可量化的分子机制映射。已有研究已经说明，抗污能力与界面水合层强度高度相关。前期 MD 与 Monte Carlo 工作表明，两性离子刷层通常比 PEG 或非两性离子亲水聚合物形成更稳定的界面水网络，从而更有效抑制蛋白吸附；同时，碳间隔长度、偶极取向与局部溶剂化排斥会进一步放大这种差异。问题在于，这些结论主要建立在蛋白-刷层模型上，而细菌外膜（尤其是革兰阴性菌外膜）在成分、拓扑、电荷分布和疏水性上都远比单蛋白目标复杂，外层 LPS、离子桥联和膜不对称结构共同抬高了建模与解释难度，也抬高了机制外推门槛。因此，这个方向的核心 gap 是缺少能同时解释黏附、渗入与内化全过程的分子级统一框架。尤其在带电单元比例变化时，实验已经观察到抗污与抗菌行为可被显著调制，但机制上仍不清楚：是静电吸附主导，还是水合屏障主导，或者两者在不同阶段交替主导。本文的意义就在于把问题从终点表征推进到过程分解，用粗粒化 SMD 与 US 自由能图景把“接近—黏附—渗入—内化”串成可比较路径，为后续刷层配方设计提供可执行判据。研究阶段主要对象常用方法已有共识未解决问题早期抗污研究蛋白-聚合物刷层实验吸附测试、经典 MD、MC 两性离子刷层强水合，抗蛋白吸附更稳定结论难直接外推到细菌外膜中期机制研究氨基酸类似物-刷层 MD + 统计分析水合层与溶剂化排斥是关键屏障缺乏跨膜路径与动力学信息当前前沿聚合物-革兰阴性菌外膜粗粒化 SMD、US、PMF 可分离黏附有利项与渗入势垒项如何把机制指标映射到材料配方与实验性能关键科学问题在 LPS 主导的外膜界面，聚合物最先被什么物理作用抓住，静电吸附和脱水代价谁先主导。强黏附是否能自然转化成强渗入，还是会出现界面停留很强但向内推进困难的状态。四类聚合物的差异能否被统一机制解释，并转换为可执行的设计参数。创新点同平台并行比较：四类聚合物在同一 OM 与同一模拟流程下比较，减少跨体系偏差。路径与自由能联动：把 SMD 的时间分段与 US 的 PMF 结果联动解释，不只看单一指标。指标体系更完整：力学、自由能、水合、离子分布和接触统计共同构成解释框架。研究内容方法详述：模型、参数与流程本文采用 MARTINI 3 粗粒化框架，核心对象是四条长度一致的聚合物链（每条 96 个单体）与不对称 E. coli 外膜体系，形成同平台可比体系。体系组成模块组成与参数聚合物 pDMAEMA、pMETAC、pMEDSAH、pSPMA，均为 96-mer 外膜外层 rough LPS 外膜内层 DPPE/DPPG = 75/25 离子与水 $\ce{Ca^{2+}}$、$\mathrm{Cl^-}$、MARTINI tiny water 温压条件 310 K，1 bar SI 中还给出完整组分表（Table S2）：外膜外叶含 560 个 LPS 分子，内叶含 1260 个 DPPE 和 420 个 DPPG（比例 75:25），离子包括 3012 个 $\ce{Ca^{2+}}$ 和 4 个 $\ce{Cl^-}$，水珠 616312 个。$\ce{Ca^{2+}}$ 在这里主要起桥联作用，通过与带负电的 LPS 和 DPPG 相互作用稳定外膜结构——这在革兰阴性菌中是保守机制。图1：四类甲基丙烯酸酯聚合物单体与粗粒化映射关系图1A–图1D分别对应 pDMAEMA、pMETAC、pSPMA、pMEDSAH 的单体化学结构及其 CG bead 映射。颜色说明：黑色线条为原子级化学结构，蓝色与粉色球表示映射后的粗粒化表示，灰色标记代表不同 bead 类型。图1定义了后续相互作用分析的化学语义。后文看到的水合差异、黏附差异和离子相互作用，都由这些 bead 化学属性决定，属于参数驱动的结构结果。四类聚合物参数如何构建（SI Table S1）聚合物离子性质总电荷可电离基团亲水性体积（nm³） pDMAEMA 阳离子 96（正电） tertiary amine hydrophilic 1356.6 pMETAC 阳离子 96（正电） quaternary ammonium highly hydrophilic 1487.6 pMEDSAH 两性离子 0 quaternary ammonium / sulfonate highly hydrophilic 1315.1 pSPMA 阴离子 -96 sulfonate hydrophilic 1218.8 参数生成流程在 SI 中：四条链都设为 96-mer；总电荷取各单体电荷求和；体积由 GROMACS 2019.4 的 SASA 相关排除体积估算得到。这个参数化流程直接决定了后续黏附强度、去溶剂化代价和渗入势垒的排序，是全文的比较基线。图2：细菌外膜模型与反应坐标定义图2A–图2C给出 LPS、DPPE、DPPG 的结构与粗粒化表示。图2D–图2E展示不对称外膜组装和沿膜法向推进的反应坐标。颜色说明：lipid A 为粉色，LPS inner core 为紫色，outer core 为橙色，水珠为蓝色，黑色箭头表示反应坐标方向。图2明确了”聚合物在什么环境中前进”这个前提。LPS 的分层结构决定了电性匹配的空间选择性：从外到内依次是 outer core（glucose/galactose 糖残基，弱负电）、inner core（KDO 和 HEP 糖残基，强负电）、lipid A（疏水尾链）。$\ce{Ca^{2+}}$ 主要聚集在 inner core 区（z ≈ 2.0–2.5 nm），与强负电糖残基形成桥联。阳离子聚合物的 PMF 极小值也在这个位置，说明它们会被 inner core 的强负电”抓住”；而两性离子或阴离子聚合物的极小值更靠外（z ≈ 2.7 nm），在 outer core 区就更早受到排斥，难以继续深入。还需要强调一点：外膜不对称性本身就是机制的一部分。如果把体系简化成对称磷脂双层，很多“先被外层糖基区捕获，再向疏水核心推进”的路径特征会被弱化，最终导致对抗菌刷层设计的判断偏乐观。关键模拟设置非键相互作用 cutoff 统一为 1.2 nm，静电使用 reaction field。先做能量最小化，再做平衡，再进入 SMD 与 US。 SMD 设置为沿膜法向的质心拉动，平均路径约 18 nm。拉速为 $0.0001~\mathrm{nm/ps}$，弹簧常数为 $1000~\mathrm{kJ\cdot mol^{-1}\cdot nm^{-2}}$。单条 SMD 轨迹约 320 ns，并进行 3 次重复。 US 约 36 个窗口，间距约 0.3 nm，每个窗口采样 125–300 ns（不同体系时间不同），WHAM 重建 PMF，并做 bootstrap 误差估计。如果把这套流程说得更直白一点，本文其实做了两件互补的事。SMD 更像是在给出一条可比较的推进路径，US/PMF 则负责把这条路径转换成自由能图景。第一步，用 SMD 把一条自由聚合物链从体相水中缓慢推向外膜中心，记录这一路上受力、接触、水合和膜重排怎么变化；这一步解决的是“过程长什么样”。第二步，从这条路径上挑出一系列代表性构型做 umbrella sampling，再用 WHAM 重建 PMF；这一步解决的是“哪一段热力学有利，哪一段动力学更难”。方法流程图 graph TB subgraph S1["1.体系构建"] direction TB A1["聚合物：96-mer"] A2["外层LPS + 内层DPPE/DPPG"] A3["310 K，1 bar，离子与水环境"] end subgraph S2["2.路径采样"] B1["平衡模拟"] B2["SMD三重复"] B3["时间分段：接近/黏附/渗入/内化"] B1 --> B2 --> B3 end subgraph S3["3.热力学重建"] direction LR C1["US分窗口采样"] C2["WHAM重建PMF"] C3["窗口重叠 + 分块收敛检查"] C1 --> C2 --> C3 end S1 --> S2 --> S3 --> D["联动分析：受力-接触-水合-离子-自由能"] 结果一：四阶段路径的构象证据 SMD 轨迹把全过程稳定分为四段：approach（0–18 ns）、adhesion（18–34 ns）、permeation（34–112 ns）、internalization（112–320 ns），给出可重复的阶段边界。但构象快照只是第一条线索——要确认这个划分是否真实反映物理过程，还需要从受力、自由能、水合和离子分布等多个角度交叉验证。图9：聚合物跨膜转运四阶段的构象快照。从 SMD 模拟中提取的聚合物跨细菌外膜（OM）转运的四个阶段快照：接近（A）、黏附（B）、渗入（C）和内化（D）。每个子图展示该阶段聚合物、外膜组分的典型构象及膜响应。 A为接近阶段（0–18 ns）：聚合物位于膜外侧约 6.0 nm 范围内，开始去溶剂化但尚未与膜接触。 B为黏附阶段（18–34 ns）：聚合物贴近 LPS 外层并形成稳定界面吸附，阳离子聚合物与 LPS 糖类内核区域相互作用更强。 C为渗入阶段（34–112 ns）：聚合物向膜内推进，受力抬升，伴随局部膜结构重排、去溶剂化和瞬态缺陷。 D为内化阶段（112–320 ns）：聚合物到达膜内叶，部分 LPS 分子被从外叶拖向内叶，膜表面形成纳米孔，随后膜结构自发重建。四阶段划分来自构象快照、受力曲线、PMF 以及水合和离子分布的交叉一致性。approach 和 adhesion 可以自发发生，permeation 和 internalization 则对应动力学不利步骤。结果二：膜结构的稳定性验证密度分布结果显示，外膜宏观层状结构总体稳定，没有出现持续性大破裂。与此同时，进入内化阶段后，膜中心出现局部含水增强，中心水密度约为 $100~\mathrm{kg\cdot m^{-3}}$。这一观察与构象快照中的“瞬态缺陷”相互印证：聚合物推进确实扰动了膜，但扰动是局部的、动态的，而非整体破裂。图3：四阶段中外膜与水的质量密度沿 z 轴分布图3A–图3D分别对应接近、黏附、渗入、内化阶段。线型说明：实线表示膜组分密度，虚线表示水密度，银色参考线为无聚合物扰动时的膜分布。图3最核心的信息是整体结构稳定，但局部会被拉出动态缺陷。这类信号对应局部扰动窗口，支撑了本文对穿膜机制的保守判断：聚合物推进依赖局部重排与短时缺陷，体系不具备低阻力自由穿透通道。结果三：离子重排与接触分析揭示静电匹配的空间选择性 $\ce{Ca^{2+}}$ 在外膜中本身承担桥联与稳定作用。在渗入和内化阶段，$\ce{Ca^{2+}}$ 分布发生明显重排，膜中心区域也出现增强信号（约 $4.0~\mathrm{kg\cdot m^{-3}}$），对应桥联环境重构。这是第三条验证线索：如果四阶段划分是真实的，那么离子分布和聚合物-膜接触应该在每个阶段呈现不同的特征模式。图4：四阶段中钙离子沿膜法向的密度重排。图4A–图4D对应接近、黏附、渗入、内化阶段下的 $\ce{Ca^{2+}}$ 分布变化。颜色说明：不同颜色曲线对应不同聚合物体系，横轴为膜法向坐标 $\ce{Ca^{2+}}$ 密度分布呈现两个主峰：一个位于 LPS 区域（外膜外表面，距膜中心约 2.5 nm），另一个位于磷脂极性头基区域（外膜内表面，约 -2.5 nm）。当聚合物推进到深层时，$\ce{Ca^{2+}}$ 沿膜重新分布并渗透进入膜中心。本文明确指出，聚合物内化会导致 $\ce{Ca^{2+}}$ 离子沿膜重新分布，而这些离子通过与 LPS 和 DPPG 分子的有利相互作用得到维持。接触分析揭示三类聚合物的不同相互作用模式接触数统计（截断距离 0.6 nm）进一步揭示了聚合物与膜组分的特异性相互作用，呈现出三种截然不同的模式。体系 Polymer···$\ce{Ca^{2+}}$ Polymer···$\ce{Cl⁻}$ Polymer···LPS 接近阶段 pDMAEMA-OM 0 2.4 ± 0.4 0 pMETAC-OM 0 22.9 ± 3.8 0 pMEDSAH-OM 4.7 ± 0.6 0 0 pSPMA-OM 56.6 ± 1.4 0 96.8 ± 9.3 渗入阶段 pDMAEMA-OM 0 2.7 ± 1.1 205.6 ± 15.5 pMETAC-OM 0 23.9 ± 6.4 137.5 ± 5.4 阴离子聚合物 pSPMA 与 $\ce{Ca^{2+}}$ 接触数高达 56.6 ± 1.4，与 LPS 接触数达 96.8 ± 9.3，表明它拖拽了这些离子向内推进。阳离子聚合物 pDMAEMA 和 pMETAC 与 $\ce{Ca^{2+}}$ 几乎没有接触，但与 LPS 分子保持大量接触，渗入阶段分别达 205.6 ± 15.5 和 137.5 ± 5.4，解释了它们为什么更容易在界面站住脚。本文明确观察到阳离子聚合物转运过程中 LPS 分子被从膜外叶拖向内叶，这一点与接触数统计高度一致：所有聚合物与磷脂（DPPE 和 DPPG）的接触数均为 0，说明转运过程中只有 LPS 分子被聚合物从外叶拖向内叶。pDMAEMA 甚至携带吸附的 LPS 到达膜内介质。 pSPMA 体系还表现出 $\ce{Na^+}$ 在 LPS 叶中的优先积累，这是由阴离子聚合物骨架携带配位 $\ce{Na^+}$ 离子驱动的。这里有一个容易忽略的细节：原文观察到，平均意义上 $\ce{Na^+}$ 和 $\ce{Cl^-}$ 不会穿膜扩散，后半程的主角是聚合物、LPS 和桥联离子的协同重排。后半程阻力主要来自三部分：空间位阻效应。整个聚合物结构，包括其溶剂化壳，在膜内产生空间位阻。 LPS 拖拽。阳离子聚合物会携带 LPS 分子从外叶拖向内叶。局部瞬态膜缺陷。这会导致局部变薄和水渗透。从设计角度看，这意味着增加电荷主要改善前半程（增强与LPS的静电吸附），但后半程推进仍面临上述三个挑战。这里的核心物理图像是：界面吸附的热力学有利性不等于向内推进的动力学可行性。自由能计算允许我们将热力学有利过程（如吸附）与动力学受限过程（如渗入）分离开来，这在实验上很难区分。结果四：水合层是两性离子与阴离子体系的重要缓冲器为了理解为什么有些聚合物更容易“穿透”膜，需要回答一个基本问题：聚合物在推进过程中会失去多少水合壳层？这是第四条验证线索：如果两性离子聚合物真的“不愿意黏附”，那么它们应该在整个过程中保持更高的水合。本文用两种互补的方法来回答这个问题：图5给出径向分布函数 $g(r)$，定性分析“水还围在链周围有多紧密”。图6给出配位数 CN，定量统计 4.0 nm 范围内有多少个水珠。图5：四阶段中聚合物与水珠的径向分布函数。这里的径向分布函数记作 $g(r)$。图5A–图5D对应接近、黏附、渗入、内化阶段的 polymer–TW 统计。纵轴是 $g(r)$ 强度，反映水分子在聚合物周围的概率密度；横轴是与聚合物质心的距离。关键信息：峰高降低对应去溶剂化，峰高保持对应水合壳保存。图5显示了一个清晰的对比： pSPMA 在渗入和内化阶段，即图5C–5D，仍然保持较高的 $g(r)$ 峰，说明水合壳保存得更好。 pDMAEMA 和 pMETAC 在后期阶段的峰强明显降低，说明去溶剂化更严重。本文明确指出：pSPMA的强水合暗示其与OM的相互作用较弱，这与阴离子聚合物和LPS之间的静电排斥一致。图6：四类聚合物在跨膜转运各阶段的水合配位数。CN 统计四种聚合物在 4.0 nm 径向范围内水珠（TW 珠，MARTINI 3 力场）的配位数，反映聚合物在转运各阶段的水合壳层稳定性。每个数值代表三次独立重复的平均值。配位数的定义：在 4.0 nm 径向距离内的水珠数量，用来定量分析聚合物周围的水合结构。四个阶段对比：依次展示接近、黏附、渗入、内化阶段的配位数变化。颜色说明：不同颜色条形代表四种聚合物，高度反映配位数大小。在 permeation 阶段，四类体系的配位数下降比例如下，显示了去溶剂化差异：聚合物配位数下降比例 pDMAEMA 25.5% pMETAC 21.8% pMEDSAH 22.7% pSPMA 19.1% 定量结论：四类聚合物在推进过程中都会失去一部分水合壳层，但 pSPMA 和 pMEDSAH 丢得更少。这说明它们在进入膜内时更不愿意完全脱水，也更不愿意和膜内部环境形成紧密耦合。这与它们较弱的深层耦合行为是一致的。图5和图6的关系是：图5负责定性分析，看 $g(r)$ 峰高变化，直观感受“水合壳有多紧密”；图6负责定量统计，给出具体的配位数值。两者结合说明，pMEDSAH 和 pSPMA 在后期更容易保留一层含水外壳，这是它们抗污行为的关键机制。到这里，正文已经把“膜怎么变”、“离子怎么变”、“水怎么变”讲清楚了。下一步要问的，就是这些结构变化最后会不会在受力曲线和自由能曲线上留下同样的排序。如果会，前面的结构解释才算真正闭环。结果五：从受力到自由能的证据闭环前面的 Figure 3–6 已经说明，推进过程会伴随膜重排、离子重排和去溶剂化。这是最后一条验证线索：这些结构变化，最后能不能在力学和自由能上闭合成一个一致的解释？如果四阶段划分是真实的，那么 SMD 受力曲线和 US 自由能曲线应该在同样的位置出现信号转折——这就是“证据闭环”。图7：SMD 模拟中聚合物跨膜转运的受力时序曲线。展示四种聚合物在 320 ns SMD 模拟中跨膜转运时的受力 $F$ 随时间变化。每条曲线代表三次独立重复的平均值。聚合物从膜左侧接近并推向右侧。受力曲线特征：不同颜色曲线对应四种聚合物，峰值位置反映各阶段的动力学阻力。阶段分界：受力增长对应黏附建立，膜中心附近的峰值对应渗入和内化的势垒。颜色说明：四种聚合物分别用不同颜色曲线表示，曲线高度反映该时刻施加的力大小。图7的核心结论：最高力峰位于膜中心，说明 permeation 是阻力最大的步骤。阳离子聚合物（pDMAEMA 和 pMETAC）的力峰更高，说明它们与膜相互作用更强、推进时需要更大的力。相比之下，两性离子和阴离子聚合物（pMEDSAH 和 pSPMA）的力峰更低更窄，反映它们与膜的亲和力更弱——因为“不怎么粘”，所以通过更快，没有长时间持续的相互作用。这里有一个容易混淆的细节：pMETAC 的黏附力（292.9）比 pDMAEMA（236.6）更高，但最大受力却相反（pMETAC 1855.7 < pDMAEMA 1940.0）。这并不矛盾——$F_{\mathrm{adh}}$ 反映的是“界面一旦接触，谁更容易被膜抓住”，而 $F_{\max}$ 反映的是“推进过程中哪里最难”。pMETAC 虽然更容易被界面捕获，但后续推进相对顺畅；pDMAEMA 虽然界面捕获稍弱，但一旦深入膜内，需要克服更大的阻力才能继续推进。这说明界面吸附和深层推进是两个独立的物理过程。图8：聚合物向细菌外膜中心推进的势函数曲线。PMF 展示四种聚合物向细菌外膜（OM）中心转运过程的势函数。聚合物从左侧接近膜，沿反应坐标向右侧推进，黑色虚线标示细菌外膜中心位置 $z = 0$。自由能极小值：反映黏附稳定性，阳离子聚合物在 LPS 内核区域约 $z = 2.0$ nm 处出现更深极小值。中心势垒：膜中心区域的能量抬升反映渗入和内化阶段的自由能势垒。图8的核心结论：阳离子聚合物在 LPS 内核区（z ≈ 2.0 nm）有更深的自由能极小值，说明它们与带负电的糖残基（KDO 和 HEP）的静电相互作用更强。相比之下，pMEDSAH 和 pSPMA 的极小值更靠外（z ≈ 2.7 nm），且数值更接近零，说明它们的黏附更不利。从黏附态到膜中心，所有体系都需要克服显著的自由能势垒（$\Delta G^{\ddagger}$），证实 permeation 是动力学不利步骤——尤其 pMEDSAH 的势垒高达 266.4 kJ/mol。这里需要强调一个常被误解的点：图7的受力曲线和图8的 PMF 曲线是互补的，而不是重复。SMD 给出的是“沿着特定路径推进时遇到多大的阻力”，而 US/PMF 给出的是“去掉外力后，系统本身的热力学偏好”。两者结合才能完整回答“能不能继续往里走”：图7说动力学上多费力，图8说热力学上多不利——如果两个都说“很难”，那才是真的很难。统一指标表：把排序和设计建议放在一张图景里聚合物 $F_{\mathrm{adh}}$ $F_{\max}$ $\Delta G_{\mathrm{adh}}$ $\Delta G^{\ddagger}_{\mathrm{per}}$ pMETAC $292.9 \pm 11.7$ $1855.7 \pm 228.4$ $-761.3 \pm 12.1$ $82.8 \pm 12.1$ pDMAEMA $236.6 \pm 19.1$ $1940.0 \pm 102.2$ $-585.6 \pm 2.1$ $75.9 \pm 5.4$ pMEDSAH $154.3 \pm 31.7$ $1762.9 \pm 215.2$ $-440.4 \pm 2.1$ $266.4 \pm 4.4$ pSPMA $85.5 \pm 4.1$ $1704.3 \pm 97.2$ $-284.4 \pm 5.2$ $134.6 \pm 7.2$ 指标解释 $F_{\mathrm{adh}}$（黏附力）：聚合物到达膜表面时（反应坐标约4.4 nm处）的受力，反映界面捕获的难易程度。数值越大说明越容易被膜“抓住”。 $F_{\max}$（最大力）：跨膜全程中的最大受力值，通常出现在膜中心附近，反映 permeation 阶段的动力学阻力。 $\Delta G_{\mathrm{adh}}$（黏附自由能）：聚合物从体相到最稳定位置的自由能变化（PMF极小值），负值越大说明热力学上越有利于黏附。 $\Delta G^{\ddagger}_{\mathrm{per}}$（渗入势垒，per = permeation）：PMF极小值与膜中心（z=0）自由能的差值——像从山脚爬到山顶的高度差，数值越大说明越难向内推进。数据解读这张表把全文最重要的排序浓缩在一起。pMETAC 和 pDMAEMA 的 $\Delta G_{\mathrm{adh}}$ 更负（-761.3 和 -585.6 kJ/mol），说明它们更容易在界面建立稳定吸附——这与阳离子-LPS 的静电匹配一致。但 $\Delta G^{\ddagger}_{\mathrm{per}}$ 呈现不同排序：pMEDSAH 的渗入势垒高达 266.4 kJ/mol，远高于其他体系，说明它虽然能到达界面，但很难继续深入。这里有一个常被误解的细节：pMEDSAH 的”高势垒”不是缺陷，而是抗污优势。它的 $\Delta G_{\mathrm{adh}}$ 不够负（-440.4 kJ/mol），说明界面吸附不强；$\Delta G^{\ddagger}_{\mathrm{per}}$ 很高（266.4 kJ/mol），说明即便吸附了也不容易穿透。这种双重保守正是抗污材料需要的特性：既不愿意黏上去，就算黏上了也扒拉不进膜内。相比之下，阳离子聚合物虽然界面吸附更强，但渗入势垒相对较低（75.9 和 82.8 kJ/mol），说明它们一旦被膜”抓住”，后续推进反而相对容易——这对抗菌有利，但对膜扰动风险更高。把这张表和前面的 Figure 7、Figure 8 合起来看，本文其实是在反复强调同一个结论：界面捕获能力和向内推进能力需要分开判断。四阶段如何被交叉验证本文最重要的方法论贡献，是用五类独立观测量交叉验证了四阶段的边界：阶段构象特征受力信号自由能位置水合变化离子/接触变化接近（0-18 ns）聚合物距膜>6 nm 受力接近零 PMF平台区开始去溶剂化无膜接触黏附（18-34 ns）贴近LPS外层受力开始抬升 PMF极小值区（z≈2.0-2.7 nm）水合层部分保留阳离子与LPS inner core接触渗入（34-112 ns）向膜内推进受力持续增大 PMF爬坡区持续去溶剂化 $\ce{Ca^{2+}}$重排，LPS开始被拖拽内化（112-320 ns）到达膜内叶受力达到峰值 PMF势垒顶部两性离子保持高水合 LPS完全拖入内叶，形成瞬态nanopore 为什么这个交叉验证重要：单一指标容易误判。如果只看受力曲线，可能认为“力大 = 难推进”；但结合 PMF 会发现，力大可能是因为相互作用强（热力学有利），也可能是因为势垒高（动力学不利）。五类观测量互相印证。构象快照告诉你“聚合物在哪”，受力告诉你“推进多费力”，PMF 告诉你“热力学偏好什么”，水合告诉你“为什么两性离子不粘”，离子和接触告诉你“静电匹配在哪发生”。五条线索指向同一个四阶段边界，这才是可信的机制图景。拆解了“界面吸附”和“向内推进”。黏附阶段的 PMF 极小值说明界面热力学有利，但渗入阶段的 PMF 势垒说明继续推进动力学不利——这两个过程的物理驱动力不同，不能用单一电荷指标覆盖。设计建议的物理基础设计目标更关注的指标倾向的化学策略抗污优先高水合、低深层耦合提高两性离子特征，维持稳定水合壳层抗菌黏附优先更负的 $\Delta G_{\mathrm{adh}}$、更高 $F_{\mathrm{adh}}$ 保留阳离子单元并控制局部电荷分布穿膜递送优先较低 $\Delta G^{\ddagger}_{\mathrm{per}}$ 与适中吸附平衡电荷驱动与去溶剂化代价，避免过强界面“滞留” 结果逻辑图：从观测到结论 graph TB A("观测1：阳离子体系黏附更强") --> D("中间解释：LPS界面静电匹配更强") B("观测2：两性/阴离子体系水合保持更高") --> E("中间解释：水合壳层抑制深耦合") C("观测3：PMF显示中心区仍有势垒") --> F("中间解释：推进受结构重排与脱水代价限制") D --> G("结论：高黏附不等于高穿透") E --> G F --> G G --> H("设计建议：把界面捕获与深层推进分开优化") SI 数据如何增强正文可信度 SI 提供主结论的统计支撑： Table S1 给出四类聚合物净电荷与体积差异，为后续力学排序提供物理背景。 Table S3 给出 1.0 μs 自由链的 RMSD 与 Rg，证明比较是在已平衡链构象上进行。 Table S4 给出外膜面积与厚度收敛指标，证明膜基线结构可靠。 Table S5 给出各阶段 CN 绝对值，避免只看百分比造成误判。 FigS5 和 FigS6 给出 US 窗口重叠与分块分析，支撑 PMF 收敛。图S6：PMF 分块分析与收敛性检查图S6把每条 PMF 轨迹按采样时间分成多个 block，分别重建自由能曲线，用来判断不同时间块之间的轮廓是否一致。读图重点是不同 block 的极小值位置、中心势垒高度和整体轮廓是否基本重合。如果这些 block 曲线彼此接近，就说明 Figure 8 里的 PMF 不是某个短时间窗口偶然得到的结果；再结合 SI Figure S5 的窗口重叠情况，才能较有把握地说明 US 采样已经达到可接受收敛。关键结论与批判性总结核心结论这篇工作最重要的结论，是把“界面吸附”和“向内推进”明确拆成两个物理问题。阳离子聚合物更容易在外膜表面建立有利黏附，但这并不等于更容易完成后半程渗入。四阶段路径之所以有解释力，是因为构象、受力、自由能、水合和离子重排彼此能对上。文章把接近、黏附、渗入、内化这四步做成了可交叉验证的过程图谱。两性离子和阴离子体系的高水合保持，是它们偏向抗污而非深层扰动的关键原因。这一点在 Figure 5、Figure 6 和 Table S5 中都有相互支撑的定量证据。阳离子链推进过程中伴随 LPS 拖拽、$\ce{Ca^{2+}}$ 重排和局部 nanopore 形成，说明后半程的代价不只是聚合物自己进入膜内，还包括外膜组分被一起重构。局限与边界自由链不等于真实刷层。本文研究的是自由聚合物链与 OM 的相互作用，而不是显式接枝、显式高密度刷层，因此更接近“刷层末端链段如何与膜相遇”的机制上限，而不是完整表面体系的直接数值预言。膜模型仍然是受控简化体系。虽然外膜做成了 LPS 外层 + DPPE/DPPG 内层的不对称模型，但真实菌膜中的蛋白、拥挤效应、剪切环境和多组分竞争吸附都还没进入模型。 nanopore 与 LPS 拖拽主要来自模拟轨迹观察。这部分可以作为机制候选或结构后果来讨论，但还不能直接当作已经被实验独立证实的普适结论。粗粒化力场的精度仍有限。MARTINI 3 能高效覆盖大体系和长时间尺度，但对氢键、局部构象和精细水合结构的描述不如全原子模型，某些定量值更适合被看作趋势判断。动力学时间尺度还缺少直接实验标定。PMF 给出了后半程势垒，但真实渗入速率还受扩散系数和动力学前因子控制，这部分仍需和单细胞力谱、QCM、AFM 或荧光示踪实验对接。后续方向扩展到多链刷层体系：研究接枝密度、链长分布和刷层厚度对界面吸附与渗入行为的影响，建立从单链到刷层的跨尺度模型。结合全原子模拟细化关键步骤：对黏附和渗入的关键构象用全原子MD进行精细化模拟，验证粗粒化模型的定量准确性，尤其是水合结构和氢键网络的细节。拓展到其他细菌外膜组成：本文使用的是rough LPS（缺少O-抗原），而完整的smooth LPS具有更长的多糖链，可能显著改变聚合物的界面识别和渗入路径，需要系统比较不同LPS类型的影响。与实验数据定量对接：结合单细胞力谱、石英晶体微天平（QCM）和原子力显微镜（AFM）等实验手段，验证计算预测的黏附力、黏附自由能和渗入势垒，建立计算-实验闭环验证体系。本文结果表明，界面黏附强弱和后续渗入难度并不是同一个维度。approach 与 adhesion 可自发发生，而 permeation 与 internalization 仍受较大自由能势垒限制，因此材料设计不能只看单一电荷指标。

Specific Sytems · 2026-04-08

MetalKB：用知识驱动图框架预测蛋白金属结合位点

MetalKB：用团检测和统计势定位蛋白中的金属结合位点本文信息标题：MetalKB：基于知识驱动图框架的蛋白金属结合位点预测作者：Xuejun Zhao, Hao Li, and Sheng-You Huang* 发表时间：2026年3月25日（论文接收）单位：华中科技大学物理学院，中国武汉引用格式：Zhao, X., Li, H., & Huang, S.-Y. MetalKB: Predicting Metal Binding Sites on Proteins with a Knowledge-Based Graph Framework. Journal of Chemical Information and Modeling (2026). https://doi.org/10.1021/acs.jcim.6c00453 代码与资源： GitHub：https://github.com/huang-laboratory/MetalKB/ 网页：http://huanglab.phys.hust.edu.cn/MetalKB/ Zenodo：https://doi.org/10.5281/zenodo.18999183 摘要金属离子在蛋白质的功能、调控和稳定性中发挥关键作用，因此，准确预测金属离子的结合位点，对于揭示相关生物过程的分子机制具有重要价值。本文提出了MetalKB，这是一种新的知识驱动框架，利用原子级统计势和图论策略来预测蛋白质上的金属离子结合位点。具体来说，先用clique检测算法识别可能的供体原子簇，并据此生成初始金属离子坐标；然后利用从蛋白—金属离子结合数据库推导得到的知识势，对这些候选坐标进行评估和局部细化；随后再通过空间距离阈值去除冗余预测。基于Metal3D和TEMSP提供的多样化基准数据集的评估表明，MetalKB在precision、recall和F1 score上与7种代表性方法相比具有有竞争力的表现，同时表现出较强的鲁棒性和参数稳定性。代表性结构案例进一步表明，MetalKB能够识别复杂的配位环境，包括多核金属位点和桥联金属位点。此外，它还能同时给出金属离子的三维坐标和残基级配位配体的预测。结果参数稳定性与阈值选择 MetalKB的结果评估做的是候选金属位点层面的判定：程序先输出一批预测金属坐标，再检查这些预测坐标是否命中了真实金属位点。在Metal3D这一类距离标准下，如果某个预测点距离真实金属坐标不超过5 Å，它就算 true positive；如果一个真实位点没有被任何预测点覆盖，就算 false negative；那些没有靠近任何真实位点的预测点，就是 false positive。precision表示保留下来的预测位点里有多少是真的，recall表示真实位点里有多少被程序找到了。图4：不同能量阈值下的precision–recall变化这里的能量阈值，指的是第一篇里定义的总能量分数阈值：MetalKB会把候选金属位点周围所有相关金属—原子对的混合势函数 $u_{ij}(r)$ 求和，得到一个总分，再经过平移和缩放后用于筛选预测位点这里扫描的是不同能量阈值对预测表现的影响。横轴是平移和缩放后的总能量绝对值，纵轴是precision与recall 数据来自从Ca、Zn、Mg、K统计数据集中各随机抽取的100个结构图4说明的是一个直接的权衡：能量阈值越严格，precision上升而recall下降。文中采用1.7作为折中阈值，因为此时precision已经明显提高，而recall仍保持在可接受范围内。这里的cutoff之所以数值越高反而越严格，是因为程序内部的原始总能量分数本来是负的，数值越低通常表示候选位点越合理。为了便于展示和设定阈值，本文把这些分数做了平移、缩放，并在后续分析里统一报告其绝对值。这样一来，图4横轴上的更大数值，本质上对应的是要求候选位点算出的能量更低，因此保留条件更严格。结果就是：假阳性会被压下去，precision上升；但一些能量优势不够明显的真实位点也会被一起滤掉，所以recall下降。这里还有两个容易忽略的限定条件： MetalKB研究的是金属—蛋白相互作用，因此知识势推导时并不处理小分子配体配位数小于3的特殊情况并不是这套方法的重点，所以结果解读时不能把它理解成对任意金属位点都同样适用的工具小编锐评：如果一个位点严重依赖小分子、辅因子或水分子参与配位，那么它本来就超出了MetalKB这套纯蛋白配位框架最擅长的范围，直接拿来做主比较并不完全公平。至于低配位位点，原文没有把它们直接归为错误数据，但Metal3D原始论文在做其他金属选择性分析时，明确只保留了至少3个独特蛋白配体且occupancy大于0.5的位点；而在锌测试集里，也另外剔除了一批独特蛋白配体少于2个且occupancy不高的位点。更稳的说法是：这类位点更容易受到结构解析质量、占有率和局部环境定义不充分的影响，也更容易给benchmark带来额外噪声。 Metal3D测试集评估 Metal3D来自2023年发表在 Nature Communications 的原始工作，是近几年很有代表性的结构型金属坐标定位方法。这里说的 Metal3D基准，主要指Metal3D原论文使用的锌测试集、其他金属选择性分析数据，以及统一的“距离真实金属5 Å 内算命中”判定标准。这套基准的价值在于来源清楚、评价标准统一、与Metal3D和PMM这类近期结构方法可以直接横向比较。所以这套基准更适合看“能不能把位点坐标准确放出来”，以及方法在多金属数据上能否保持泛化，残基级配体组成不是它的重点。具体到数据，锌测试集来自原始论文按 30% 序列一致性划分得到的测试集：共59个测试结构，对应189个锌位点。MetalKB为了和PMM的处理方式对齐，又手工去冗余，实际评估的是178个锌位点。多金属部分则对应Metal3D原论文中的其他金属选择性分析，包含11类生物相关金属：Ca2+、Mg2+、Na+、K+、Mn2+、Fe3+、Fe2+、Co2+、Ni2+、Cu2+、Zn2+。这一部分位点要求至少有3个unique蛋白残基配体，且occupancy大于0.5。图5：MetalKB在Metal3D测试集上的表现。图5把结果拆成了四个层面：总体precision、recall和F1，坐标误差分布，多金属类型上的横向比较，以及各金属的偏差统计。 (a) 比较MetalKB、Metal3D、PMM在不同阈值下的precision、recall、F1 (b) 给出MetalKB预测坐标的误差分布，其中灰色条表示受多核金属位点影响的预测 (c) 比较MetalKB（蓝色，energy threshold = 1.7）与Metal3D（橙色，p = 0.75）在11类金属上的性能 (d) 给出11类金属预测的偏差分布；图中负值代表相对参考位置的有符号偏差，不是负距离评估指标定义 Metal3D基准使用三个标准指标： Precision（精确率） = $\dfrac{\text{TP}}{\text{TP} + \text{FP}}$，预测为阳性的样本中真正为阳性的比例 Recall（召回率） = $\dfrac{\text{TP}}{\text{TP} + \text{FN}}$，真实阳性样本中被正确预测的比例 F1-score = $2 \times \dfrac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$，precision和recall的调和平均数 F1-score综合考虑了精确率和召回率，是两者之间的平衡指标。图5a展示了MetalKB在不同能量阈值下的性能变化。这里的 $p$ 是Metal3D和PMM输出预测位点时使用的概率阈值：只有概率分数高于这个阈值的位点才会被保留。阈值越高，保留下来的预测通常越保守，false positive更少，因此precision往往更高，但recall也更容易下降。为了便于横向比较，可以把MetalKB与两种对比方法的关键指标整理成下面这张对照表：方法参数值 Precision Recall F1 MetalKB threshold = 1.0 0.806 0.489 0.608 MetalKB threshold = 1.5 0.859 - 0.614 MetalKB threshold = 1.7 0.955 0.472 0.631 PMM p = 0.5 0.752 0.494 - PMM p = 0.75 0.901 0.410 0.563 Metal3D p = 0.5 - - 0.631 Metal3D p = 0.75 0.904 0.450 0.601 Metal3D p = 0.9 0.986 0.360 0.527 从这张对照表可以看出几个关键趋势：指标差别不大，MetalKB在不同阈值下维持了相对稳定的精确率—召回率折中。坐标误差怎么理解图5b还展示了空间定位精度。MetalKB(1.7) 的平均坐标误差是1.117 ± 1.567 Å，数值上高于Metal3D在p = 0.75时的0.710 ± 0.631 Å。但MetalKB的中位误差只有0.224 Å，反而优于Metal3D的0.508 Å。这与多核锌位点有关：因为两个真实锌离子本来就可能相距很近，误差统计容易被这些特殊案例显著影响。文中还特别指出，误差大于3 Å 的15个预测主要来自二核位点；如果把这些情况排除，MetalKB的平均误差会降到0.596 ± 1.025 Å。多数普通位点的坐标定位已经很准，均值主要受少数多核难例影响。多金属测试集的结果 Metal3D的这组多金属测试数据包含11类金属：Ca2+、Mg2+、Na+、K+、Mn2+、Fe3+、Fe2+、Co2+、Ni2+、Cu2+、Zn2+。这组位点都至少有3个独特蛋白配体，且占有率大于0.5。图5c显示，MetalKB在大多数金属类型上优于Metal3D，尤其是Zn2+、Ca2+和Fe3+。而Metal3D在Na+、K+、Mg2+这些非过渡金属上的表现较差，这和它的训练集主要面向锌有关。图5d里，MetalKB在11类金属上的中位预测误差约为0.3 Å，也就是一半以上预测已经非常接近实验坐标。更细的各金属误差统计见表S1。表S1：各金属的误差分布。表S1把图5d中的分布进一步量化成平均误差和中位误差。这里摘出MetalKB在阈值1.7下的几类代表性金属：金属平均误差（Å）中位数误差（Å） Zn 0.425 ± 0.884 0.174 Ca 0.314 ± 0.526 0.178 Ni 0.371 ± 0.267 0.304 Cu 0.362 ± 0.424 0.254 K 0.407 ± 0.608 0.253 这说明MetalKB不局限于锌体系，在 Ca、Ni、Cu、K 等金属上也能给出相当靠近实验位置的预测坐标。 TEMSP测试集评估 TEMSP全称是 3D Template-based Metal Site Prediction，来自2011年发表于 Bioinformatics 的工作。该方法把已知锌位点拆成残基对模板，再用Cα/Cβ的相对几何去匹配目标蛋白中的候选残基，因此这套基准更适合检验配位残基组成是否预测正确。测试集构成本文使用的TEMSP测试集包含100个蛋白结构和136个实验验证的锌位点。TEMSP原始论文详细说明了构建流程：从含锌PDB结构中下载并过滤数据，按同源关系分组并提取代表性链，再随机拆成训练集和独立测试集。独立测试集中的蛋白及其同源序列贡献的模板都从模板库中移除，因此测试集既独立于训练阶段，也独立于模板库本身。 TEMSP测试集只针对锌位点，不承担多金属泛化评估。评估指标：IoUR TEMSP判断预测配位残基集合与真实配位残基集合的重叠程度。TEMSP原始论文强调，宽松的TP定义容易把”只猜对一部分配体”的结果也算作成功，因此它更看重尽可能多地猜对真实配位残基，同时尽量少报错残基。文中使用的指标是 IoUR（Intersection over Union of Residues，残基层面的交并比）： [\mathrm{IoUR} = \frac{N\left(\text{预测配位残基} \cap \text{真实配位残基}\right)} {N\left(\text{预测配位残基} \cup \text{真实配位残基}\right)}] 分子是预测集合和真实集合的交集大小，分母是两者并集大小。这个比值同时惩罚漏掉真实配体和多报无关残基。当 $\mathrm{IoUR} \ge 0.5$ 时，预测位点才算 true positive；当 $\mathrm{IoUR} = 1$ 时，表示预测残基集合和真实集合完全重合。结果图6：在TEMSP上的比较。图6给出六种方法在残基级位点识别上的precision、recall和F1，并同时标出可用方法的平均坐标偏差。柱状图展示precision、recall、F1 折线显示平均坐标偏差，单位是 Å。CHED和ZincBindDB不输出显式三维坐标，所以图里没有它们的平均坐标偏差表2：TEMSP上的关键数值方法 TP FN FP Precision Recall F1 坐标偏差（Å） MetalKB 133 3 6 0.957 0.978 0.967 0.262 PMM 134 2 21 0.865 0.985 0.921 0.237 TEMSP 117 19 5 0.959 0.860 0.907 0.380 CHED 112 24 11 0.911 0.824 0.865 — GRE4Zn 101 35 5 0.953 0.743 0.835 0.267 ZincBindDB 115 21 273 0.296 0.846 0.439 — TEMSP 是2011年的残基对模板方法，偏重锌位点模板匹配；PMM 是2025年发表的 PinMyMetal，面向过渡金属，先用几何规则筛候选，再结合化学和局部环境特征打分，并继续预测最可能的金属类型。表2可以直接拆成下面几点： MetalKB的 F1 = 0.967，是表2里最高的一项。虽然它的recall 0.978略低于PMM的0.985，但precision 0.957明显高于PMM的0.865 TEMSP和GRE4Zn的高precision、低recall 组合意味着它们对false positive的控制更严格，但漏检风险也更高 ZincBindDB的主要问题是 273个false positives，这直接使precision降到0.296 在坐标偏差上，MetalKB的0.262 Å 虽略高于PMM的0.237 Å，但仍然处在非常小的误差量级内图4–图6之间的precision/recall差异，与测试集组成有关。图4和图5a所用数据里包含一些配位数少于3的位点，而图5c和图6代表的是更典型、更规范的配位环境，因此这些数字不能直接横向混为一谈。复杂配位环境的案例图7：多核与桥联锌位点的代表性案例。图7展示的是共享配体、近距离双核以及多位点并存这些更难的场景。 (a) 乳酸杆菌二核锌氨肽酶PepV (b) 人源H3K9 histone lysine methyltransferase (c) RAG1 dimerization domain (d) RAG1 dimerization domain中的二核锌簇图中金色球是实验结构中的金属位置，红色球是MetalKB预测的位置案例1：PepV的双锌活性位点 PepV是桥联双金属的典型例子。Zn2由His87、Asp119、Asp177配位，Zn1由His439、Asp119、Glu154配位，其中 Asp119是桥联配体，连接两个锌离子，两个金属之间距离约3.8 Å。MetalKB不仅找到了两个锌的位置，还正确识别了共享配体Asp119。平均金属—金属距离误差小于0.18 Å。案例2：H3K9甲基转移酶中的多个锌位点在这个结构里，锌分布于Pre-SET和Post-SET区域。Pre-SET区域有3个锌，由9个保守半胱氨酸围成三角形锌簇；Post-SET区域还有一个四面体配位锌位点。MetalKB对这些位点都能正确定位，说明它不仅能识别单个锌位点，也能处理同一蛋白中的多个不同锌位点。案例3：RAG1的复杂锌配位环境 RAG1二聚化结构域里同时包含典型单核C3H型RING finger、C2H2型zinc finger，以及一个由Zn2Cys5His2组成的双核锌簇。在后者中，Cys293是桥联配体，另外还有Cys266、His270、His295等参与配位。MetalKB能把这些空间关系和共享配体关系一起识别出来，这恰好体现了clique建模比简单局部打分更适合处理复杂多中心位点。图S3：非锌体系的补充案例 SI里又补了4个非锌实例，分别是： (a) 多铜氧化酶laccase（PDB：1GYC），展示催化中心的三核铜簇。 (b) Klebsiella aerogenes 的镍依赖脲酶（PDB：2KAU），展示双核Ni2+活性位点。 (c) protein kinase C的Ca2+-bound C2 domain（PDB：1A25），展示空间上相邻的多个Ca2+。 (d) 钾通道KcsA（PDB：1K4C），展示选择性滤过器中的4个K+。这些补充图说明，MetalKB对 Cu、Ni、Ca、K 等体系也有一定可迁移性。图S2：知识势能否区分金属类型 SI里专门做了一个cross-metal prediction analysis。图里的四个panel分别固定了四类真实位点：(a) 是 Zn位点，横轴比较ZN / MG / CA三种知识势；(b) 是 Ca位点，横轴比较CA / MG / K；(c) 是 Mg位点，横轴比较MG / CA / K；(d) 是 K位点，横轴比较K / CA / MG。a/b/c/d对应的是四类真实金属位点各自做的一次交叉测试。这里确实存在交叉预测：每个panel都先固定一类真实金属位点，再把同一批真实位点分别交给不同金属类型对应的知识势去做完整预测。图里的横轴表示“这次预测时使用的是哪一种金属特异性知识势”，分布本身统计的是那些 true positive预测点到真实金属位置的空间偏差。图S2比较的是同一个真实位点在换用不同金属势之后，预测坐标的变化。图S2显示，正确金属类型对应的知识势通常会给出更集中、偏差更小的坐标分布。做这种交叉，是为了检验 MetalKB的能量函数里有没有金属类型信息。如果正确金属类型对应的知识势总能给出更集中、更小的偏差分布，就说明这套势函数对“这个位点更像哪一类金属环境”确实有一定分辨力。SI里还补了两个限定条件：所有预测都统一使用1.7这个阈值，而且只展示TP数量不少于真实位点数5%的情况，避免极少数偶然命中把分布画得失真。小编锐评：这张图更像是在测试金属环境能否粗略区分。如果两个金属的供体组成和配位几何本来就很接近，那么它们对应的最低能区域本来就可能相似，交叉之后结果接近并不奇怪。关键结论与批判性总结这篇工作的主要贡献方法层面，MetalKB给出了一种组合路线：几何上先用 clique采样，化学上再用金属特异性统计势做筛选和细化。结果层面，它在Metal3D与TEMSP两个风格不同的基准上都拿到了有竞争力的结果，尤其在TEMSP上拿到最高F1，说明残基级预测也做得不错。应用层面，它输出的是金属三维坐标加配位残基，因此更方便后续结构解释、对接和建模。案例层面，PepV、H3K9甲基转移酶、RAG1等例子说明，这套方法对多核和桥联位点具有实际处理能力。方法的优势实验结构统计驱动的势函数：物理含义比纯黑箱模型更直观。对Ca、Mg、K和多种过渡金属的泛化性：不只局限于锌体系。对桥联和双齿配位的敏感性：羧酸虚拟节点和clique建模更容易识别复杂配位模式。能量阈值扫描下的稳定性：至少在文中给出的范围内，表现没有剧烈震荡。局限性与仍待解决的问题金属类型需要用户预先指定。当前势函数只能提供有限的金属类型区分能力。小分子配体和配位数低于3的位点处理不足。这意味着某些依赖水分子、辅因子或非蛋白配体的位点可能不在它的强项范围内。统计势主要编码几何与距离偏好，还没有显式纳入更细的电子结构因素，所以在精细区分相近金属时仍有瓶颈。对输入结构质量有依赖。本文所有评估都基于含金属的实验结构（MESPEUS数据库中分辨率 ≤ 2.5 Å 的X射线晶体学或冷冻电镜结构），MetalKB在这些holo形式的结构上表现优异。但方法严重依赖供体原子的精确空间位置，如果侧链构象本身不可靠（例如His的咪唑环rotamer错误、Asp/Glu羧基取向偏离、Cys的SG原子位置不准），候选供体图的质量就会显著下降。小编锐评： MetalKB依赖两个关键的信号：供体原子的空间组合关系和金属—原子相互作用的统计偏好。这些使得它相比于biometall考虑的更多，但是其实并没有对比它俩。思路不复杂，就是能发出来，也挺好。说明physics还是稍微有点用的。尤其在金属种类精细判别、低配位位点以及含非蛋白配体体系方面，这个框架还有明显改进空间。这些本应该是physics-based方法的优势所在。是否能把势能精确到QM层级，是未来的发展方向。当然了，没有动力学的话，还是无法从头找，面对一个很新的蛋白就可能束手无策。当然可以接入流程了。难点在于侧链预组织，拿一个metal-free的（比如AF3预测的）protein能不能还是准确，是个问题。实际使用 MetalKB的命令行接口： MetalKB protein_PDB_file Metal_Type Energy_Cutoff # 例如： MetalKB example/1DVP.pdb ZN -1.7 程序会输出两个文件： out.pdb：预测金属坐标及其能量分数 out.dat：对应的配位残基信息

Specific Sytems · 2026-04-03

MetalKB：用知识驱动图框架预测蛋白金属结合位点

Specific Sytems · 2026-04-02

倾斜角的物理决定因素：从膜厚度到跨膜电位

倾斜角的物理决定因素：从膜厚度到跨膜电位引言在《取向角即判据：用倾斜角判别膜肽表面/倾斜/插入三态，2H-NMR与MD证据》一文中，我们确立了tilt angle作为区分膜插入状态的核心判据。然而，仅仅“知道”一个螺旋的tilt angle是不够的，我们需要理解“为什么”它的tilt angle是这个数值，以及“如何”从序列预测取向。本文深入探讨决定tilt angle的三大物理定律：疏水匹配定律、能量分化定律和静电调控定律。通过分析PGLa、hΦ19W、跨膜螺旋与抗菌肽等体系，我们将看到这些定律在不同系统中的一致性，并建立从序列到取向的定量预测框架。跨膜电位对取向的调控：PGLa案例本章要点： ✓ PGLa倾斜角与TMP的定量关系（r²=0.6） ✓ 正反馈机制的三个环节 ✓ 细菌选择性的物理本质 PGLa是典型的两亲性α-螺旋抗菌肽（序列GMASKAGAIA GKIAKVALKA L-amide），对膜环境极其敏感，膜成分、肽脂比与水化条件都会显著改变其取向与拓扑，因此常被用作“电生理环境如何影响取向”的探针。 Németh等人通过MD模拟发现，PGLa的tilt angle与跨膜电位（TMP）存在耦合关系，揭示了电生理环境对抗菌肽取向的调控作用。 TMP是什么，如何控制？项目内容定义 TMP是膜内外静电势的差值，反映跨膜电场强度盐梯度法在双层膜中央隔室加入0.4 M $\ce{NaCl}$建立离子不对称分布定量结果 DB.S体系$\mathrm{TMP} \approx -66 \pm 28\ \mathrm{mV}$，加入PGLa后DB.S.P为$\mathrm{TMP} \approx -87 \pm 44\ \mathrm{mV}$ 方法学对照电荷分离法（NIIMB）会产生约4000 mV的非生理电位并扰乱膜结构，因此弃用无TMP对照 SB.P采用单层膜并依赖周期性边界条件使TMP近似为零跨膜电位对PGLa倾斜角的影响该图展示PGLa倾斜角（τ）与跨膜电位（TMP）的耦合：子图(A)为τ与TMP散点图（375 ns轨迹按5 ns分段），线性回归$r^2=0.6$显示显著相关；子图(B)显示TMP越负，Ala20越靠近膜中心，对应更深的倾斜插入；子图(C)的自由能曲线对比表明TMP使最低点向膜中心移动，并改变跨越能垒形状。倾斜角τ与TMP的耦合机制 [\mathrm{TMP} = \phi_{\text{inner}} - \phi_{\text{outer}}] 其中$\phi$是沿膜法向 $z$ 方向计算得到的静电势。原文的做法是：先用 gmx potential 将体系中所有原子的部分电荷沿 $z$ 方向分箱求和，再把该电荷分布代入 Poisson 方程并做双重积分，得到跨膜的电势 profile；TMP就是膜两侧对应区域的电势差。PGLa插入后会重排膜-水界面的离子分布，因此改变电势 profile，最终改变TMP。定量关系 τ增大导致螺旋更深插入，$\ce{Na+}$离子向膜内侧聚集，从而TMP更负；TMP更负增强静电驱动力，促进带正电的PGLa倾斜插入，进而τ增大。这种正反馈循环解释了PGLa在细菌膜（TMP约-50至-100 mV）中的高活性——一旦开始插入，过程会自我加强。定量关系可以拆成三个环节： graph TB A[τ增大 螺旋更深插入] --> B[Na⁺向膜内侧聚集 离子分布不对称性增强] B --> C[TMP更负 超极化 约-50至-100 mV] C --> D[静电驱动力增强 吸引带正电的PGLa] D --> A style A fill:#e1f5ff style B fill:#fff3e0 style C fill:#f3e5f5 style D fill:#e8f5e9 环节描述 τ增大螺旋更深插入，$\ce{Na+}$离子向膜内侧聚集 TMP更负离子重排使TMP负向增强，静电驱动力增强正反馈循环更大的TMP进一步促进倾斜插入，解释细菌膜中PGLa的高活性关键发现关键发现可以归纳为三点：关键发现详细描述正反馈机制 TMP更负增加tilted state population，螺旋更深插入并进一步改变TMP 电生理调控细菌膜内负电位（-50至-100 mV）促进倾斜插入，增强抗菌活性物理机制螺旋与膜-水界面$\ce{Na+}$离子的静电相互作用驱动耦合，离子重排成为电信号与结构变化的桥梁 Na+沿膜法向的分布揭示离子重排该图给出四种TMP簇（对应不同平均倾斜角）的$\ce{Na+}$浓度分布。高TMP（更负）时，膜内侧电双层的$\ce{Na+}$峰明显减弱，外侧相应增强，体现出离子分布的不对称性；下方两个放大图进一步强调了电双层区域的变化。它直观展示了“倾斜角越大，离子重排越明显”这一机制性证据。深入解读：跨膜电位与PGLa取向的正反馈耦合机制 💡 阅读提示：本节为深入解读，包含研究背景、实验设计和机制细节。如仅需核心结论，可跳至“为什么这篇论文重要？”部分。研究动机：细菌膜电位如何“召唤”抗菌肽？研究动机有三层背景：类别内容肽的生物学特性 PGLa为阳离子抗菌肽，对多种细菌有效，机制与膜插入和破坏相关选择性难题如何在细菌膜与真核膜之间实现选择性？电生理背景细菌膜TMP约-50至-100 mV（内负外正），该电信号是否调控取向与活性仍未知此前研究的核心缺口包括：缺口类型描述关注静态取向多数研究只讨论表面态与插入态的静态分布忽略TMP动态影响体内有TMP、体外无TMP，取向行为可能显著不同研究目标建立TMP与PGLa tilt angle的定量关系核心设计：盐梯度法产生生理相关TMP MD模拟中产生跨膜电位有两种主要方法：方法原理 TMP大小优缺点电荷分离法（NIIMB）在膜两侧放置不等数量离子直接产生电场 ~数千mV 远超生理范围并易导致膜破裂盐梯度法在中央隔室加入过量盐（0.4 M NaCl）形成浓度梯度 -66至-87 mV 生理相关，避免膜破裂论文采用盐梯度法，并设置四组对照模拟：模拟组描述目的 DB 双膜，无肽建立盐梯度作为空白对照 DB.S 双膜，无肽验证盐梯度产生的TMP大小 SB.P 单膜，有肽无TMP对照，周期性边界保证无电位差 DB.S.P 双膜，有肽，盐梯度核心实验组，PGLa在有TMP条件下模拟关键设计：SB.P与DB.S.P使用相同初始结构，唯一差异是是否存在TMP，从而干净分离电位效应。关键发现：正反馈循环的三个层次论文通过500 ns MD模拟（分析最后375 ns），发现了PGLa tilt angle与TMP之间的正反馈耦合：三层关键发现如下：发现类型详细描述定量相关性（$r^2=0.6$） TMP越负，tilt angle越大，四个倾角-电位簇分别为：95±7°对应−18±17 mV，100±8°对应−67±11 mV，110±6°对应−106±11 mV，116±6°对应−150±13 mV population偏移无TMP时以表面态（≈95°）为主，有TMP时插入态（≈110°–120°）显著增加正反馈机制倾斜插入使$\ce{Na+}$在膜内侧聚集、外侧减少，TMP更负后继续促进倾斜插入这个机制的物理本质是静电耦合与离子重排的闭环：倾斜角增大使正电表面更靠近膜内侧，$\ce{Na+}$向内聚集导致离子不对称性增强，TMP因此更负并反向牵引PGLa继续倾斜。能量景观的重塑论文计算PGLa沿膜法向（z轴）的自由能景观，显示TMP重塑了能量面：无TMP时全局最小值位于膜表面（z≈-15 Å），而有TMP时最小值向膜中心移动（z≈-10 Å），跨越能垒较低，插入态更容易被占据。为什么这篇论文重要？重要性维度具体体现解释细菌选择性细菌膜负TMP（-50至-100 mV）放大插入与抗菌活性，而真核膜缺乏TMP驱动，多停留表面态建立电生理-取向关系首次定量显示TMP影响抗菌肽取向（$r^2=0.6$），为电生理调控提供框架揭示自增强反馈正反馈意味着一旦PGLa开始插入，过程会自我加强，解释“全有或全无”行为与协同效应方法学创新盐梯度法生成生理相关TMP，避免电荷分离法产生的过强电位（~4000 mV）与膜破裂问题序列决定性：跨膜螺旋vs表面吸附肽本章要点： ✓ 隐式膜模型揭示“序列决定取向”的物理本质 ✓ 跨膜螺旋与抗菌肽呈现截然不同的自由能景观 ✓ 计算与实验定量一致（偏差约±8°） Ulmschneider等人开发了一种隐式膜模型来计算膜相关螺旋的取向，并与固态NMR实验结果进行了系统性对比。该研究分析了6个跨膜螺旋和9个抗菌肽，揭示了序列决定tilt angle的物理本质。跨膜螺旋vs抗菌肽的对比肽类型倾斜角特征能量极小值插入能跨膜螺旋（6个） 0–30°（接近垂直）膜中心（插入态）为主 –4.7 ~ –10.2 kcal/mol 抗菌肽（9个） 90±4°（平行于膜）膜表面（表面态）插入需克服约4–6 kcal/mol能垒跨膜螺旋与抗菌肽的自由能面对比该图展示了两种截然不同的自由能景观：子图(A) AchR M2跨膜螺旋有两个极小值，膜中心（z≈0 Å，tilt≈15°）为全局最小值，膜表面（z≈±10 Å，tilt≈90°）为局部极小值；子图(B) Magainin仅在膜表面出现深色极小值，插入膜中心需克服约4–6 kcal/mol的能垒，与实验一致。隐式膜模型的自由能计算 [\Delta G(z, \theta) = \Delta G_{\text{solv}}(z, \theta) + \Delta G_{\text{elec}}(z, \theta) + \Delta G_{\text{conf}}] 其中包括三个主要项：能量项描述 $\Delta G_{\text{solv}}$ 溶剂化自由能，依赖残基在膜内的位置和取向 $\Delta G_{\text{elec}}$ 静电相互作用能，主要来自带电残基与脂质头部的相互作用 $\Delta G_{\text{conf}}$ 构象熵损失对于跨膜螺旋，$\Delta G_{\text{solv}}$在膜中心最低（疏水残基埋藏）；对于抗菌肽，$\Delta G_{\text{elec}}$在膜表面最低（极性残基与头部相互作用）。计算结构与固态NMR结构的叠加对比该图展示三个跨膜螺旋的计算预测结构（灰色）与固态NMR测定结构（红色）的叠加对比，验证了隐式膜模型的准确性：蛋白描述结构一致性 AchR M2 烟碱乙酰胆碱受体δ亚基的M2通道片段计算结构与NMR结构几乎完全重合 Influenza A M2 流感病毒A M2通道取向高度一致，关键残基（Ser8、Gln13、Asp24）位置吻合 FD coat protein 噬菌体FD外壳蛋白，螺旋在页面平面内结构一致性良好关键发现跨膜螺旋的自由能面显示双重极小值，插入态（tilt ~15°）总是全局最小而表面态（tilt ~90°）为局部极小；抗菌肽的自由能面仅有一个表面极小值（tilt ~90°），插入到膜中心需要显著的自由能惩罚；计算与实验定量一致，6个跨膜螺旋的预测tilt angle与固态NMR测量值吻合，验证了隐式膜模型的可靠性；物理机制上，疏水残基驱动插入，极性/电荷/芳香残基决定螺旋在膜内的正确取向。深入解读：隐式膜模型揭示“序列决定取向”的物理本质 💡 阅读提示：本节为深入解读，包含方法学细节、参数化策略和验证过程。如仅需核心结论，可跳至“为什么这篇论文重要？”部分。研究动机：计算机预测膜蛋白取向的“圣杯” 2007年，当这篇论文发表时，结构生物学领域面临一个重要挑战：如何仅从氨基酸序列预测膜蛋白在膜中的取向？固态NMR实验能够测定tilt angle和rotation angle，但实验耗时费力，且无法进行大规模预测。另一方面，随着基因组测序的普及，大量膜蛋白序列被鉴定，但结构信息严重缺乏。如果能够开发一种计算方法，准确预测膜蛋白的取向，将极大推动膜蛋白结构和功能的研究。此前已有一些隐式膜模型（如Wimley-White全息标度、生物物理模型等），但它们主要关注小分子或肽的膜结合能，无法准确预测完整膜蛋白的tilt angle和rotation angle。这篇论文的核心动机是填补这个gap——开发一种基于物理原理的隐式膜模型，能够准确预测跨膜螺旋和抗菌肽在膜中的取向，并与独立的固态NMR实验数据集进行系统性验证。核心设计：从“统计分布”到“物理模型”的参数化策略论文采用的隐式膜模型基于一个巧妙的参数化策略：数据驱动的参数化：从46个已解析的α-螺旋膜蛋白结构（分辨率<4 Å）中，统计每种氨基酸残基沿膜法向（z轴）的分布$n_i(z)$。例如，疏水残基（Leu、Ile、Val）在膜中心（z≈0 Å）富集，带电残基（Arg、Lys、Asp、Glu）在膜表面（z≈±15-20 Å）富集，芳香残基（Trp、Tyr）在膜-水界面（z≈±10-15 Å）富集。势函数拟合：将统计分布转换为转移自由能$\Delta G_i(z)$： $\Delta G_i(z) = -k_B T \ln \left( \frac{n_i(z)}{n_i^{\text{bulk}}} \right)$ 其中$n_i^{\text{bulk}}$是残基在水中的参考浓度。这个公式将“统计频率”转换为“物理能量”，使得模型具有明确的物理意义。刚性体扫描：将肽或蛋白视为刚性体，扫描三个变量：tilt angle（θ，0°-180°）、rotation angle（ρ，0°-360°）、膜深度（z，-30 Å至+30 Å）。计算每个构象的总转移自由能： $\Delta G_{\text{total}}(\theta, \rho, z) = \sum_{i=1}^{N} \Delta G_i(z_i)$ 其中$z_i$是第$i$个残基在给定取向下的深度。找到全局能量最小值，即为预测的最优取向。这个设计的巧妙之处在于：模型参数完全来自真实膜蛋白结构的统计分布，无需任何人工调整或拟合实验数据。这使得模型具有强大的预测能力——可以用于与参数化集完全独立的体系。关键发现：三种能量景观揭示“序列决定取向”的本质通过对6个跨膜螺旋和9个抗菌肽的计算，论文揭示了三类截然不同的自由能景观：跨膜螺旋的双重极小值景观：插入态（tilt≈0°-30°）为全局最小值，表面态（tilt≈90°）为局部极小值，upside-down态（tilt≈150°-180°）能量较高，对应错误拓扑。三类极小值解释了跨膜螺旋可在表面短暂停留再插入，以及拓扑具有方向性。抗菌肽的单极小值景观：表面态（tilt≈90°）是唯一极小值，插入态需克服约4–6 kcal/mol能垒，因此抗菌肽主要以表面吸附态存在，其机制依赖表面吸附而非直接跨膜插入。序列决定取向的定量规律：疏水残基（Ala、Leu、Ile、Val、Phe）是插入驱动力，极性残基（Ser、Thr、Asn、Gln）偏向表面，带电残基（Arg、Lys、Asp、Glu）强烈偏好膜-水界面，芳香残基（Trp、Tyr、Phe）形成界面“aromatic belt”。因此疏水比例高的螺旋更易跨膜，带电/极性比例高则更易表面吸附。计算与实验的定量验证论文将计算预测与独立的固态NMR数据集（6个跨膜螺旋）进行了对比：跨膜螺旋实验tilt angle (°) 计算tilt angle (°) 偏差 (°) AchR M2 11 19 +8 Influenza A M2 37 (38±3) 41 +4 FD coat protein 19 (26) 23 +4 VPU 16 (13) 5 -11 NMDA NR1 - 40 - 平均偏差约±8°，这处于固态NMR实验的不确定性范围内（±5°至±10°），验证了模型的准确性。为什么这篇论文重要？建立了“序列→取向”的定量预测框架：该工作展示了隐式膜模型可用于预测tilt angle与rotation angle，为后续大规模膜蛋白取向预测与数据库建设提供了方法学基础。揭示了自由能景观的普适规律：论文发现跨膜螺旋和抗菌肽呈现截然不同的能量景观——双重极小值 vs 单极小值。这个规律后来被多次验证，成为理解膜蛋白-脂质相互作用的基础。为药物设计提供理论指导：通过分析残基贡献，论文揭示了哪些残基类型驱动插入，哪些残基决定取向。这为理性设计膜活性肽（如抗菌肽、细胞穿膜肽）提供了定量指导。例如，若要设计跨膜肽，应增加疏水残基比例；若要设计表面吸附肽，应增加带电/极性残基比例。方法学的创新影响：论文采用的“统计分布→物理模型”的参数化策略影响了后续许多隐式膜模型的开发，包括HSAFT、IMM1、MEMBPLUGIN等。这种方法避免了人工调整参数，保证了模型的客观性和可迁移性。方法学：计算与实验的相互验证固态NMR：hΦ19W的温度效应对含有19个疏水残基的跨膜锚定肽（hΦ19W）的研究发现：室温条件：螺旋绕长轴快速旋转导致N-H偶极耦合运动平均化，$\ce{^{15}N}$化学位移呈现尖锐共振峰，螺旋轮模式坍缩到其质心低温/DNP条件：$\ce{^{15}N}$化学位移变化约20 ppm，指示倾角减小约10°（例如从~22°减小到~10°），螺旋更直立物理解释：低温下脂质双分子层疏水厚度增加，跨膜螺旋需通过减小tilt angle来维持疏水匹配，这一定量关系验证了疏水匹配定律深入解读：PGLa的温度效应与DNP固态NMR的可靠性验证 💡 阅读提示：本节为深入解读，包含技术背景、实验设计和结果分析。如仅需核心结论，可跳至“为什么这篇论文重要？”部分。研究动机：低温是否改变了膜蛋白的“真实面貌”？研究动机来自对DNP低温条件的三重担忧：技术优势：DNP固态NMR可用微波激发电子自旋并转移极化，信号增强约10–100倍关键限制：必须在100 K左右极低温下进行科学疑问：低温是否改变膜相态（液晶→凝胶/亚凝胶），并冻结肽的取向与构象，从而影响生物学意义这篇论文的核心动机就是回答这个问题：DNP条件下的低温测量是否仍然能反映膜蛋白在生理条件下的真实取向？核心设计：巧妙的“双线作战”策略作者采用“一石二鸟”的双体系策略： PGLa抗菌肽：两亲性α-螺旋，约21残基，常以表面态（tilt angle≈81°）存在，取向对脂质组成与温度敏感温度探针：若低温改变取向，PGLa会最先表现出来 hΦ19W跨膜锚定肽：19个连续疏水残基的典型跨膜螺旋对照逻辑：tilt angle由疏水匹配决定，若温度改变膜厚，应出现可预测的倾角调整实验设计的关键创新是带棕榈酰链的biradical（PyPol-C16）：传统问题：水溶性biradical（如TOTAPOL）易从脂质双层析出，增强效率低结构改造：加入16碳脂肪酸链，相当于“膜锚” 机制结果：嵌入膜疏水核心并与膜蛋白共定位，DNP增强可达约17倍技术意义：静态（无旋转）条件也能获得高增强因子，突破以往依赖MAS样品的限制 PGLa与hΦ19W的温度与相态响应条件 $\ce{^{15}N}$化学位移最大值对应倾斜角构象状态 310 K，DMPC/$\ce{DMPG}$液晶相 125 ppm 53° 倾斜插入（T-state，可能是二聚体） <297 K，凝胶相 87 ppm 81° 表面吸附态（S-state）脱水条件 160 ppm 更小垂直取向（I-state）关键发现：温度的影响比预期小得多实验结果的核心结论包括：结论类型详细描述 PGLa取向随相变切换 310 K时$\ce{^{15}N}$化学位移峰在约125 ppm，对应tilt angle≈53°（T态）；温度降至Tc以下（~297 K）后峰移至87 ppm，对应tilt angle≈81°（S态），100 K下仍保持良好取向 hΦ19W温度依赖倾角随低温增厚而减小约10°（更直立），与疏水匹配几何关系一致膜结构保持有序 100K与7W微波下仍呈现清晰PISEMA螺旋轮模式 DNP信号增强 0.7 mg单标记样品在7 W微波下获得可测信号，无微波条件下2天仍无明显信号；相关膜样品在静态条件下可达约17倍增强为什么这篇论文重要？为DNP应用“正名”：低温测得的取向与生理条件一致，消除方法学疑虑揭示温度鲁棒性：PGLa在低于相变温度（≤297K）的区间内取向保持稳定，说明表面吸附由静电-疏水平衡主导技术突破：PyPol-C16“膜锚”策略显著提升DNP增强，影响后续探针设计验证疏水匹配：hΦ19W倾角由约22°减小到约10°，与膜厚增加导致“更直立”的预测一致 hΦ19W的PISEMA谱图展示温度对取向的影响该图展示hΦ19W在$\ce{POPC}$双层中的PISEMA光谱，温度诱导的取向变化清晰可见：295 K时快速运动平均化，螺旋轮坍缩到质心（绿点）；降至253 K与223 K时螺旋轮逐步清晰；100 K DNP条件下出现完整螺旋轮模式。谱形与10°与22°两种模拟倾角分布相对比，低温条件更接近更直立的倾角，与20 ppm位移指示的“倾角减小”一致。模拟结果 10°与22°倾角的螺旋轮模式用于界定实验谱图的倾角范围，低温数据更偏向更直立的一端。 PISEMA谱图的螺旋轮模式解析 PISEMA谱图中的每个峰对应一个残基，其坐标为$(\delta_{\ce{^{15}N}}, \delta_{\ce{^1H-^{15}N}})$，其中$\delta_{\ce{^1H-^{15}N}}$是偶极耦合常数。对于α-螺旋： [\delta_{\ce{^1H-^{15}N}} = D_{\text{max}} \left( 3\cos^2 \beta - 1 \right) / 2] 其中$D_{\text{max}} \approx 10.7$ kHz是最大偶极耦合常数，$\beta$是N-H键相对磁场的取向角。螺旋轮模式的形状直接反映倾斜角$\tau$：倾斜角螺旋轮形状物理机制 $\tau \approx 0°$ 圆形所有残基的N-H键相对磁场取向等价，各向同性分布导致共振峰位置一致 $\tau \approx 10-22°$ 椭圆形长轴/短轴比定量反映倾斜程度，椭圆离心率随tilt angle增大而增加 $\tau \approx 90°$ 坍缩为质心点螺旋绕长轴快速旋转导致偶极耦合平均化理论计算方法的验证隐式膜模型 PPM 2.0相比1.0显著改进了外围蛋白膜结合能的预测精度（$R^2$从0.47提升至0.78，RMSE从2.73降到1.13 kcal/mol），说明模型的能量参数化更加可靠。 PPM模型的转移自由能计算 [\Delta G_{\text{transfer}}(\theta, z) = \sum_{i} \Delta G_i(z_i)] 其中$\Delta G_i(z_i)$是第$i$个原子在膜深度$z_i$处的转移自由能，通过原子溶剂化参数（ASP）计算。给定倾斜角$\theta$与膜中心位置$z$，对所有原子求和即可得到整体转移自由能。科学共识：倾斜角的物理决定因素通过对多篇文献的系统分析，我们可以总结出控制膜相关螺旋取向的三大物理定律，这些规律在跨膜螺旋、抗菌肽与电位耦合体系中得到了一致的验证。定律1：疏水匹配定律任何膜相关螺旋的最优倾斜角$\theta_{\text{optimal}}$都由螺旋疏水长度与膜疏水厚度的几何匹配决定： [\theta_{\text{optimal}} = \arccos\left(\frac{d_{\text{membrane}}}{L_{\text{hydrophobic}}}\right)] 公式的通俗解释核心思想：螺旋的疏水长度$L$与膜的疏水厚度$d$必须匹配，否则会产生能量惩罚。形象比喻：想象把一根长筷子（螺旋）插入一个水杯（膜）中：筷子长度 = 杯口深度：筷子可以垂直插入（θ ≈ 0°）筷子长度 > 杯口深度：筷子必须倾斜（θ > 0°）才能避免底部暴露在空气中筷子长度 ≫ 杯口深度：筷子几乎要平放在杯口（θ ≈ 90°）物理机制：疏水残基必须被埋藏在膜的疏水核心内，否则暴露于水相或脂质头部会产生显著的能量惩罚（每个暴露的疏水残基约1-2 kcal/mol）。多文献验证疏水匹配定律得到了多个实验体系的定量验证：验证结论：跨不同体系的一致性验证证明了疏水匹配定律的普适性。体系倾斜角疏水匹配关系跨膜螺旋 $\theta \approx 0-30°$ 螺旋疏水长度$L$与膜厚度$d$近似相等抗菌肽 $\theta \approx 90°$ 螺旋疏水长度$L$远小于膜厚度$d$ hΦ19W 低温下倾角减小约10°（更直立）膜厚增加时通过减小tilt angle来维持疏水匹配 PGLa 相变前后从约53°转向约81° 体现膜厚与相态变化的调节效应这些跨不同体系的一致性验证证明了疏水匹配定律的普适性。物理本质疏水残基必须被埋藏在膜的疏水核心内，否则暴露于水相或脂质头部会产生显著的能量惩罚。定律2：能量分化定律自由能面$F(\theta, z)$的极小值位置和深度决定了螺旋的取向态。不同类型的螺旋呈现截然不同的自由能景观： [\Delta G_{\text{insert}} = \Delta G_{\text{solv}} + \Delta G_{\text{elec}} + \Delta G_{\text{conf}}] 两类体系的行为差异体系类型 $\Delta G_{\text{solv}}$主导项 $\Delta G_{\text{elec}}$主导项自由能面特征最优态跨膜螺旋 ⬇️ 膜中心最低（疏水驱动）小（带电残基少）双极小值，膜中心为全局最小 I-state (θ < 30°) 表面吸附肽 ↔️ 膜中心惩罚（疏水不足）膜表面最低（极性锚定）单极小值，膜表面 S-state (θ > 60°) 多文献验证 Ulmschneider研究：跨膜螺旋插入能为-4.7至-10.2 kcal/mol（有利插入），抗菌肽在膜表面态为能量最低，插入到膜核心需克服约4–6 kcal/mol能垒，定量解释了取向差异 PGLa：310 K（T-state，53°）→ <297 K（S-state，81°），膜相态改变重塑能量面，使表面态更有利新增研究：总疏水矩控制倾斜角（Soft Matter 2025）这项工作用粗粒化圆柱体模拟“保折叠的蛋白片段”，在圆柱表面设定可扭转的疏水条带，并系统扫描三类变量：疏水条带宽度、条带扭转角度、疏水相互作用范围。核心发现是：三种相互作用态：无相互作用、表面接触态、插入态（且插入态呈可变倾斜角）插入态的两种稳态取向：一种几乎平行于膜平面（与膜法向夹角约90°），另一种为倾斜态（轴线对膜法向有非零分量）倾斜角的定性预测：倾斜角随“总疏水矩”变化而调节，总疏水矩越大越偏向平行取向，减小或接近零时更容易进入倾斜态膜形变证据：在表面接触态出现与twister模型一致的膜形变模式，可用于估计施加的扭矩新增研究：进动熵与膜形变的能量平衡（JCTC 2012）该研究提出倾斜角由螺旋进动熵的增益与膜形变代价的平衡决定，核心结论包括：倾斜仍会发生：即使在“完美匹配”或轻微负错配条件下，跨膜螺旋仍会倾斜，原因是进动熵增益可补偿膜形变自由能惩罚最小倾角约10°：在负错配区域，倾斜角随错配减小而下降，但最小值仍约10° 方程化预测：推导了倾斜角与螺旋长度、膜厚度的“状态方程”，与粗粒化MC模拟和既有实验/计算吻合（理论与MC相关性$R^2=0.99$）定义清晰：倾斜角$\alpha$是螺旋轴相对膜法向的夹角，0°为垂直跨膜、90°为平行表面该图以示意图总结三类疏水错配：正错配时螺旋更长、倾斜以缩短有效疏水长度并伴随膜扩张；完美匹配时也可能倾斜，因为进动熵增益可抵消膜形变；负错配时膜局部变薄以容纳螺旋，错配过大则倾向表面态。该图给出MC模拟与理论模型的关键对比：(A) 倾斜角随错配变化，$\alpha=0°$表示螺旋轴垂直膜面，$\alpha=90°$表示平行；(B) 膜厚适配随错配变化；(C) 端部残基相对膜边界的位置变化；(D) 理论模型与MC结果高度一致（$R^2=0.99$），说明“进动熵–膜形变”平衡可定量预测倾斜角。该图展示进动熵的几何来源：直立构象对应较小球面扇区面积，倾斜后对应更大的“带状区域”，可达构象空间增大带来熵增益，从而驱动倾斜。该图给出“状态方程”的趋势：倾斜角$\alpha$随$L$增大而减小，随$P_{\mathrm{eff}}$增大而增大；膜刚性$\omega$影响较弱；在固定$\omega$下，$\alpha$与$P_{\mathrm{eff}}/L$近似线性相关。物理本质疏水残基驱动插入，极性/电荷残基抑制插入，两者竞争决定自由能面形状。定律3：静电调控定律跨膜电位（TMP）通过静电相互作用调控倾斜角，形成正反馈循环，具体定量关系可在PGLa体系中直接观察。核心发现：PGLa的倾斜角与跨膜电位呈显著正相关（r²=0.6），细菌膜的内负电位（-50至-100 mV）通过正反馈机制促进倾斜插入，首次从物理角度解释了抗菌选择性。正反馈机制的三个环节 τ增大导致螺旋更深插入：当带正电的螺旋倾斜角增大时，螺旋更深入地插入膜内，导致$\ce{Na+}$离子向膜内侧聚集，膜内外离子分布不对称性增强，进而使TMP更负（hyperpolarization） TMP更负促进螺旋倾斜插入：更负的TMP产生更强的静电驱动力，吸引带正电的螺旋进一步向膜内倾斜，导致τ增大，形成自增强的正反馈循环循环强化导致膜破坏：正反馈循环的持续强化最终导致膜破坏和孔道形成，这在细菌膜（TMP约-50至-100 mV）中尤为显著，解释了抗菌肽的选择性毒性多文献验证 PGLa-TMP耦合：MD模拟显示τ与TMP显著相关（$r^2=0.6$），细菌膜的内负电位（-50至-100 mV）通过静电吸引促进倾斜插入，这一正反馈机制解释了PGLa在细菌膜中的高活性（文献1）物理本质带电螺旋与膜-水界面离子的静电相互作用提供了额外的取向调控维度。预测规则：从序列到取向基于上述三大定律，我们可以提出膜相关螺旋的理性预测框架。序列决定取向的定量规则序列特征预测取向态倾斜角范围物理依据疏水残基 > 70%，带电 < 2个 I-state ⬇️（跨膜螺旋） 0–30° 疏水驱动，$\Delta G_{\text{insert}} < 0$ 疏水残基 < 40%，或带电 > 4个 S-state ↔️（表面吸附肽） 60–120° 疏水不足，$\Delta G_{\text{insert}} > 0$ 40% < 疏水 < 70%，或带电2-4个 T-state ↗️（倾斜态） 30–60° 疏水匹配不完美芳香残基集中在一端 📌 表面锚定 θ > 60° 芳香锚定效应环境调控取向的定性规则环境因素调控方向物理机制验证文献膜厚度增加 θ减小（更直立） $L \cos \theta = d$几何匹配 hΦ19W 跨膜电位增大 θ增大静电吸引带电螺旋插入 PGLa-TMP 温度降低取向发生可预测改变膜厚/相态变化驱动疏水匹配调整 PGLa、hΦ19W 凝胶相 θ→90°（表面肽）膜刚性增加，插入不利 PGLa 方法学共识：多维验证的必要性没有单一方法能给出完整的取向信息，三种方法必须互补使用：方法优势局限提供信息固态NMR 原子级精度，直接测定θ和ρ 时间平均，无法看动态转变静态结构参数 MD模拟动态过程，时间演化力场精度，采样受限转变路径、动力学理论模型快速预测，物理机制需要实验验证自由能面、预测交叉验证案例多项研究展示了方法学互补的价值。PPM 2.0对外围蛋白膜结合能的预测精度显著提升（$R^2=0.78$），说明模型参数化更可靠；DNP固态NMR在低温条件下依然保持稳定取向，为实验测量提供可靠基准。这些案例共同表明，只有通过实验、模拟和理论的多维交叉验证，才能获得可靠的取向信息与物理机制。应用价值：理性设计膜活性分子基于这些科学共识，我们可以提出膜蛋白/抗菌肽的理性设计原则：设计目标设计规则预测结果设计跨膜蛋白 ⬇️ 疏水残基比例>70%，形成连续的疏水段（$L \approx d_{\text{membrane}}$）；净电荷数<2个，避免穿越疏水核心的巨大能量惩罚（每个电荷约3-5 kcal/mol） I-state（θ < 30°），稳定跨膜插入，自由能面显示膜中心为全局最小值设计表面锚定肽 ↔️ 疏水残基比例<40%，或疏水段长度 $L \ll d_{\text{membrane}}$；引入芳香残基（Trp、Tyr）在疏水/水界面形成“锚”，利用芳香侧链偏好膜-水界面的性质 S-state（θ > 60°），稳定表面结合，自由能面在膜表面显示单一极小值设计环境响应型肽 ↗️ 引入多个正电荷（Lys、Arg），利用静电调控定律，使细菌膜负电位（-50至-100 mV）触发插入；设计$L$与目标膜厚度$d$匹配的疏水段，通过疏水匹配在不同膜环境中实现最优取向 T-state（30° < θ < 60°），环境诱导的取向转变，具有条件激活的特性设计膜破坏性抗菌肽 💥 初始态为S-state（表面结合，θ > 60°），避免在正常组织中过早插入导致毒性；细菌负膜电位（-50至-100 mV）→ TMP更负 → 静电驱动促进转向T/I态，实现选择性激活；多肽协同形成跨膜孔道（I-state寡聚体），通过“地毯式”或“桶板式”机制破坏膜完整性 PGLa、Melittin/MelP5的S→T→I转变展示了从表面吸附到倾斜插入再到跨膜成孔的完整路径总结分子主轴相对膜法向的取向角是判断膜插入状态的关键指标，本文围绕S/T/I三态模型系统性地总结了这一核心判据，并进一步提炼出三大物理定律和定量预测框架：核心结论 🎯 三大物理定律：通过多篇文献的交叉验证，我们发现了控制膜相关螺旋取向的普适规律疏水匹配定律：$\theta = \arccos(d/L)$，解释了跨膜螺旋、抗菌肽与hΦ19W等体系的倾角差异能量分化定律：自由能面形状（双极小值vs单极小值）决定了I/T/S态的稳定性静电调控定律：TMP与倾斜角存在正反馈耦合（$r^2=0.6$），实现了电生理调控 📊 S/T/I三态模型：S-state（60–120°）表面吸附，T-state（30–60°）倾斜插入，I-state（0–30°）跨膜插入实验验证：MD模拟、固态NMR、2H-NMR多方法交叉验证，确保结论可靠性方法学互补：理论预测（PPM 2.0的能量参数化提升）、模拟采样（MD）、实验测定（NMR）三者结合理性设计：基于三大定律，可从序列预测取向，为膜蛋白/抗菌肽设计提供指导本质论点取向角是非结合/表面态/插入态的核心定量判据，这一规律由三大物理定律（疏水匹配、能量分化、静电调控）控制，在跨膜螺旋与抗菌肽等体系中得到一致验证。通过多篇文献的交叉分析，我们从现象描述（S/T/I分类）上升到机制理解（三大定律），最终实现定量预测（序列→取向）。参考文献 PGLa倾斜角与跨膜电位耦合的MD模拟研究。J Chem Inf Model 2022, 62, 4963–4969. https://doi.org/10.1021/acs.jcim.2c00779 PGLa的固态NMR研究与DNP低温验证。Sci Rep 2016, 6, 20895. https://doi.org/10.1038/srep20895 隐式膜模型预测螺旋倾斜角：计算方法与NMR的系统性对比。Biophys J 2007, 92, 724–737. https://doi.org/10.1529/biophysj.106.089672 PPM 2.0各向异性溶剂模型与膜结合能评估。J Chem Inf Model 2011, 51, 930–946. https://doi.org/10.1021/ci200020k Protein–membrane interactions with a twist：总疏水矩解释插入态倾斜角。Soft Matter 2025, 21, 4336. https://doi.org/10.1039/d4sm01494d The Transmembrane Helix Tilt May Be Determined by the Balance between Precession Entropy and Lipid Perturbation. J. Chem. Theory Comput. 2012, 8, 2896–2904. https://doi.org/10.1021/ct300128x

Specific Sytems · 2026-03-19

椭球粒子更易被膜包裹？微凝胶形状与膜刚性调控细胞摄取机制

本文信息标题：脂质膜包裹各向异性微凝胶粒子：粒子形状与膜刚性的影响作者：Xiaoyan Liu, Thorsten Auth, Nabanita Hazra, Morten Frendø Ebbesen, Jonathan Brewer, Gerhard Gompper, Jérôme J. Crassous, Emma Sparr 发表时间：2023年7月25日单位：隆德大学（瑞典）、于利希研究中心（德国）、南丹麦大学等引用格式：Liu X, Auth T, Hazra N, et al. Wrapping anisotropic microgel particles in lipid membranes: Effects of particle shape and membrane rigidity. Proc Natl Acad Sci USA. 2023;120(30):e2217534120. https://doi.org/10.1073/pnas.2217534120 摘要细胞通过内吞作用摄取大分子组装体或纳米颗粒，这一过程既与健康和疾病相关的生物过程有关，也涉及药物纳米颗粒的递送以及污染物的潜在纳米毒性。根据系统物理化学性质的不同，吸附的颗粒可能停留在膜表面、被膜包裹或通过类似内吞的过程穿过膜。本文研究了软性核壳微凝胶粒子的形状、粒子-膜粘附能、膜的相行为和膜弯曲刚性如何调控胶体颗粒被脂质膜包裹的过程。共聚焦显微镜数据清楚地表明，通过调控粒子和膜的基本性质，可以定向控制包裹行为、膜变形以及颗粒在膜上的组织方式。与相似体积的球形微凝胶粒子相比，椭球形微凝胶粒子的深度包裹状态更有利。然而，基于固定粘附强度的理论计算预测了相反的行为——随着长径比增加，包裹变得更加困难，微凝胶的粘附强度必须随粒子拉伸而增加。考虑到微凝胶系统在不同形状、功能化和机械性能合成方面提供的多样性，这些发现进一步启发了未来涉及纳米颗粒-膜相互作用的研究，为新型生物材料和治疗应用的设计提供了指导。核心结论椭球形粒子更容易被深度包裹：实验发现椭球形微凝胶粒子（长径比$b/a = 2$或$6$）比球形粒子更容易被脂质膜深度包裹，这与传统理论预测相反膜刚性是关键调控因素：膜的弯曲刚性越低、有效脂质头基面积越大，深度包裹越容易发生；液无序相（DOPC）膜比液有序相（DMPC/胆固醇）膜更容易包裹颗粒粘附强度随形状变化：实验与理论计算的差异表明，微凝胶的粘附强度不是固定的，而是随粒子拉伸程度的增加而增加，这可能是由于微凝胶变形导致的更多疏水残基暴露形状调控包裹取向：浅包裹的椭球形粒子长轴平行于膜表面，处于“潜艇”态；深度包裹的粒子长轴垂直于膜表面，处于“火箭”态，两种状态之间存在能量势垒相分离膜的偏好性吸附：在相分离膜中，球形和椭球形微凝胶都强烈偏好吸附到较软的液无序相，而不是较硬的液有序相背景细胞通过内吞作用摄取纳米颗粒的过程是生物医学和纳米技术领域的核心问题。无论是病毒感染、药物递送，还是环境污染物的毒性评估，都涉及纳米颗粒与细胞膜的相互作用。尽管过去二十年来理论预测和计算机模拟已经广泛研究了膜-颗粒相互作用，但实验研究主要局限于球形颗粒，而关于非球形软颗粒的包裹行为的实验研究仍然缺乏。自然界中存在大量非球形组装体，如病毒衣壳、盘状高密度脂蛋白共组装物和各种形状的抗原颗粒。这些非球形颗粒如何被细胞膜识别和摄取，是理解细胞摄取机制的关键。然而，由于生物系统的分子复杂性，体内研究难以解耦各种分子机制。因此，通过模型系统系统地研究物理化学参数对包裹过程的影响，成为理解这一复杂问题的必由之路。核心科学矛盾：传统理论预测椭球形粒子由于曲率大、弯曲能代价高，应该更难被膜包裹。然而，本文实验观察到相反现象——椭球形粒子反而更容易被深度包裹。这一理论与实验的矛盾揭示了粘附强度随粒子形状变化这一被传统包裹理论忽视的关键因素，成为本文研究的切入点。关键科学问题软性核壳微凝胶粒子的包裹行为受哪些物理参数调控？形状效应：椭球形粒子是否比球形粒子更容易被膜包裹？理论预测和实验观察为何存在矛盾？膜刚性作用：膜的弯曲刚性和脂质链堆积状态如何影响颗粒的包裹深度？粘附强度变化：微凝胶的粘附强度是否随粒子形状变化而变化？这种变化如何影响包裹行为？相分离膜的选择性：在相分离膜中颗粒如何选择性地吸附到不同的脂质相？这反映了什么物理机制？创新点本文在实验设计上运用严格的控制变量策略：三种微凝胶体积相同，仅长径比不同；三种脂质膜头基化学性质相同，仅弯曲刚性和链堆积状态不同。正因为变量拆得足够干净，形状效应与膜刚性效应才能被相对独立地识别出来。研究还采用了多尺度验证体系，把单粒子尺度的包裹状态与取向转变、群体尺度的膜上组装结构，以及环境尺度的均相膜与相分离膜放在同一篇文章里统一比较。科学贡献方面，本文首次系统研究了非球形软颗粒的膜包裹行为，并通过实验与理论对照把问题收敛到一个核心机制上：粘附强度并不是固定常数，而会随粒子形状变化。文章还把粒子形状、膜刚性、膜张力和粘附能这四个关键参数放进同一个框架里讨论，并在液无序-液有序相分离膜中观察到明显的偏好性吸附，从而进一步指出脂质链堆积状态会直接影响膜-颗粒相互作用。研究内容实验系统设计本研究采用了一个精心设计的模型系统，包括两个核心组成部分：各向异性核壳微凝胶粒子和不同组成的脂质膜微凝胶粒子设计：研究使用了三种软性核壳微凝胶粒子，均由聚苯乙烯核和交联PNIPMAM（聚N-异丙基甲基丙烯酰胺）壳组成：粒子类型形状长径比 $b/a$ 20°C下几何尺寸 20°C下流体表征制备方法表面电荷 MG1 球形 1 核心半径 $215 \pm 13~\mathrm{nm}$；水合尺寸约 $830 \times 830~\mathrm{nm}$ 流体动力学半径 $462~\mathrm{nm}$；$D_T = 4.62 \times 10^{-13}~\mathrm{m^2\,s^{-1}}$ 初始粒子轻微正电 MG2 椭球形 2 长轴约1236 nm；短轴约620 nm $D_T = 4.17 \times 10^{-13}~\mathrm{m^2\,s^{-1}}$ 单轴拉伸 $50\%$ 轻微正电 MG3 椭球形 6 长轴约2750 nm；短轴约446 nm $D_T = 3.21 \times 10^{-13}~\mathrm{m^2\,s^{-1}}$ 单轴拉伸 $400\%$ 轻微正电椭球形粒子通过对同一类球形核壳母粒进行单轴拉伸后处理获得，因此实验上尽量把形状作为主变量，而不是重新合成另一批化学组成不同的颗粒。不过，这里不宜把它表述成“严格等体积”：从SI Table S1给出的20°C水合尺寸粗略估算，MG2和MG3与MG1属于相近体积量级，但并非完全一致。这里还要特别注意，主文中明确给出的核心半径 $215 \pm 13~\mathrm{nm}$ 和20°C下的流体动力学半径 $462~\mathrm{nm}$，只对应母体球形核壳微凝胶MG1。而 SI Table S1 中 MG1 的 $830 \times 830$ nm，则是基于共聚焦图像统计得到的水合几何尺寸。这两个量不是一回事：前者对应颗粒在溶液中的流体动力学表征，后者对应显微图像中的几何外形尺寸，因此不能直接拿来一一对照。对于MG2和MG3，作者在SI Table S1里主要报告的是20°C下的长轴、短轴、长径比和扩散系数，而不是再压缩成一个单一的水动力学半径，因此正文表格也按原始表征方式保留这些数据。三种微凝胶都表现为轻微正电，这一点来自电泳迁移率测量；同时粒子还通过荧光探针Alexa488标记以便观察。图1：球形和椭球形微凝胶粒子的形貌特征。（A）三种微凝胶粒子，即MG1球形、MG2椭球形（$b/a=2$）和MG3椭球形（$b/a=6$），在载玻片上的2D共聚焦激光扫描显微镜（CLSM）图像，温度28°C，标尺为1 μm。（B）DOPC和DMPC脂质的分子结构及熔点（$T_m$），以及胆固醇的分子结构。脂质膜设计：使用三种不同组成的磷脂酰胆碱（PC）脂质制备巨单层囊泡（GUVs）：脂质组成相态弯曲刚性有效头基面积熔点$T_m$ DOPC 液无序（$L_d$）低大 -20°C DMPC 液无序（$L_d$）中中 23°C DMPC/胆固醇液有序（$L_o$）高小 - 实验温度为28°C，确保DOPC和DMPC处于液态，而DMPC/胆固醇混合物处于液有序相。胆固醇的加入会进一步减小双层膜平面内每个脂质分子的有效面积；不过从文中引用的膜结构数据看，每个PC头基的有效面积仍与液无序PC双层膜接近。这种设计的巧妙之处在于：保持脂质头基化学性质不变，仅通过改变酰基链组成来调节膜的物理性质，包括弯曲刚性和有效头基面积。微凝胶与膜的相互作用机制微凝胶粒子与脂质膜的相互作用，原文更倾向于解释为：以疏水黏附为主，静电因素为辅。静电作用不是主要差异来源：微凝胶虽然带轻微正电，但三种模型膜都由两性离子PC脂质组成，在中性条件下整体不带净电。如果主导作用真是静电吸引，那么不同膜相乃至相分离膜的不同区域上，吸附强度应当更接近；而实验并没有看到这种结果。更合理的主因是疏水链暴露差异：液无序膜的酰基链堆积更松散，膜界面更容易暴露疏水烃链。作者据此提出，微凝胶表面伸出的聚合物链段会部分插入这些暴露的疏水区域，从而提高粒子-膜黏附能；DOPC膜之所以更容易发生深度包裹，也主要沿着这条机制来理解。实验结果：形状与膜刚性调控包裹行为微凝胶在脂质膜上的吸附和包裹通过共聚焦荧光显微镜观察，研究发现了三种不同的吸附-包裹状态：状态膜变形粒子位置典型特征表面吸附无明显变形膜表面粒子仅吸附在膜表面，未嵌入膜中浅包裹轻微变形部分嵌入膜围绕粒子轻微变形，粒子部分嵌入膜中深度包裹显著变形几乎完全被包粒子几乎完全被膜包裹；对于椭球粒子，长轴通常垂直于膜表面图2：球形和椭球形微凝胶粒子在不同脂质膜上的包裹行为。微凝胶粒子（绿色，标记为Alexa488）在GUVs脂质膜（红色，标记为Rhod-PE）上的吸附和包裹的2D CLSM图像。微凝胶粒子：球形MG1（A-C）或具有不同长径比（$b/a$）的椭球形MG2（D-F）和MG3（G-I）脂质组成：DMPC/胆固醇（A、D、G）、DMPC（B、E、H）和DOPC（C、F、I）膜性质差异：DMPC/胆固醇的弯曲刚性最高，DOPC的有效头基面积最大实验的核心发现可以概括为以下三个关键规律：规律1：形状依赖性从图2出发，如果只对比两种液无序膜（DOPC与DMPC），形状效应可以简化为一句话：球形MG1在两种膜上都停留在表面吸附或浅包裹状态；而椭球形粒子更容易进入深度包裹，其中MG2只在更软的DOPC上达到深度包裹，MG3则在DOPC与DMPC上都能达到深度包裹，并伴随长轴由平行转向垂直膜面的取向重排。图S8：深度包裹的直接图像证据。A为MG2被DOPC膜深度包裹，B为MG3被DOPC膜深度包裹，C为MG3被DMPC膜深度包裹。从左到右分别是粒子绿色通道、膜红色通道和合并图。原文特别指出，深度包裹最直接的证据就是红色膜通道中出现显著膜形变；这也是区分图2里“浅包裹”和“深度包裹”的核心判据。规律2：膜刚性依赖性深度包裹发生在弯曲刚性最低、有效脂质头基面积最大、同时表观界面疏水性最高的脂质膜上，以及长径比较大的微凝胶粒子。具体趋势如下：膜组成弯曲刚性有效头基面积 MG1球形 MG2椭球（$b/a=2$） MG3椭球（$b/a=6$） DMPC/胆固醇高小无包裹浅包裹（平行）浅包裹（平行） DMPC 中中浅包裹浅包裹（平行）深度包裹（垂直） DOPC 低大浅包裹深度包裹（垂直）深度包裹（垂直）规律3：取向依赖性时间分辨成像显示，无论椭球形粒子以什么角度接近膜，它们总是以长轴平行于膜的方式着陆（Movies S1-S3），然后在某些组成下进一步被膜包裹。这表明粒子在吸附过程中会重新取向以最大化界面接触面积，反映了微凝胶与脂质膜之间存在强吸引力。 SI 的 Fig. S6 把这个过程展示得更直接：作者跟踪了MG2在DOPC囊泡上的吸附前后图像，三组例子虽然初始入射角度不同，但一旦真正接触膜面，都会先转成长轴平行膜面的构型。换句话说，深度包裹并不是“直接垂直撞上去就被吞进去”，而是先经历一个平躺吸附的中间阶段，然后才可能进一步重排成深包裹终态。图S6：MG2在DOPC囊泡上的吸附前后序列图。A到C给出三个不同初始取向的例子，每一行左侧是吸附前，右侧是吸附后。尽管入射角度不同，吸附后都转成长轴平行于膜面的姿态。这个补充图说明，“先平躺、后重排”是实验上直接可见的动力学路径，而不是仅来自理论想象。微凝胶在膜上的组织结构图3：吸附在GUVs上的球形MG1微凝胶（A-C）、椭球形MG2微凝胶（D、E）和MG3微凝胶（F）的3D CLSM图像，温度28°C，标尺：5 μm。上图：3D图像由共聚焦z-stack图像重建，合并了来自微凝胶（绿色）和标记了Liss Rhod PE的膜（红色）的通道。脂质组成为DMPC/胆固醇（A、D、F）、DMPC（B、E）和DOPC（C）下图：对应的放大图像显示微凝胶在脂质膜上的组装结构除了包裹状态，研究还发现微凝胶粒子在膜上形成了高度有序的组装结构：球形MG1的六方晶体排列：球形微凝胶在所有膜系统上都形成了具有六方结构的2D胶体晶体。这种紧密堆积的方式类似于之前观察到的PNIPAM微凝胶在流体DMPC和DOPC膜上的行为。椭球形MG2的取向有序膜类型膜刚性分布特征取向关联类比 DMPC（液无序）中局部边对边排列有明显取向关联近晶状有序（smectic-like） DMPC/胆固醇（液有序）高均匀分布六方位置有序无明显取向关联塑性晶体构型（plastic crystal）椭球形MG3的无序分布：长径比最高的椭球形MG3微凝胶在膜表面呈随机分布和取向。至少没有全都竖起来，或者说很多是躺着的…… 这些有序结构的形成表明，微凝胶-膜相互作用不仅影响单个粒子的包裹状态，还调控多个粒子在膜上的集体组装行为。相分离膜的偏好性吸附为了进一步研究膜刚性对微凝胶吸附的影响，研究者使用了由DOPC富集的液无序相和DMPC/胆固醇富集的液有序相组成的相分离GUVs。图4：球形和椭球形微凝胶在相分离膜上的选择性吸附。实验对象：吸附在由DOPC、DMPC和胆固醇（摩尔比7:7:3）组成的GUVs上的球形MG1微凝胶（A）和椭球形MG2微凝胶（$b/a=2$）（B）的2D CLSM图像相分离特征：形成共存的液有序（液有序相富含DMPC/胆固醇，黑色）和液无序膜相（液无序相富含DOPC，红色荧光更强）实验条件：温度16°C，标尺5 μm 关键发现：球形MG1和椭球形MG2微凝胶都强烈偏好吸附到较软的DOPC富集的液无序相。这与单相DOPC囊泡的观察结果一致：球形粒子只是被膜浅包裹，位于囊泡表面；而椭球形粒子被膜深度包裹。重要的是，在微凝胶不过量的条件下，没有观察到微凝胶在液有序DMPC/胆固醇富集域上的吸附。这种选择性吸附表明，脂质链的堆积状态显著影响颗粒的吸附。 SI 的 Fig. S11 还补充了一个有用背景：DOPC/DMPC/chol（7:7:3）这个体系在28°C时还是均一液相，而降到17°C、16.5°C和16°C后会逐渐出现液无序相与液有序相共存。因此，图4里看到的选择性吸附不是随手挑了一个“看起来有相分离”的囊泡，而是建立在这个三组分膜温度诱导相分离已经先被单独验证过的基础上。图S11：DOPC、DMPC和胆固醇三组分GUV在不同温度下的3D CLSM图像。A为28°C，此时仍是均一液相；B到D分别为17°C、16.5°C和16°C，此时可见液无序相与液有序相共存。图中较暗区域对应更有序的DMPC/胆固醇富集相，较亮区域对应DOPC富集的较无序相。它为图4里的选择性吸附提供了相分离本身已经成立的直接证据。理论计算：包裹能预测为了从能量角度理解包裹过程，研究进行了详细的数值分析，计算了包裹过程中膜曲率变化和微凝胶-膜接触面积变化产生的能量。 [E = \int \left( 2\kappa H^2 + \sigma \right) \mathrm{d}A - \int_{A_{\mathrm{ad}}} w \, \mathrm{d}S] 该公式包含以下物理量：$\kappa$为膜的弯曲刚性，$\sigma$为侧向张力，$w$为微凝胶与双层膜之间的粘附强度。$H = (c_1 + c_2)/2$表示平均曲率（mean curvature），其中$c_1$和$c_2$是主曲率，$A_{\mathrm{ad}}$为粘附在粒子上的膜面积。这套理论的出发点其实很朴素：先假设微凝胶只是一个给定形状、给定体积、给定黏附强度的“等效颗粒”，再问膜在什么条件下愿意把它包进去。也正因为模型足够简洁，它很适合回答“几何和膜弹性本身会把系统推向哪里”这个问题，但不擅长处理真实微凝胶表面的化学异质性、壳层可压缩性以及局部链段重排。公式的通俗解释这个能量函数可以理解成一个很直观的“收益减成本”的账本：膜想要包住粒子会付出代价，但一旦贴上去又能拿到粘附收益。最终是不是会进入深度包裹，取决于三项量的此消彼长。后面图5的“潜艇态”与“火箭态”、以及二者之间的能垒，本质上就是这三项能量在不同取向与包裹程度下竞争的结果。弯曲能项：$\int 2\kappa H^2\,\mathrm{d}A$是把膜“掰弯”所付出的能量。$\kappa$越大，膜越硬，同样的曲率变形就越贵，因此深度包裹更难发生。对椭球粒子来说，尖端曲率更大，这一项会更容易把系统“推回”到浅包裹的构型。张力项：$\int \sigma\,\mathrm{d}A$描述把更多膜面积“拉”进包裹区域时的代价。张力越大，膜越像一张绷紧的橡皮膜，想多包一点就得付出更高代价，所以包裹转变所需的粘附强度会随张力增大而升高。粘附能项：$-\int_{A_{\mathrm{ad}}} w\,\mathrm{d}S$是粒子和膜贴合带来的能量收益。$w$可以理解成单位接触面积能“赚”到的能量，$A_{\mathrm{ad}}$越大，收益越多，系统就越倾向于从表面吸附走向深度包裹。换一种更直白的说法，图5里真正竞争的不是“平躺好还是竖起来好”这么简单，而是下面这两种倾向谁更强：先多贴一点，先赚到黏附能；尽量别去碰最难包的尖端，先少付一点弯曲代价。正因为这两种倾向同时存在，椭球粒子才会自然出现“潜艇”和“火箭”两种稳定构型，而不是只有一种单调的包裹路径。此外，原文还有一个很容易被忽略、但对理解实验条件很重要的提醒：在共聚焦图像里看不到明显的热涨落，并不等价于囊泡处在高张力状态。作者指出，即使囊泡近似“无张力”，其形状涨落幅度也可能小到低于显微镜的可分辨尺度。理论上，准球形无张力囊泡的球谐模涨落满足 [\langle u_{l,m} ^2 \rangle = \dfrac{k_\mathrm{B}T}{\kappa\,l(l-1)(l+1)(l+2)}] 其中$u_{l,m}$是第$l,m$阶球谐形变模式的幅度（以囊泡半径为单位）。作者给了一个数量级估算：当$\kappa/k_\mathrm{B}T = 50$、囊泡半径$R = 5~\mu\mathrm{m}$时，主导的椭球形形变模（$l = 2$）对应的典型幅度约为150 nm，在实验成像中可能并不显著。这意味着，不能仅凭“膜看起来很平滑”就武断地认为张力很大，张力效应更可靠的判断仍应来自独立测量或系统性的物理参数对照。图5：椭球形粒子的包裹能景观和状态转变。长径比$b/a = 2$、体积$V_0 = 0.31~\mu\mathrm{m}^3$的椭球形粒子在无张力、初始平面的脂双层膜上的包裹能，弯曲刚度为$\kappa = 20 k_{\mathrm{B}}T$。读图提示：图5A的两个坐标其实对应两个最直观的“自由度”。$A_{\mathrm{ad}}$表示有多少膜面积贴在粒子表面，可以粗略理解为包裹深度；$\theta$表示长轴相对膜法线的倾角，$90^\circ$对应长轴平行膜面（潜艇态），$0^\circ$对应长轴垂直膜面（火箭态）。（A）包裹能景观：不同粘附强度$w = 210.1$、$233.4$、$256.7~k_{\mathrm{B}}T/\mu\mathrm{m}^2$下的包裹能景观，横纵坐标分别为粘附膜面积$A_{\mathrm{ad}}$和长轴相对于膜法线的取向角$\theta$；图中可见“潜艇”态的能量极小值对应浅包裹、$\theta = 90^\circ$，“火箭”态对应深度包裹、$\theta = 0^\circ$ （B）转变路径快照：在$w = 233.4~k_{\mathrm{B}}T/\mu\mathrm{m}^2$时，“潜艇”态与“火箭”态之间转变路径上的模拟快照，展示粒子重新取向和膜逐步包裹的过程（C）能量分解：沿转变路径$A_{\mathrm{ad}} = 0.8(1.5 - \tanh(0.03(\theta-60^\circ)))~\mu\mathrm{m}^2$的能量分解：总能量为蓝色，粘附膜能量为橙色，自由膜能量为绿色，二者之间的峰值对应两种状态之间的能量势垒（D）包裹相图：固定体积$V_0 = 4/3\pi R^3_{\mathrm{sph}}$时的包裹相图，给出粘附强度$w$与侧向张力$\sigma$的关系；红线表示长径比$b/a = 2$的椭球粒子，黑线表示球形粒子，I、II、III三区分别对应未包裹、浅包裹、深度或完全包裹理论预测的关键发现发现描述物理意义两种稳定状态 “潜艇”态（$\theta = 90^\circ$）和“火箭”态（$\theta = 0^\circ$）浅包裹时避免高曲率尖端，深度包裹时一个尖端被包入能量势垒两种状态间存在能量势垒对应于包裹高曲率尖端所需的弯曲能代价张力依赖性转变粘附强度随张力线性增加需要从膜外拉入额外面积以完成包裹形状依赖性 $b/a = 2$时与球形粒子转变粘附强度相近，$b/a > 2$时更难包裹高长径比粒子曲率更大，弯曲能代价更高这些结果里，真正解释得最扎实的其实不是实验趋势本身，而是深包裹的几何障碍来自哪里。理论非常清楚地指出：问题主要出在尖端包裹。只要系统还没开始包那个高曲率尖端，平躺的浅包裹就更划算；一旦要跨进深包裹，就必须付出一笔额外的弯曲能，这就是图5C里那道能垒的来源。图6：椭球形粒子包裹转变的标度粘附强度与长径比的关系。标度粘附强度$wR_{\mathrm{sph}}^2/\kappa$与椭球形粒子长径比（$1 \le b/a \le 6$）的关系图，适用于无张力、初始平面的脂双层膜。读图提示：这里用$wR_{\mathrm{sph}}^2/\kappa$做无量纲化，相当于把粘附驱动力与弯曲代价放到同一标度下比较（$R_{\mathrm{sph}}$是等体积球的参考长度尺度）。因此，这张图最想表达的不是某一个具体数值，而是理论预测的总体趋势：粒子越细长，想要达到完全包裹所需的相对粘附强度会越高。两种情况的展示结果：固定粒子表面积$S_0$时为红色，固定粒子体积$V_0$时为黑色关键发现：对于长径比$b/a > 2$的椭球形粒子，完全包裹所需的标度粘附强度随长径比线性增加，这与实验观察到的趋势相反理论与实验的矛盾：粘附强度随形状变化理论计算预测：椭球形粒子比球形粒子更难包裹，特别是对于高长径比的粒子。实验观察则是：椭球形粒子比球形粒子更容易被深度包裹。如何解释这一明显矛盾？研究者给出的核心解释是：微凝胶的粘附强度不是固定常数，而会随着粒子被拉伸而增加。具体支持证据如下表所示：证据类型具体机制实验基础作用表面性质变化拉伸后粒子表面性质微小变化，提高膜黏附性实验与理论对照、SI表征结果增强椭球形粒子黏附疏水链插入微凝胶表面聚合物链段部分插入膜界面暴露的疏水烃链区域液无序膜链堆积松散增强与液无序膜的黏附粒子柔软度壳层可压缩，拉伸可能导致致密化、溶胀性下降和柔软度变化理论模型未考虑改变有效黏附能局部膜缺陷被埋入尖端形成孔洞或blister，降低包裹代价理论预测（SI）辅助降低高长径比粒子包裹能理论局限：固定粘附强度、忽略粒子柔软度的模型能抓住取向转换和能垒结构，却不足以解释“越细长反而越容易深包裹”的实验结果。更尖锐一点的评价如果说得直接一点，这里的理论部分更像是在界定“缺了什么物理”，而不是已经完整解释了实验。它成功解释了什么：为什么椭球粒子会先平躺吸附，为什么浅包裹与深包裹之间会有能垒，为什么膜张力会抬高深包裹门槛。它没解释什么：为什么实验里长径比更大的粒子反而更容易深包裹。这个最核心的实验现象，并不是从模型内部自然推出的。它最后真正给出的结论，其实是反推：既然固定$w$的模型失败了，那真实系统里的有效黏附强度$w$就不能当常数看待，或者尖端附近还存在模型没纳入的局部膜重构。 SI 里关于 hole 和 blister 的分析，其实进一步暴露了这个边界：主模型默认膜必须连续地去贴合尖端，但真实膜也许会通过开孔、局部鼓包或局部脱附来绕开最贵的那部分弯曲代价。这让理论讨论更有启发性，但也说明它离“真正解释实验”还有一段距离。 Q&A Q1：为什么理论预测椭球形粒子更难包裹而实验观察到更容易包裹？ A1：关键在于理论把粘附强度$w$当作固定常数，但原文讨论部分认为，拉伸会轻微改变微凝胶表面性质，从而提高膜黏附性。再叠加液无序膜更容易暴露疏水链、微凝胶表面链段可部分插入膜界面的因素，实验中椭球粒子就会比理想刚性模型表现出更强的包裹倾向。此外，真实微凝胶的柔软度变化和尖端局部形成孔洞或blister，也可能继续降低高长径比粒子的包裹代价。 Q2：膜刚性如何影响微凝胶的包裹行为？ A2：这里其实有两层作用。第一层是弯曲能代价：更硬的膜更难围着粒子弯折，因此深度包裹更吃亏。第二层是界面结构差异：液无序膜的酰基链堆积更松散、更容易暴露疏水区域，因而更有利于微凝胶表面链段黏附到膜上。也正因为这两层因素叠加，在相分离膜里颗粒会明显偏向较软的液无序相，而不是液有序相。 Q3：椭球形微凝胶的“潜艇”态和“火箭”态有什么物理意义？ A3：这两个名字对应的是同一个粒子在能量景观中的两个局部稳定构型。在“潜艇”态里，长轴平行膜面，系统优先回避高曲率尖端被包住时带来的弯曲能罚分；在“火箭”态里，长轴转为垂直，膜包裹更深，黏附收益更大，但也要承担更高的局部弯曲代价。两者之间那道能垒，本质上就是“要不要把尖端也包进去”的代价。关键结论与批判性总结本研究通过精心设计的实验系统和理论计算，揭示了形状、膜刚性和粘附能如何协同调控软性纳米颗粒的膜包裹行为。主要贡献把形状、膜刚性和界面结构放到同一个实验框架中比较：论文用体积相近但形状不同的软微凝胶，配合三类膜和相分离膜，比较系统地展示了包裹深度、粒子取向和膜上组装结构如何联动变化。明确指出实验与传统刚性粒子理论之间的缺口：理论能够解释“潜艇”态与“火箭”态、张力效应和高长径比的弯曲代价，却不能直接解释实验中椭球粒子更易深包裹这一结果。这个反差本身就是本文最重要的机制信息。把差异进一步收敛到黏附能并非固定这一点：原文讨论部分认为，粒子被拉伸后表面性质会发生微小变化，从而提高膜黏附性；再加上液无序膜更容易暴露疏水链区，最终使实验结果偏向深度包裹。研究的局限性缺乏对粘附强度的直接测量：文章提出的“粘附强度随形状变化”是基于理论-实验矛盾的推论，缺少AFM力谱等直接测量手段来定量验证$w(b/a)$的关系，如果能补充这部分数据，结论将更加直接。分子机制不够明确：粘附强度变化的三种可能机制（表面性质变化、疏水链插入、柔软度变化）都是定性推测，没有实验区分哪种机制占主导。未来工作可以通过荧光标记疏水区域、测量接触面积等方式深入。理论模型的修正空间：现有理论假设固定粘附强度，主要用于凸显问题。可以在模型中直接引入形状依赖的粘附强度参数$w(b/a)$，进行定量预测，这样能够建立更完整的理论框架。形状效应的饱和：实验发现MG2（$b/a=2$）和MG3（$b/a=6$）的包裹行为差异不大，说明在$b/a>2$后，形状效应可能饱和，这一点在讨论中可以更明确地指出。局限性类型具体描述研究需求理论模型简化模拟未纳入粒子柔软度、壳层可压缩性及拉伸致密化效应需要开发考虑微凝胶结构和体弹性的详细模型局部降能机制孔洞或blister等局部膜缺陷机制未定量化需要更深入的理论和模拟研究这些辅助机制模型系统简化使用成分可控的PC模型膜，缺少蛋白、糖脂等复杂成分需要在更接近真实细胞膜的系统中验证对相关领域研究者的启发药物递送系统设计：不要只关注球形颗粒，各向异性颗粒可能带来意外优势，但必须同时考虑形状 + 膜刚性 + 粘附强度可变性的三元调控，椭球形颗粒不一定总是更好，取决于具体应用场景。颗粒-膜相互作用模拟：软颗粒的粘附强度不应设为固定常数，需要考虑粒子形变导致的接触面积变化，可以尝试在模型中引入$w = w_0 \cdot f(\text{shape}, \text{deformation})$。实验方法开发：AFM力谱、光镊等单分子技术可以直接测量颗粒-膜粘附力，原位成像技术（如冷冻电镜）可以观察接触界面的分子结构，这些技术补充将让这类研究更加完整。应用启发对递送颗粒设计的直接启发：如果目标是提高膜包裹与摄取概率，单纯改变几何形状还不够，还必须同时考虑膜刚性、局部链堆积状态以及粒子表面在变形后的黏附性变化。对后续模型构建的启发：这篇文章提示，研究软颗粒摄取时，最好把粒子柔软度、壳层重排和界面黏附的可变性一起纳入，而不是继续沿用固定黏附强度的刚性粒子近似。结语：这篇文章最有价值的地方不只是发现椭球粒子更容易被深度包裹，而是进一步猜想：一旦颗粒是软的、可变形的，黏附能本身也会成为随形状变化的变量。这正是实验结果能偏离传统包裹理论预测的关键。所以能不能补充实验来证明那个“形状依赖的粘附能”是确有其事？分子模拟能够做吗？胆固醇这么硬的反倒导致粒子喜欢“平躺”，即使是个“长条”，似乎disprove了我们的观点，但是又说如果真能垂直又确实有利于被包裹，又算是个可能的印证。。。

Specific Sytems · 2026-03-19

膜通透化的分子动力学模拟（上篇）：方法学与机制综述

【综述】膜通透化的分子动力学模拟（上篇）：方法学与机制系列说明：本文是膜通透化MD模拟综述的上篇，涵盖方法学、机制分类和未来展望。下篇为案例研究文档，深入分析具体antimicrobial peptides (AMPs) 和pore-forming toxins (PFTs) 的分子机制。本文信息标题：膜通透化的分子动力学模拟：抗菌肽与成孔蛋白的研究现状作者：Sofia Cresca, Jure Borovšek, Alessandra Magistrato, Igor Križaj 发表时间：2026年2月单位：Consiglio Nazionale delle Ricerche (CNR)-IOM, 意大利；其他单位信息见原文引用格式：Cresca, S., Borovšek, J., Magistrato, A., & Križaj, I. (2026). Current Status of Molecular Dynamics Simulations of Membrane Permeabilization by Antimicrobial Peptides and Pore-Forming Proteins: A Review. Journal of Chemical Information and Modeling, 66(6), 1982-2005. https://doi.org/10.1021/acs.jcim.5c02731 摘要分子动力学模拟已成为研究antimicrobial peptides (AMPs, 抗菌肽) 和pore-forming toxins (PFTs, 成孔蛋白) 诱导膜通透化机制的重要工具。本综述系统总结了AMPs和PFTs的主要作用机制，包括成孔机制（桶板模型和环形孔模型）和非成孔机制（地毯模型和聚集模型），以及全原子和粗粒化模拟在这些研究中的优势与局限。我们详细讨论了增强采样技术在克服时间尺度限制中的应用，并通过代表性案例研究展示了MD模拟如何揭示孔道形成的分子机制。最后，我们探讨了当前面临的主要挑战，如力场精度、生物膜的复杂性以及稀有事件采样，并展望了人工智能和机器学习在膜通透化研究中的应用前景。核心结论 MD模拟已成为研究膜通透化的不可或缺工具，能够提供原子级分辨率的过程信息，填补实验方法的空白全原子和粗粒化模拟各有优势，多尺度工作流程结合两者优势，能够在大系统和长时间尺度下研究膜通透化过程增强采样技术（如伞形采样、元动力学、副本交换）能够克服时间尺度限制，计算孔道形成的自由能景观 AMPs主要通过两种机制诱导膜通透化：桶板模型和环形孔模型，某些AMPs还可能采用地毯模型或聚集模型。值得注意的是，这些通透化机制并非AMPs独有，其他膜活性肽类（如病毒融合肽、细胞穿膜肽）也采用相似的原理 PFTs分为α-PFTs和β-PFTs，两者在寡聚化时机、构象变化程度和孔道结构上存在显著差异未来挑战包括力场精度提升、生物膜复杂性建模以及AI/ML技术的应用图形摘要：膜通透化研究的核心问题与计算路线。该图强调抗菌肽与成孔蛋白作为生物问题入口，分子动力学模拟与增强采样是机制解析的核心路径，并连接理性设计、结构预测与潜在应用。引言：为什么研究膜通透化？生物膜是所有活细胞的基本组成部分，它们作为动态屏障定义细胞边界、区隔化细胞器并调节物质运输。生物膜的选择性透过性是维持细胞稳态的关键，它建立了电化学梯度，为能量生产和基本的细胞过程（如营养摄取和废物排出）提供必要的驱动力。然而，这种选择性透过性可能被多种肽和蛋白质破坏，主要包括抗菌肽和成孔蛋白/毒素。这些分子通过多种机制诱导膜通透化，从形成明确的孔道到更微妙的双层结构破坏。理解膜完整性破坏的分子机制对于开发新型医疗、生物技术和农业应用工具至关重要。生物膜的基本结构与功能生物膜主要由磷脂双层构成，磷脂分子具有两亲性特征：亲水头部朝向水相，疏水尾部相互聚集形成双层核心。这种自组装结构创造了厚度约5-10 nm的疏水屏障，能够有效阻挡极性分子和离子的自由通过。生物膜展现出复杂的动态性质，包括流动性、不对称性、微区域化（如脂筏）以及适应曲率变化的能力。膜通透化的生物学意义膜通透化在许多生物学过程中扮演重要角色，包括免疫防御（宿主细胞释放AMPs和MACPF家族蛋白）、细胞程序性死亡（Gasdermin蛋白介导的细胞焦亡）、细胞间通讯以及病原体攻击（细菌分泌PFTs）。然而，膜通透化过程失控时会导致严重的病理后果，如组织损伤、神经退行性疾病和心血管疾病。这个领域为什么重要？抗生素耐药性危机：世界卫生组织预测到2050年耐药感染可能成为全球头号死因，每年导致1000万人死亡。AMPs作为广谱抗菌剂，通过物理破坏膜结构来杀菌，不易诱导耐药性，是下一代抗生素的候选者毒素致病机制：细菌PFTs是许多病原体的关键毒力因子。理解其机制有助于开发抗毒素和新型疗法，如针对肺炎链球菌溶血素的中和抗体或小分子抑制剂生物技术应用：苏云金芽孢杆菌产生的Cry蛋白已广泛用作环保杀虫剂，某些成孔蛋白在食品工业中用作天然防腐剂。此外，细胞穿膜肽（CPPs）为大分子药物递送提供新策略，对基因治疗和癌症靶向治疗具有重要意义研究膜通透化的实验挑战膜通透化过程具有高度的瞬态和动态性质，孔道形成可能在纳秒到微秒时间尺度内完成，远快于大多数实验技术的时间分辨率。孔道结构存在多种中间态和构象，难以通过单一实验方法捕捉。此外，孔道的稳定性和结构特征高度依赖脂质组成、离子强度、pH值等因素，传统实验方法只能提供整体信息，难以揭示分子层面的细节。分子动力学模拟的独特优势分子动力学（MD）模拟作为不可或缺的补充工具，可以提供原子/分子水平的详细见解。 MD模拟可以记录孔道形成的每一步，从初始脂质扰动到孔道成核、扩张和稳定的全过程，跨越从纳秒到毫秒的时间尺度。 MD模拟揭示肽/蛋白-膜相互作用的精确细节，包括氨基酸残基与脂质的相互作用、水分子和离子的通过机制、膜厚度和曲率变化以及脂质翻转的动力学过程。 MD模拟可以填补实验方法的空白，为实验数据提供分子层面的解释。结合增强采样技术，MD模拟可以计算孔道形成的自由能景观，定量比较不同AMPs或PFTs的成孔能力。从全原子到粗粒化，MD模拟可以在不同分辨率下研究膜通透化过程，多尺度工作流程结合两者优势，提供全景式的理解。 MD模拟在膜通透化研究中的里程碑近年来，MD模拟在膜通透化研究领域取得了多项突破： 2008年：Sengupta等通过CG-MD首次揭示了AMPs形成环形孔的动态过程，开创了MD研究膜通透化的先河 2012年：Parton等采用多尺度模拟方法揭示了maculatin 1.1的渗透机制，展示了水如何通过肽聚集体渗透 2021年：Talandashti等详细阐述了pleurocidin的孔道形成机制，发现其倾向于形成环形孔或无序环形孔 2022年：Sun等发现了melittin形成两种不同孔道形态（T-pore和U-pore）的双重机制，取决于环境条件 2024年：Stephani等揭示了melittin与革兰氏阴性菌外膜相互作用的分子细节，为理解AMP对复杂膜的机制提供新见解膜通透化的分子机制：从AMP到PFT 抗菌肽的作用机制抗菌肽（AMPs）通常是小于50个氨基酸残基的小阳离子肽，具有两亲性特征。根据二级结构可分为α-螺旋AMPs（如melittin、magainin）、β-折叠AMPs（如defensins）、混合α/β或非α/β结构（如indolicidin）以及环状AMPs（如θ-defensins）。这些结构差异影响它们与膜的相互作用方式和通透化机制。AMPs诱导膜通透化的机制可分为两大类图1：AMPs诱导膜破坏的主要机制该图展示了抗菌肽（AMPs）诱导膜破坏的主要机制分类，箭头指示AMPs插入引起的膜变形方向和性质。以下表格详细对比4种机制的特征：这些机制并非互斥。例如：同一AMP可能采用多种机制：Melittin可根据肽浓度、脂质组成和初始构型形成T-pore（类环形孔）或U-pore（类桶板孔）机制不限于AMPs：病毒融合肽、细胞穿膜肽等其他膜活性肽类也采用相似的浓度依赖性寡聚化原理 AMPs的4种膜通透化机制对比特征桶板模型环形模型地毯模型聚集模型英文名称 Barrel-stave Toroidal pore Carpet Aggregate 肽取向近垂直（<30°）倾斜（30-60°）平行（≈90°）嵌入膜内，无序亲水面排列亲水侧向内形成孔道内壁亲水面朝向孔道内；阳离子氨基酸将脂质头基拉入核心形成水通路以平行取向覆盖膜表面极性残基形成连续水传导通路疏水面相互作用疏水侧向外与脂质相互作用肽和脂质头基共同构成孔道内壁疏水相互作用破坏膜完整性非极性残基与膜脂质酰基链相互作用孔道组成仅肽肽+脂质头基无孔道肽-脂质聚集体脂质排列脂质保持在双层中脂质连续弯曲穿过孔道膜整体崩塌成胶束脂质包装破坏孔径范围 1-2 nm 1-3 nm，动态变化无稳定孔道瞬态缺陷动态性相对稳定高度动态一次性崩塌瞬态、可逆形成能垒较高较低需要阈值浓度较低孔道稳定性稳定寡聚体动态稳定无孔道瞬态结构典型例子 Alamethicin, Gramicidin A Melittin, Magainin 2 Cecropin A, Dermaseptin Maculatin 1.1, Aurein 1.2 关键特征肽-肽相互作用稳定脂质持续翻转阈值触发机制瞬态缺陷通道通透性离子和小分子离子和小分子全面膜破坏水和离子可逆性不可逆部分可逆不可逆可能可逆注：以上4种机制并非互斥。同一AMP可能采用多种机制：Melittin可根据肽浓度、脂质组成和初始构型形成T-pore（类环形孔）或U-pore（类桶板孔）机制不限于AMPs：病毒融合肽、细胞穿膜肽等其他膜活性肽类也采用相似的浓度依赖性寡聚化原理形成类似孔道的结构我们的OP更像是环形模型？成孔蛋白/毒素的作用机制成孔蛋白/毒素（PFTs）是细菌、真菌、甚至哺乳动物自身产生的蛋白毒素，它们在靶细胞膜上形成孔道，导致离子失衡、代谢紊乱甚至细胞死亡。与AMPs相比，PFTs通常具有更复杂的结构和更精细的调控机制。 PFTs的基本结构特征包括：大小：通常200-800个氨基酸残基，比AMPs大一个数量级，这使得它们能够形成更复杂的孔道结构结构域组织：通常包含多个结构域，分别负责膜结合、寡聚化和孔道形成，各结构域协同工作实现精确调控前体形式：许多PFTs以无活性的前体形式分泌，需要蛋白酶切割激活，这防止了对产生者自身的毒性受体识别：特定PFTs识别膜表面的特定受体（如胆固醇、糖脂等），确保靶向特异性 α-成孔毒素与β-成孔毒素 PFTs根据结构特征和作用机制主要分为两类，以下表格详细对比其15个特征：特征 α-PFTs β-PFTs 膜结合方式单体直接插入膜内单体先在膜表面寡聚化寡聚化时机插入后寡聚化插入前寡聚化（形成前孔复合物）构象变化程度较小显著（α-螺旋→β-发夹，约150个残基）孔道结构 α-螺旋束 β-桶典型孔径 1-3 nm 10-30 nm 形成速度较快较慢（多步骤过程）孔道组成仅蛋白亚基仅蛋白亚基寡聚体大小可变通常固定（如7聚体、12聚体）前体形式通常无前体或需蛋白酶激活常以前体形式分泌，需蛋白酶切割激活方式构象变化激活蛋白酶切割+构象重排能垒较低（直接插入）较高（多步骤、大构象变化）孔道稳定性相对稳定高度稳定主要结构域膜结合结构域+孔道结构域受体识别结构域+寡聚化结构域+孔道结构域典型例子海葵毒素（如Equinatoxin II）、大肠菌素、溶细胞素A（ClyA）肺炎链球菌溶血素（Ply）、气单胞菌溶素前体、金黄色葡萄球菌α-溶血素生物学功能快速杀伤需要精确调控的毒性图2：PFTs的作用机制对比（α-PFTs vs β-PFTs）该图展示了两类成孔毒素/蛋白（PFTs）的作用机制差异，浅黄色脂质代表膜内的特定脂质种类（如胆固醇、磷脂酰丝氨酸等），作为PFTs与质膜结合的受体位点，这种机制差异决定了不同PFTs的细胞毒性、宿主范围和生物学功能：子图A：α-PFTs机制，可溶性单体直接插入膜内，插入后逐步寡聚化形成孔道，寡聚化时机在膜插入之后，构象变化相对较小，典型的如海葵毒素（Equinatoxin II）、大肠菌素、溶细胞素A（ClyA）等采用这种机制，能够快速形成孔道子图B：β-PFTs机制，单体首先在膜表面寡聚化形成前孔复合物，随后发生显著的构象重排插入膜内，寡聚化时机在膜插入之前，经历大幅度构象变化（α-螺旋转化为β-发夹），典型的如肺炎链球菌溶血素（Ply）、气单胞菌溶素前体、金黄色葡萄球菌α-溶血素等，这种多步骤机制降低了初始结合的能垒哺乳动物自身的成孔蛋白哺乳动物细胞也利用成孔蛋白来执行重要生理功能，如免疫防御（MACPF家族，补体系统）、细胞焦亡（Gasdermin家族）和细胞凋亡（BCL-2家族）。这些蛋白在正常情况下受到严格调控，但在病理条件下可能过度激活导致组织损伤。 MACPF/CDC超家族膜攻击复合物/穿孔素（MACPF）家族是哺乳动物最重要的成孔蛋白家族之一，包括：补体成分（C6-C9）：形成膜攻击复合物（MAC），在病原体膜上打孔穿孔素（Perforin）：由细胞毒性T细胞和NK细胞释放，在靶细胞膜上形成孔道 Gasdermins：介导细胞焦亡。哺乳动物成孔蛋白的活性受到严格调控：空间隔离：蛋白前体与激活酶分开储存蛋白酶切割：需要特定蛋白酶切割激活 pH依赖性：某些蛋白仅在特定pH下激活辅助因子：需要钙离子或其他辅助因子。图3：哺乳动物成孔蛋白（PFP）家族的带状表示该图展示了哺乳动物成孔蛋白（PFP）家族的结构多样性，每个面板从左到右分别展示了可溶性单体、插入质膜（PM）的蛋白原体以及完整孔道（侧面和顶视图），这些结构展示了从α-螺旋到β-桶的多种孔道形成机制：家族代表蛋白生物学功能孔道特征 A）MACPF/CDC家族气单胞菌溶素、胆固醇依赖性溶素免疫防御，在补体系统和穿孔素途径中发挥作用形成大孔道（直径>10 nm），快速破坏靶细胞膜 B）Gasdermin家族 GSDMD 介导细胞焦亡（pyroptosis）形成超大孔道（直径10-20 nm），释放炎性细胞因子如IL-1β C）BCL-2家族 BAX、Bak 调控线粒体外膜通透性，介导细胞凋亡在线粒体外膜形成孔道，释放细胞色素c等促凋亡因子 D）Actinoporin家族 FraC 由海洋生物产生的成孔蛋白展示了从α-螺旋到β-桶的结构转变，揭示了哺乳动物成孔蛋白的结构多样性和功能复杂性分子动力学模拟方法学 MD模拟的独特优势 MD模拟在研究膜通透化方面具有独特优势，能够解决实验方法难以应对的挑战：记录孔道形成的全过程：MD模拟可以记录孔道形成的每一步，包括初始脂质扰动、孔道成核、孔道扩张和稳定过程，跨越从纳秒到毫秒的时间尺度揭示分子层面的相互作用：MD模拟揭示肽/蛋白-膜相互作用的精确分子细节，包括氨基酸残基与脂质的相互作用、水分子的结构和动力学、离子选择性机制、膜厚度和曲率变化以及脂质翻转过程填补实验方法的空白：这些分子层面的信息对于理解膜通透化的物理机制至关重要，也是实验方法难以直接获得的，MD模拟能够为实验数据提供分子层面的解释例如，MD模拟与实验方法形成互补：实验方法可提供信息 MD模拟的补充作用电生理测量孔道电导特征、离子选择性揭示孔道内水分子排列、离子水合状态、脂质取向，解释电导的分子来源荧光光谱膜完整性破坏、染料泄漏展示孔道形成的具体过程和结构特征 EPR光谱肽取向和动力学信息原子级分辨率展示肽-膜相互作用的细节 Cryo-EM 孔道高分辨率静态结构揭示孔道形成的动力学过程和能量景观结合增强采样技术，MD模拟可以计算孔道形成的自由能景观，定量比较不同AMPs或PFTs的成孔能力。例如：伞形采样（umbrella sampling）：计算沿反应坐标（如孔径、肽插入深度、膜厚度）的自由能变化，预测孔道的稳定性和形成概率 Metadynamics：探索多维自由能面，识别孔道形成的关键路径和中间态自适应偏置力（ABF）：沿反应坐标施加偏置力以克服能垒，同时保证采样均匀性。通过这些方法，可以计算孔道形成的能垒、孔道的相对稳定性、不同构象态之间的自由能差异等关键热力学量，为理解膜通透化的热力学驱动力提供定量基础。模拟分辨率的选择：全原子 vs 粗粒化从全原子到粗粒化，MD模拟可以在不同分辨率下研究膜通透化过程： AA-MD：提供高精度细节，能够精确描述蛋白质-脂质相互作用、水介导的氢键网络、离子效应、质子化状态 CG-MD：允许研究大系统和长时间尺度过程，如多肽寡聚化、大孔道形成、膜曲率变化、脂质相分离选择合适的模拟分辨率是MD研究膜通透化的关键决策。不同分辨率在时间尺度、系统尺寸、计算成本和物理细节之间提供不同的平衡。图4：Actinoporin-膜复合物的全原子与粗粒化表示对比该图展示了Actinoporin-膜复合物（PDB ID: 4TSY）在不同分辨率下的概念性可视化，两个面板都使用范德华表面表示以突出结构复杂性差异，这种多尺度方法使研究者能够在计算效率和物理精度之间找到最佳平衡：子图A：全原子（AA）表示，使用CHARMM-GUI接口生成，清晰展示所有原子细节，包括水分子、离子和脂质的每个原子，提供最高分辨率的结构信息，能够精确描述氢键网络、水合结构、质子化状态以及特定的脂质-蛋白质相互作用，颜色说明：Actinoporin蛋白显示为黄色，便于识别蛋白的三维结构和空间取向子图B：粗粒化（CG）表示，在MARTINI框架内构建，每个珠粒代表4个重原子，大幅简化系统但保留主要相互作用特征，显著提升计算效率，可研究更大系统和更长时间尺度过程，颜色说明：胆固醇显示为粉色，POPC脂质显示为浅蓝色，清晰展示了蛋白与膜的相互作用界面，有助于理解膜环境对蛋白结构的影响特征全原子MD（AA-MD）粗粒化MD（CG-MD）分辨率保留所有原子细节原子组映射为珠粒时间尺度纳秒-微秒（常规可达几十微秒）微秒-毫秒（可达毫秒级）系统尺寸数百万原子数百万珠粒（对应更多原子）时间步长 1-2 fs 20-40 fs 计算成本极高（需要GPU加速）大幅降低优势高精度，能描述氢键、水合结构、质子化可观察稀有事件、大规模膜重组、寡聚化局限难以捕捉自发孔道形成；系统尺寸受限丢失原子细节；力场精度较低；「黏性」问题（过度稳定蛋白-脂质相互作用，亦称sticky problem）适用场景蛋白-膜结合识别、预成孔稳定性、特定脂质相互作用多肽寡聚化、孔道成核、膜曲率变化、脂质相分离注：以上表格和说明列出了AA-MD和CG-MD的主要特征对比。实际应用中，应根据研究问题的具体需求选择合适的分辨率，或采用下述多尺度策略结合两者优势。方法选择细节 AA-MD常用力场：CHARMM36(m)、AMBER+Lipid21、SLipids、OPLS-AA等，不同力场对膜性质和蛋白-脂质相互作用的描述精度不同。 CG-MD常用力场：MARTINI 3.0、SPICA、SIRAH等，其中MARTINI是最广泛使用的CG力场，采用4重原子映射为1个珠粒的方案。选择合适的模拟分辨率应该基于具体的研究问题：研究问题推荐方法理由肽-膜初始识别和结合 AA-MD 需要精确的氢键和静电相互作用孔道稳定性评估 AA-MD 需要原子级结构细节离子选择性机制 AA-MD 需要精确的离子-孔道相互作用质子化状态效应 AA-MD 需要精确的质子化状态描述自发孔道成核 CG-MD 需要长时间尺度和大规模系统多肽寡聚化过程 CG-MD 需要观察多个肽的组装过程膜曲率变化 CG-MD 需要研究大尺度膜形变变体筛选 CG-MD 需要高通量计算能力多尺度模拟策略：结合两者优势最佳实践是采用多尺度工作流程：先用CG模拟快速探索孔道形成和集体行为，识别关键中间体和转变路径；然后将CG构象反向映射（backmapping）回AA分辨率，进行结构细化并分析详细的相互作用。这种策略兼具效率和精度：CG模拟快速覆盖大构象空间，AA模拟提供高分辨率细节。 1. CG探索阶段构建CG模型系统（包含大量脂质和多个肽/蛋白），使用MARTINI等粗粒化力场运行长时间CG模拟，利用CG的时间步长优势加速模拟，能够观察自发孔道形成等稀有事件观察肽寡聚化、孔道成核、孔道扩张等过程，记录关键中间态的结构特征和转变时间点，识别关键构象态和转变路径 2. 构象选择与反向映射从CG轨迹中选择代表性构象（如寡聚体、孔道中间态、稳定孔道等），确保覆盖所有重要的构象态和转变路径基于结构特征（如肽取向、孔径、脂质排列）选择代表性构象将CG构象反向映射（backmapping）回AA分辨率，恢复原子级细节优化结构以消除可能的不合理几何构型添加水分子和离子以满足生理条件并平衡系统电荷 3. AA模拟与分析对选定的构象运行AA模拟，使用CHARMM36m或AMBER Lipid21等全原子力场，精确描述分子相互作用分析详细的相互作用（氢键、盐桥、水合结构），识别关键的残基-脂质相互作用和水分子的介导作用计算孔道稳定性（如RMSD、孔径随时间变化）如需要，进行增强采样以计算自由能，使用伞形采样或Metadynamics等方法计算孔道形成的自由能景观 4. 整合分析结合CG和AA结果构建完整的膜通透化机制图，CG提供长时间尺度和全局构象变化信息，AA提供分子细节和精确的相互作用信息通过多尺度整合，揭示从初始肽-膜结合到孔道成核、扩张和稳定的完整动力学过程定量比较不同突变、脂质组成或环境条件对孔道形成的影响案例研究：Richardson等人（2024）该研究采用多尺度策略研究不同AMPs的孔道形成机制：方法：他们首先用CG模拟观察melittin、aurein 1.2和magainin 2诱导孔道形成，然后将CG构象反向映射到AA分辨率，应用伞形采样计算自由能面关键发现： Melittin最有效地降低孔道成核能垒，促进特征性环形孔形成 Magainin 2和aurein 1.2效应较小，孔道排列更无序科学意义：为理解AMPs的构效关系提供了分子基础，展示了多尺度方法的强大能力多尺度模拟也面临一些挑战：反向映射的准确性：CG到AA的映射可能产生不合理的原子位置，需要结构优化时间尺度的连续性：AA模拟时间通常短于CG模拟，可能无法观察到CG中的某些转变力场的兼容性：CG和AA使用不同力场，可能影响构象偏好计算成本：多个AA模拟仍需要大量计算资源增强采样技术：克服时间尺度限制膜通透化过程中的许多关键事件是稀有事件，这意味着它们发生的自由能垒很高，在常规MD模拟的时间尺度内难以观察到。这些稀有事件包括：脂质孔道的形成可能需要毫秒级时间，远超常规AA-MD的能力多肽组装成孔道涉及多个中间体，每个寡聚化步骤都可能存在能垒 β-PFT的前孔到孔道转变涉及大幅度构象变化在有限的模拟时间内，系统可能被困在局部自由能最小值中，无法充分采样相空间。这种现象被称为“准非遍历性”（quasi-non-ergodicity），导致模拟结果无法代表系统的真实统计行为。增强采样技术旨在克服这些限制，通过修改采样分布或使用广义系综策略来增强相空间探索。增强采样技术对比由于孔道形成是稀有事件，需要使用增强采样技术来加速构象探索。以下表格对比了4种主要增强采样技术的原理、优势、局限和适用场景：增强采样技术原理优势局限适用场景伞形采样沿反应坐标施加谐振势，多窗口采样精确计算自由能；结果物理意义明确需预先知道反应坐标；计算成本高计算肽插入自由能；量化孔道成核能垒 Metadynamics 沿CV施加历史高斯偏置势，迫使系统探索新构象不需预先知道精确路径；可探索多维自由能面 CV选择影响质量；收敛性评估困难发现未知中间态；探索复杂自由能面副本交换MD 多个副本在不同温度/Hamilton量下运行并交换不需选择CV；保证正确统计采样计算成本随系统尺寸剧增；交换接受率可能低肽折叠和膜结合；温度依赖性现象适应性偏置力（ABF）沿CV施加与平均力相反的偏置力获得连续自由能剖面；不需预定义窗口对CV质量要求高；复杂CV难收敛离子穿孔道过程；构象转变路径分析成孔集体变量：成核CV 为了量化孔道形成过程，研究者设计了专门的集体变量（CV）来描述孔道成核和扩张。成核CV（nucleation CV, $\xi$）是近年来发展的重要方法，通过统计跨膜圆柱内的水和脂质分布来表征孔道形成程度。往期参考阅读：https://mp.weixin.qq.com/s/iywYMimfqn9BWNqvaxfoTw 图7：用于研究孔道形成的集体变量（CV）设计该图展示了用于量化孔道形成过程的集体变量（CV）设计方法，为定量研究孔道形成的自由能景观提供了强大工具：子图A：成核CV（$\xi$）的定义与应用，$\xi$通过一个跨膜圆柱来定义，该圆柱具有半径$R$并被分为$N_s$个切片，通过统计圆柱内水分子氧原子（蓝色）和脂质头基（红色）的占比来表征孔道形成程度，低$\xi$值（$\approx 0.2$）代表完整膜，中等$\xi$值（$0.2-0.7$）表示膜开始出现缺陷，高$\xi$值（$>0.7$）代表膜缺陷显著，$\xi \approx 1$表示完整孔道已形成，这些组分在圆柱内的增加驱动膜从完整状态向膜缺陷和完整孔道转变子图B：两种CV策略对比与选择，”Full-path” CV分为描述孔道缺陷（成核）和孔道扩张两个部分，完整覆盖孔道形成的全过程；”Rapid” CV模拟”无限”环形孔，孔道尺寸由模拟盒大小控制，适合快速评估孔道稳定性最佳实践建议根据PDF原文的Table 1，以下是MD模拟膜通透化的最佳实践建议：方法组件最佳实践分辨率选择根据生物学过程和相关时间/空间尺度选择：AA-MD用于初始蛋白-膜结合、特定脂-蛋白相互作用、预成孔稳定性评估；CG-MD用于自发孔道成核、协同肽组装、大尺度膜变形等稀有事件。可行时采用多尺度工作流程：用CG探索孔道形成和集体行为，然后反向映射到AA分辨率进行结构细化力场选择脂质力场应准确重现关键双层性质（面积/脂质、厚度、序参数）并匹配膜的化学复杂性。AA用CHARMM36(m)、AMBER+Lipid21、SLipids；CG用MARTINI 3.0 增强采样选择能描述孔道形成关键自由度的集体变量（CV），如孔径、脂质有序参数、肽-膜距离、多肽倾斜角等分析验证结合实验数据（EPR、NMR、荧光光谱、电生理测量等）验证模拟结果系列文档：上篇：方法学与机制综述下篇：案例研究与机制解析

Specific Sytems · 2026-03-09

细菌孕酮5β-还原酶的底物选择性调控与5β-二氢类固醇的高效合成

细菌孕酮5β-还原酶的底物选择性调控与5β-二氢类固醇的高效合成本文信息标题：Engineered Bacterial Progesterone 5β-Reductase: Tunable Substrate Preference and Synthesis of 5β-Dihydrosteroids 作者：Changli Che, Wenhe Zhang, Xiao Qiu, Qingyu Wang, Lichun Tang, Bin Qin, Xian Jia, Song You 发表时间: 2025年9月16日单位：沈阳药科大学生命科学与生物制药学院、药物工程学院、伍亚创新学院（中国）引用格式：Che, C., Zhang, W., Qiu, X., Wang, Q., Tang, L., Qin, B., Jia, X., & You, S. (2025). Engineered Bacterial Progesterone 5β-Reductase: Tunable Substrate Preference and Synthesis of 5β-Dihydrosteroids. ACS Catalysis, 15, 16560-16573. https://doi.org/10.1021/acscatal.5c04685 摘要类固醇在5β位置的立体选择性氢化是类固醇药物合成中的关键步骤。然而，现有植物孕酮5β-还原酶（P5βR）和动物来源的类固醇5β-还原酶存在催化效率低和异源表达水平差的问题，限制了其实际应用。为了拓展5β-二氢类固醇的酶法合成途径，本研究首次从细菌中挖掘了P5βR，并研究了其对孕酮和8-氧香叶醛的催化活性。与植物来源的PRISE（孕酮5β-还原酶和/或鸢尾苷合成酶样1,4-烯酮还原酶）类似，细菌P5βR尽管保持高度保守的蛋白序列和结构架构，但表现出不同的底物偏好。通过整合序列-结构比较分析，研究者识别了控制底物选择性的构象开关，实现了细菌P5βR底物偏好的精准调控。分子动力学模拟结果表明，突变体M1能够打开底物结合口袋内的cavity B，使线性底物8-氧香叶醛稳定结合。本研究首次证明细菌P5βR可通过单点突变实现底物偏好的程控反转。此外，研究者提出了一种基于底物特征的理性策略，进一步增强了细菌P5βR对类固醇的催化活性。最优突变体LpP5βR-M5对孕酮的催化效率比野生型提高了700倍以上。准工业化的反应体系在2小时内几乎完全转化28 g/L孕酮并实现330 g/L·d的时空产率，标志着5β-二氢类固醇绿色合成进入可放大阶段。本研究不仅阐明了细菌P5βR的结构-功能关系，还开创了5β-二氢类固醇合成的环境友好型生物催化途径。核心结论细菌来源P5βR全面挖掘：首次从细菌中成功获得孕酮5β-还原酶集合，并同步解决植物/动物同源酶可溶表达差的瓶颈保守骨架孕育新底物偏好：尽管整体折叠与PRISE高度保守，细菌P5βR展现与植物体系截然不同的底物特异性 H307构象开关实现偏好反转：单点突变即可通过cavity B门控调节，实现孕酮与8-氧香叶醛之间的底物选择性切换理性工程显著提升动力学参数：面向空间位阻与疏水性需求的组合突变将催化效率提升至773倍，对应$k_\text{cat}/K_\text{m}=348.4\,\mathrm{mM^{-1}\,min^{-1}}$ 准工业化反应体系验证放大潜力：28 g/L孕酮在2小时内完成高立体选择性转化并达到330 g/L·d时空产率，为绿色工业化提供直接路径。背景类固醇Δ4,5-双键的立体选择性β面氢化能够形成具有A/B环顺式稠合构象的5β-二氢类固醇。这一转化在强心苷和胆汁酸的生物合成途径中具有关键意义。5β-二氢类固醇决定着强心苷与胆汁酸的终端产量，因此任何调控Δ4,5双键氢化的酶都直接关系到药物供应链的安全。尽管对动物和植物来源的同源酶进行了广泛研究，但微生物来源的催化该反应的酶仍未被表征。动物来源的类固醇5β-还原酶（如AKR1D1和AKR1D2）是类固醇激素代谢和胆汁酸合成的必需酶，属于醛酮还原酶（AKR）超家族，采用其特征性的(α/β)8-桶状结构。在植物中，孕酮5β-还原酶（P5βR, EC 1.3.99.6）最早从洋地黄叶片中纯化，参与强心苷的生物合成。与动物类固醇5β-还原酶不同，植物来源的P5βR由于关键催化残基的差异而属于短链脱氢酶/还原酶（SDR）的特殊类别。动物AKR与植物SDR在催化骨架和辅酶识别上的根本差异，凸显了跨界挖掘全新催化架构的紧迫性。植物P5βR和鸢尾苷合成酶（IS）共享高度的序列和结构同一性，IS活性也被证实广泛存在于植物P5βR中，因此它们被统称为VEP1编码的孕酮5β-还原酶/鸢尾苷合成酶（PRISE）。尽管PRISE家族酶具有几乎无法区分的结构和相似的催化机制，但P5βR和IS表现出明显不同的底物特异性。 5β-二氢类固醇作为众多生物活性分子和药物的关键中间体，包括强心苷类药物地高辛（Digoxin）、蟾毒灵（Bufallin）、胆汁酸衍生物鹅去氧胆酸（Chenodeoxycholic acid）以及新型抗抑郁药zuranolone等。然而，现有类固醇5β-脱氢酶在大肠杆菌中异源表达效率低、对Δ4,5-3-酮类固醇的催化性能欠佳，限制了其在5β-二氢类固醇合成中的实际应用。尽管许多研究尝试通过基因挖掘或工程化改进类固醇5β-脱氢酶的催化活性，但至今仍未开发出可工业化规模的生物催化工艺。因此，工业合成5β-还原酶主要依赖传统化学方法。然而，类固醇Δ4,5-双键的立体选择性和区域选择性还原对化学合成是一个挑战，硼氢化物的使用更倾向于还原3-酮基。最广泛采用的化学方法涉及钯催化氢化（Pd/C或Pd/CaCO3），但通常只能达到约50%的立体选择性，且不同类固醇底物之间存在显著差异。传统氢化工艺在立体纯度、成本与环境负担之间的矛盾，逼迫行业寻求可放大的生物催化替代方案。实现更高的立体选择性需要费力优化反应溶剂和催化剂配方，显著增加了生产成本并限制了商业可行性。图1：5β-二氢类固醇合成的现状与本研究定位 (a) 合成方法对比：左侧展示类固醇Δ4,5-双键的立体选择性β面氢化反应；右侧对比传统化学法（Pd/C催化加氢，需有机溶剂，立体选择性仅约50%）与酶法（SDR/AKR/P5βR，水相反应，立体选择性>99%）。关键信息：标注”Bacterial P5βR - Underexplored”点明本研究切入点 (b) 天然产物与药物应用：展示6个重要的5β-二氢类固醇分子，蓝色氢原子标记β构型：强心苷类：地高辛（Digoxin）、毛地黄毒苷（Digitoxin）新型神经活性药物：Zuranolone、Bufallin 胆汁酸类：鹅去氧胆酸（Chenodeoxycholic acid）、熊去氧胆酸（Ursodeoxycholic acid） (c) 已知PRISE催化反应：植物来源的PRISE家族催化孕酮（1a）生成5β-孕烷-3,20-二酮（2a），或催化8-氧香叶醛（1b）生成鸢尾苷前体（nepetalactol + iridodial） (d) 本研究发现：细菌P5βR（紫色蛋白结构）同样催化1a生成2a，但对1b的催化产物为diquatdial（2b）和6,7-二氢-10-氧香叶醛（2b’），产物路线与PRISE不同关键科学问题异源表达瓶颈：现有植物P5βR和动物类固醇5β-还原酶在大肠杆菌中可溶性表达水平低，难以满足工业化应用需求催化效率低下：野生型P5βR对孕酮等类固醇底物的催化活性不足，限制了酶法合成的经济可行性底物选择性机制不明：PRISE家族酶的底物特异性决定因素尚未阐明，阻碍了理性设计和底物范围拓展工业化应用缺失：缺乏可工业化规模生产5β-二氢类固醇的环境友好型生物催化工艺创新点首次挖掘细菌P5βR：以植物P5βR为探针，从NCBI数据库中挖掘了10个细菌来源的P5βR，解决了异源表达问题揭示底物选择性开关：通过序列-结构比较分析，识别了H307位点作为控制底物偏好的构象开关，单点突变即可反转底物选择性底物特征导向的理性设计：提出了基于底物特性（大空间位阻和疏水性）的工程策略，系统性提升了对类固醇的催化活性分子机制深入解析：结合分子对接、分子动力学模拟和腔体分析，阐明了突变体活性提升的结构基础实现克级规模制备：最优突变体LpP5βR-M5实现了28 g/L孕酮的高效转化（STY 330 g/L·d），为工业化应用提供了可行方案研究内容基因挖掘与细菌P5βR的活性测定为了克服植物P5βR和动物类固醇5β-脱氢酶异源表达差的障碍，研究者采用基因挖掘技术从细菌中搜索潜在的P5βR。首先，以洋地黄（Digitalis lanata）的经典DlP5βR和拟南芥（Arabidopsis thaliana）的AtP5βR为探针，在NCBI数据库中搜索了序列同一性最高的前100个细菌P5βR序列。所有序列在NCBI数据库中均被预测为SDR家族的氧化还原酶。随后，基于植物P5βR的六个特征性保守基序（32GXTGIXG40、59GXXRR65、80DXXD85、143TGXKHYXGP153、176NFYYXXED185、197WSVHRP204）进行序列筛选。最终选择了约20个符合标准的候选序列。为了提高基因挖掘的成功率，研究者使用邻接算法（Neighbor-Joining Algorithm）构建了系统发育树，并分析了序列同一性。最终选择了10个序列进行基因合成。 graph TB Start["基因挖掘策略"] --> S1 subgraph S1["1.序列搜索与筛选"] direction LR A1["以DlP5βR和AtP5βR 为探针搜索NCBI"] --> A2["获得前100个 细菌序列"] A2 --> A3["基于6个保守基序 筛选候选序列"] A3 --> A4["构建系统发育树 选择10个基因合成"] end S1 --> S2 subgraph S2["2.异源表达与活性测定"] direction LR B1["克隆至pET-28a载体 大肠杆菌表达"] --> B2["SDS-PAGE分析 LpP5βR表达量最高"] B2 --> B3["Ni-NTA纯化 活性测定"] end S2 --> S3 subgraph S3["3.底物特异性发现"] direction LR C1["孕酮1a 所有P5βR有活性"] --> C2["8-氧香叶醛1b 仅RbP5βR有活性"] C2 --> C3["产物鉴定 2b和2b'"] end S3 --> Result["发现：细菌P5βR 具有显著底物特异性"] 这些基因广泛分布于不同的细菌科，与DlP5βR和AtP5βR的序列同一性为35-42%，彼此之间的序列同一性为45-86%。合成基因克隆至pET-28a(+)载体，在大肠杆菌BL21(DE3)中表达。SDS-PAGE结果显示，这些酶的可溶性表达差异很大，其中LpP5βR的可溶性表达量最高（来源于Lichenihabitans psoromatis）。活性测定结果令人惊喜：所有纯化的酶均表现出P5βR催化活性，能够立体选择性地还原孕酮（1a）的Δ4,5-双键形成5β-孕烷-3,20-二酮（2a）。其中，LwP5βR、GbP5βR和LpP5βR的催化活性较高，转化率超过20%。值得注意的是，与植物PRISE家族类似，细菌P5βR也依赖NADPH而非NADH作为辅酶，这归因于细菌P5βR具有与PRISE家族类似的辅酶结合口袋。为了探索细菌P5βR是否像PRISE一样具有鸢尾苷合成酶活性，研究者以8-氧香叶醛（1b）作为底物进行活性测试。结果显示，细菌P5βR对1b普遍没有可检测的催化活性，只有RbP5βR表现出例外的催化活性（来源于Rhodobacteraceae bacterium）。产物经GC、MS和NMR鉴定为diquatdial（2b）和6,7-二氢-10-氧香叶醛（2b’），这与PRISE的催化产物不同，而与真菌还原酶EasA（来自Aspergillus fumigatus）的催化产物相同。推测在细菌P5βR催化过程中，氢负离子攻击1b的C6位而非C3位。图2：细菌P5βR的基因挖掘与活性鉴定全景图 (a) 系统发育树：以植物DlP5βR和AtP5βR为探针，从NCBI筛选出的P5βR序列构建邻接树。红色标记为本研究合成并验证的10个细菌P5βR（来自蓝色区域的细菌分支），橙色为植物PRISE，灰色为动物类固醇5β-还原酶。树的尺度条表示0.54的进化距离 (b) 底物特异性测试：柱状图展示10个细菌P5βR对孕酮（1a，蓝色柱）和8-氧香叶醛（1b，紫色柱）的转化率。关键发现：大多数P5βR偏好1a（蓝色柱高），仅RbP5βR对1b有显著活性（紫色柱高） (c) 可溶性表达差异：SDS-PAGE凝胶电泳图。灰色背景柱代表不同底物组合（diquatdial、6,7-二氢-10-氧香叶醛、8-氧香叶醛），橙色柱标记LpP5βR对1a的高转化率（>25%），显著高于其他P5βR (d) 催化产物示意：上方为PRISE家族催化1b的产物（8-氧香叶醛→鸢尾苷前体），下方为细菌P5βR催化的产物路线（8-氧香叶醛→diquatdial + 6,7-二氢-10-氧香叶醛） (e) GC色谱验证：时间-强度曲线显示无酶对照、RbP5βR反应和标准品的峰位对比，证实产物身份细菌P5βR的底物特异性调控挖掘的10个细菌P5βR在催化1b和1a时表现出显著的底物特异性：RbP5βR偏好催化线性底物1b而非1a，而其他P5βR则偏好催化1a而非1b。为了实现细菌P5βR底物特异性的理性调控并寻找影响底物选择性的分子基础，研究者首先使用AlphaFold3获得了细菌P5βR与NADPH复合物的蛋白结构。分子动力学模拟方法为解析底物偏好反转与活性增强的结构机制，作者针对RbP5βR、LpP5βR及其M1、M5突变体开展了100 ns全原子MD模拟。所有体系在Schrödinger Release 2018-1环境中构建，采用OPLS3力场与SPC水模型，将蛋白-底物复合物置于正交水盒，并通过添加Na+/Cl−调节至pH 7.0并整体中和。每个体系先进行10 000步最陡下降能量最小化，随后在300 K、1.01325 bar的NPT系综下跑100 ns，轨迹每100 ps输出一次，以便统计氢键、距离、溶剂可及表面积和配体RMSD等指标。后处理统一借助Simulation Interaction Diagram模块，输出的接触占有率、SASA和结构快照构成了图4、图6及SI图S14-S19中氢键网络、Ligand-Contact-Diagram、SASA与RMSD分析的原始数据。结构比较显示，细菌P5βR的整体结构与植物来源的DlP5βR相似，均具有SDR家族的Rossmann折叠和延伸的C端结构域。DlP5βR关键催化残基（Y179和K147）位置的酪氨酸和赖氨酸在细菌P5βR中也存在，推测为细菌P5βR的关键催化残基。 LpP5βR-Y145F突变体对1a的催化活性几乎完全丧失，进一步证明了该残基参与细菌P5βR的催化。 K114A突变体对1a的催化活性增强，表明K114氨基酸侧链不参与催化，可能是K114骨架酰胺氮与底物形成氢键，稳定底物并促进质子转移。由于RbP5βR的底物特异性与其他挖掘的P5βR不同，研究者从序列和结构两方面分析了RbP5βR的特殊性。序列保守性分析显示，细菌P5βR底物结合口袋的氨基酸高度保守（L117、F120、Y123、M180、W306、H307、D311、R314），难以仅根据序列判断底物偏好。结构比较显示，细菌P5βR的底物结合口袋可分为主体cavity A和靠近辅酶向下延伸的cavity B。RbP5βR的cavity B明显长于其他P5βR，推测更大的cavity B对于细菌P5βR催化8-氧香叶醛至关重要。通过观察cavity B周围的残基，识别出残基H307能够直接影响cavity B的大小。图3：底物选择性的结构基础与H307门控开关 (a) 整体结构与保守骨架：左侧为RbP5βR-WT的AlphaFold3预测结构（浅蓝色ribbon），标注Rossmann fold（辅酶结合域）、N端和C端。右上插图展示Y179（对应LpP5βR的Y145）与NADPH、底物1a的空间位置关系。右侧底物结合口袋俯视图（紫蓝色表面）清晰显示水平延伸的cavity A和垂直向下的cavity B (b) 关键催化残基特写：Y179与底物1a的羰基氧形成氢键（红色虚线），K147起辅助稳定作用。柱状图显示不同P5βR的相对活性，RbP5βR（紫色柱）对1b活性最高 (c) 底物结合口袋的保守残基网络：棒状模型展示8个高度保守的残基（L117、F120、Y123、M180、W306、H307、D311、R314）围绕底物1a（白色骨架）。右侧sequence logo显示这些位点在PRISE家族中的保守性，H307位点几乎100%保守 (d) Cavity B的门控效应可视化：三个蛋白表面模型对比（RbP5βR-WT、LpP5βR-WT、LpP5βR-H307A）。黄色区域标记cavity B，红色圈标注H307/A307位置。关键量化：LpP5βR-M1的cavity B比WT增大**52.8 **Å3（从1213 Å3到1271 Å3） (e) H307突变体的底物选择性反转：柱状图显示5个突变体（H307A、H307V、H307L、H307I、H307F）对1a和1b的催化活性。H307A实现完全反转：对1b的活性从0提升至约60%，对1a的活性从80%降至20% (f) 底物谱系统测试：3D柱状图展示不同突变体对多种底物的转化率，验证H307A在拓宽底物范围中的作用为了验证这一假设，研究者对LpP5βR的H307进行了定点诱变（H307A、H307V、H307L、H307I），并测试了对1a和1b的催化活性。令人惊喜的是，LpP5βR-H307A（M1突变体）对1b的催化活性相比野生型显著提高，而对1a的催化活性降低。活性位点腔体体积测量显示，LpP5βR-M1比LpP5βR-WT的体积增加了52.8 Å3。突变体M1成功实现了底物特异性的反转，也证实了研究者的推测。随后，研究者在其他挖掘的P5βR上构建了M1突变体（LwP5βR-H307A、SsP5βR-H307A、GbP5βR-H311A、RbP5βR-H310A、AbP5βR-H306A、AcbP5βR-H309A、CbP5βR-H306A、TbP5βR-H311A），活性测试结果显示，所有突变体相比野生型都成功实现了底物特异性的改变。通过理性设计和工程化，研究者仅用单点突变就实现了细菌P5βR底物选择性的反转。为了进一步探索细菌P5βR底物偏好改变的潜在机制，研究者进行了分子对接和分子动力学（MD）模拟。首先，通过比较RbP5βR-WT和LpP5βR-WT与1b的催化过程，发现底物1b在RbP5βR-WT的底物结合口袋中稳定，但在LpP5βR-WT的底物结合口袋中不稳定。这可能是RbP5βR相比其他细菌P5βR-WT对1b有催化活性的原因。图4：底物结合稳定性的分子动力学证据（100 ns MD模拟）这是一个3列×5行的MD模拟快照网格，系统性地展示了底物1b在不同酶中的动力学行为：列布局（从左到右）：第1列 - RbP5βR-WT（米色蛋白表面）：天然对1b有活性的酶第2列 - LpP5βR-WT（白色蛋白表面）：野生型，对1b无活性第3列 - LpP5βR-M1（淡紫色蛋白表面）：H307A突变体，获得对1b的活性行布局（从上到下）时间序列：0 ns → 40 ns → 60 ns → 80 ns → 100 ns 关键观察：黄色棒状：底物1b的线性骨架标注残基：K117/K114（催化赖氨酸），Y148/Y145（质子给体），H310/H307/A307（门控残基） RbP5βR-WT（左列）：1b在整个100 ns过程中始终稳定地停留在活性位点，保持合适的催化距离 LpP5βR-WT（中列）：1b在模拟过程中逐渐偏离最佳催化位置，H307的咪唑环（粉色）形成空间冲突，导致底物无法稳定结合 LpP5βR-M1（右列）：H307A突变消除了空间位阻后，1b重新获得稳定的结合姿态，证明H307确实是控制底物选择性的门控开关通过理性设计扩大LpP5βR的cavity B后，1b能够在突变体LpP5βR-M1的底物结合口袋中形成合适的预反应构象，并在整个催化过程中保持稳定。307位高度保守的组氨酸充当门控开关，抑制对1b的催化活性。将该位点突变为丙氨酸使细菌P5βR的底物结合口袋更适合线性底物1b的稳定结合。作者在Discussion中特别强调，cavity B门控是细菌P5βR底物偏好反转的唯一开关，借助这一点既能解释RbP5βR对1b的天然适配，也能为植物PRISE体系提供结构参照。团队计划围绕该门控位点开展跨物种序列比对，构建能够预测未知P5βR/IS序列底物偏好的规则库，为后续精准控制底物选择性奠定基础。工程化细菌P5βR增强孕酮催化活性尽管通过基因挖掘识别的细菌P5βR能够立体选择性地还原1a为2a，但其对1a的催化活性普遍较低。为了克服现有P5βR的局限性并为5β-二氢类固醇合成提供潜在的生物催化剂，研究者对细菌P5βR进行了理性设计指导的结构工程。由于LpP5βR在大肠杆菌中表达量高且对1a有良好的催化活性，因此选择LpP5βR进行工程化。考虑到1a的性质（大空间位阻和疏水性），研究者制定了理性工程策略：将底物结合口袋中具有大空间位阻或极性的残基突变为具有小空间位阻的非极性氨基酸。通过观察LpP5βR的底物结合口袋，识别出F120、Y123、M180、H307和D311作为工程位点。其中F120和Y123位于底物通道入口，而M180、H307和D311更靠近辅酶。图5：理性设计策略与迭代工程优化路线 (a) 工程热点定位：LpP5βR-WT的活性位点放大图。紫色棒状标记5个候选突变位点：F120和Y123（底物通道入口），M180、H307、D311（靠近NADPH）。底物1a（白色骨架）和NADPH（橙色棒状）清晰可见 (b) 单点突变筛选结果：柱状图展示野生型和单突变体对1a的转化率（条件A：0.5 mg/mL酶，1 h反应）。紫色柱为突变体，灰色柱为对照。关键发现：M180V（M2）、M180I、H307L活性显著提升（>60%转化率），而D311I活性降低 (c) 组合突变的迭代优化：柱状图展示从单突变H307L到双突变M3（M180V/H307A）、三突变M4（M180V/H307A/D311I）、四突变M5（T170V/M180V/H307A/D311I）的活性递增。分级筛选条件：左侧虚线前用条件B（0.25 mg/mL），右侧用条件C（0.04 mg/mL，20 min）。M5在最严格条件下仍完全转化底物 (d) M5在不同P5βR上的普适性：3D柱状图展示8个不同细菌P5βR的野生型（浅色柱）vs M5突变体（深色柱）对1a的转化率。所有M5突变体均显著优于野生型，证明策略的广泛适用性 (e) 克级制备验证：反应方案展示NADPH/NADP+循环系统（BsGDH偶联葡萄糖氧化）。时间-转化率曲线显示28 g/L底物在2 h内达到>98%转化率，产率93% 这五个氨基酸被突变为具有小空间位阻的非极性氨基酸，如A、V、L、I、P。为了准确评估不同突变体的活性变化，研究者设计了三套分级筛选条件：条件A（野生型和单突变体）：0.5 mg/mL纯酶，1 h反应条件B（双/三突变体）：0.25 mg/mL纯酶，1 h反应条件C（四突变体）：0.04 mg/mL纯酶，20 min反应这种分级筛选策略的设计逻辑在于：随着突变累积导致活性不断提升，若继续使用高酶浓度和长反应时间，所有突变体都会达到完全转化，无法区分活性差异。因此必须逐步降低酶浓度并缩短反应时间，才能准确捕捉活性提升的梯度。突变结果显示，F120和Y123突变体的催化活性与野生型相差不大，而M180A、M180V（M2）、M180I、H307L和H307F的转化率显著提高。此外，D311I突变体的催化活性相比野生型显著降低。随后，构建了M180和H307的组合突变，发现突变体M180V/H307A（M3）和M180F/H307A相比单突变H307L的活性进一步提高。鉴于酶工程中上位效应的普遍性，研究者在M180/H307双突变体的基础上构建了D311突变。所得到的最优三突变体M180V/H307A/D311I（M4）在条件B下能够完全转化1a。为了进一步消除底物结合口袋中的不利作用力并提高LpP5βR对1a的催化活性，研究者在M4的基础上构建了K114、H169、T170、R314突变体。最终获得了催化活性最高的突变体T170V/M180V/H307A/D311I（M5），在条件C下能够完全转化底物。这意味着M5的活性是野生型的至少12.5倍（0.5/0.04），而实际催化效率提升达到773倍，说明不仅酶浓度可以大幅降低，催化速率也显著加快。为了测试理性工程策略是否普遍适用于细菌P5βR，研究者在其他挖掘的P5βR上引入了M5突变（LwP5βR-T170V/M180V/H307A/D311I、SsP5βR-T170V/M180V/H307A/D311I等）。活性测试显示，工程化P5βR的酶活性相比野生型显著提高。这些P5βR之间的低序列同一性表明，工程策略对不同细菌来源的P5βR具有广泛适用性。为了研究LpP5βR-M5的应用价值，研究者使用LpP5βR-M5粗酶液作为催化剂进行2a的不对称合成。反应体系采用NADPH作为辅酶，并耦合葡萄糖脱氢酶（GDH）循环系统实现辅酶再生。该GDH来源于枯草芽孢杆菌（Bacillus subtilis, BsGDH），对D-葡萄糖的催化活性约为10 U/mg（25°C）。辅酶循环的工作原理是：GDH将葡萄糖氧化为葡萄糖酸的同时将NADP+还原为NADPH，从而持续供给P5βR催化所需的还原当量，使得系统仅需催化量的NADP+（0.1 mM）即可维持反应进行。通过优化反应条件（包括助溶剂类型、底物浓度和辅酶浓度），确定了最佳反应条件：底物浓度：28 g/L（约90 mM）助溶剂：20% (v/v) DMSO 辅酶：0.1 mM NADP+（催化量）辅助底物：50 g/L葡萄糖（为GDH循环提供驱动力）酶用量：40 g/L湿菌体粗酶液（LpP5βR-M5）+ 5 g/L湿菌体粗酶液（BsGDH）反应温度：35°C，220 rpm 在100 mL规模的不对称还原反应中，1a的转化率在2小时内超过98%，时空产率（STY）高达330 g/L·d。最终通过硅胶柱层析纯化得到纯净的化合物2a（2.6 g，93%产率）。值得强调的是，28 g/L的底物负载和330 g/L·d的STY已接近工业生物催化的标准要求，而仅需0.1 mM的辅酶浓度大大降低了成本。 LpP5βR突变体活性增强的分子机制为了探索LpP5βR突变体对1a催化活性增强的分子机制，研究者测试了LpP5βR-WT及相关突变体的动力学常数。结果显示： M2突变体通过降低$K_\text{m}$显著提升了酶对1a的亲和力：$K_\text{m}$从0.16 mM下降到0.091 mM，证明缩小空间位阻的有效性 M3突变体依靠减小辅酶附近的腔体空间位阻显著提高$k_\text{cat}$，从而同步提升周转速率 M4与M5突变体通过增强口袋疏水性实现亲和力与速率的双向提升，共同奠定了后续克级合成的基础酶 $K_\text{m}$ (mM) $k_\text{cat}$ (min-1) $k_\text{cat}/K_\text{m}$ (mM-1 min-1) 倍数 LpP5βR-WT 0.16 ± 0.04 0.066 ± 0.012 0.45 1 LpP5βR-M2 0.091 ± 0.028 0.342 ± 0.054 3.8 8 LpP5βR-M3 0.10 ± 0.02 3.42 ± 0.48 34.2 76 LpP5βR-M4 0.06 ± 0.01 6.60 ± 0.59 110.0 244 LpP5βR-M5 0.062 ± 0.009 21.6 ± 2.4 348.4 773 此外，研究者使用分子对接、腔体分析和MD模拟分析了LpP5βR的变化。首先，使用AlphaFold3预测了LpP5βR-M5的蛋白结构，预测模板建模分数（pTM）和界面预测模板建模分数（ipTM）分别为0.95和0.97。腔体分析显示，LpP5βR-M5的底物结合口袋相比野生型增大了约58 Å3，主要由于180、307位置（靠近辅酶结合口袋位置）的空间位阻减小。图6：M5活性提升的三重分子机制全景解析 (a) 腔体体积的可视化对比（Caver分析）：蓝色球形区域表示底物结合口袋和辅酶结合口袋的共同空间。上图（WT）：腔体入口较窄；下图（M5）：腔体明显扩大，标注”entrance”指示底物进入通道 (b) 腔体体积量化：紫色网格显示WT和M5的三维腔体轮廓。数值标注显示WT为1213 Å3，M5为1271 Å3，净增加58 Å3 (c) 催化构象优化（关键距离缩短）：散点图显示100 ns MD模拟中两个关键催化距离的分布。上排（WT）：d(Osub-OHY145)和d(Csub-C4NADH)距离较长且分散；下排（M5）：两个距离显著缩短并聚集在催化最优范围（3-5 Å），证明质子和氢负离子传递更容易 (d) 相互作用力谱分析（Ligand-Contact-Diagram）：柱状图展示底物1a与不同残基的相互作用占有率。上图（WT）：主要依赖K114的氢键（绿色柱，>80%），Y145几乎无贡献；下图（M5）：相互作用更丰富，出现多个水介导接触（蓝色柱），Y145通过水分子参与催化 (e) 水介导氢键网络的关键证据：3D结构特写显示M5中Y145（黄色棒状）通过1-2个水分子（红色球）与底物1a（白色骨架）形成氢键网络（绿色虚线）。NADPH（橙色）提供氢负离子。这种水桥结构在WT中几乎不存在，是M5催化效率提升的核心创新 (f) 结构稳定性增强（RMSD分析）：时间序列曲线显示0-100 ns的蛋白和底物RMSD。紫色曲线（M5）比粉色曲线（WT）波动更小，RMSD均值更低，证明M5在催化过程中更稳定 (g) 疏水性增强的可视化：蛋白表面着色图。黄色区域表示疏水性，蓝色区域表示亲水性。WT（左）：底物结合口袋有较多蓝色亲水区；M5（右）：口袋疏水性显著增强（更多黄色），与类固醇疏水骨架的范德华相互作用更强 MD模拟从分子层面揭示了M5活性提升的三重机制：首先，催化构象优化。突变体M5的两个关键催化距离[d(Osub-OHY145)和d(Csub-C4NADH)]明显短于WT，表明在突变体M5的催化过程中氢质子和氢负离子的传递距离更短，因此反应更容易发生。这直接解释了$k_\text{cat}$的大幅提升（从0.066到21.6 min-1，提升327倍）。其次，水介导氢键网络的建立是M5活性提升的关键创新。力分析显示，在野生型中，虽然底物能够与K114形成连续且稳定的氢键，但与关键催化残基Y145没有直接相互作用，这导致质子传递效率低下。相比之下，M5在催化过程中与底物的相互作用力更丰富，许多水分子参与其中充当质子传递的桥梁。这归因于突变体相比WT具有更大的溶剂可及表面积（SASA）——突变引入的小侧链残基使得水分子更容易进入活性位点。定量分析显示，在M5中，Y145在大约49%的模拟时间内通过1-2个水分子与底物形成氢键网络，从而有效促进质子从Y145羟基转移到底物羰基，完成还原反应。这种水介导的质子传递机制在野生型中几乎不存在，是M5催化效率大幅提升的分子基础。最后，结构稳定性增强。M5和WT的RMSD（均方根偏差）分析表明，M5在整个反应过程中的构象波动更小，蛋白结构更稳定。这可能是由于M5相比WT具有更疏水的底物结合口袋，与类固醇疏水骨架的范德华相互作用更强，因此底物结合更加稳定，减少了蛋白构象的扰动。基于以上分析，突变体LpP5βR-M5对1a催化活性提高的原因可归纳为三点：减小空间位阻：底物结合口袋中靠近辅酶位置的空间位阻减小增加疏水性：底物结合口袋疏水性增加水介导氢键网络：活性位点腔体的SASA增加，从而在酶的关键催化残基与底物之间建立水介导的氢键网络底物范围探索为了测试LpP5βR对类固醇化合物的催化效果，研究者使用LpP5βR-WT和LpP5βR-M5作为生物催化剂催化不同的类固醇。结果显示，LpP5βR-M5相比野生型具有更广的底物范围，其对所有类固醇底物的催化活性均显著提高。图7：底物范围拓展与结构-活性关系图示展示了LpP5βR-WT和M5对11个类固醇底物（1c-1k）的催化转化率对比，反应条件：0.1 M磷酸钾缓冲液（pH 7.5）、0.1 mM NADP+、10% DMSO、35°C、2 h。颜色编码：黑色文字：LpP5βR-WT的转化率蓝色文字：LpP5βR-M5的转化率（下方括号内为分离产率）关键结构-活性规律： C17取代耐受性强：2c（11-OH）、2f（25-OH）、2g（17-炔丙基）、2h（17-环氧）的高转化率（M5达67-99%）证明C17位大取代不影响催化，因为该位置位于口袋外部 Δ1-双键显著抑制：2d和2e的转化率明显低于饱和类似物，符合1,4-加成机制的要求 11-OH提升活性：2i（11β-OH，90%）和2j（11β-OH + 17,21-二羟基，99%）的超高转化率表明极性羟基增强底物亲水性有利于催化 C6-甲基完全阻断：2k（6α-Me）对WT和M5均无活性（N.A.），证明该位置的空间位阻阻止催化构象形成 M5的全面优势：对所有可转化底物，M5的活性均为WT的2-30倍，最大提升见于2i（从8%到90%）通过比较LpP5βR对不同类固醇化合物的催化活性发现： C17位取代的空间位阻影响小：类固醇17位取代的空间位阻对酶活性影响很小，LpP5βR能够高效催化大的C17取代类固醇（如1f、1i），这可能是由于催化过程中类固醇的该位置位于P5βR底物结合口袋外部 Δ1-双键显著降低活性：Δ1-双键的存在（1d、1e）显著降低了P5βR的催化活性，因为P5βR的催化遵循1,4-加成原理 11位羟基取代提升活性：类固醇11位的羟基取代进一步增强了P5βR的催化活性，表明该位点的空间位阻对P5βR活性没有影响，且底物亲水性的增加有利于P5βR活性的提高（1i、1j） C6-甲基阻碍催化：对于底物1k，LpP5βR-WT和M5均未表现出催化活性，可能是因为底物C6-甲基的空间位阻阻止了其处于合适的预反应姿态总之，通过理性设计获得的LpP5βR-M5不仅高效催化1a，也能覆盖多种药用类固醇，包括4-雄烯二酮（2e）、二苄醇（2f）、氢化可的松（2j）等关键中间体。 Q&A Q1：为什么细菌P5βR与植物PRISE在序列和结构高度保守的情况下，底物特异性却存在显著差异？这是酶学研究中的经典现象——高度保守的整体结构并不意味着完全相同的底物选择性。尽管细菌P5βR与植物PRISE的整体序列同一性为35-42%，关键催化残基（如Y145、K114）高度保守，但底物结合口袋的微小结构差异足以导致底物偏好的显著改变。具体而言，本研究发现cavity B（靠近辅酶的向下延伸腔体）的大小是决定性因素。RbP5βR的cavity B显著长于其他细菌P5βR，使其能够容纳线性底物8-氧香叶醛。而大多数细菌P5βR由于H307残基的存在，cavity B较小，更适合孕酮等刚性类固醇底物的结合。这种门控效应（gatekeeper effect）在酶工程中非常常见——单个关键残基就能控制底物通道的开闭和底物选择性。此外，底物结合口袋的疏水性和形状互补性也是重要因素。孕酮作为疏水性强的刚性四环骨架分子，需要一个紧密的疏水性口袋才能稳定结合；而8-氧香叶醛作为线性柔性分子，需要一个更开放的腔体来容纳其延伸构象。MD模拟清晰地显示了这种差异：在LpP5βR-WT中，1b无法形成稳定的预反应构象，而在cavity B扩大后的M1突变体中，1b能够稳定结合并维持整个催化过程。 Q2：H307A单点突变如何实现底物选择性的完全反转？这一发现对PRISE家族底物特异性研究有何启示？ H307A突变能够反转底物选择性的根本原因在于其打开了cavity B的门控。组氨酸是一个相对较大的极性氨基酸（侧链含咪唑环），在307位时其侧链会延伸到cavity B空间，物理性地阻碍了线性底物1b的进入和稳定结合。当突变为丙氨酸（最小的非极性氨基酸）后，cavity B的体积增加了52.8 Å3，这一空间扩展足以容纳1b的延伸链状结构。从结构动力学角度看，MD模拟揭示了更深层的机制：在野生型中，H307的咪唑环与底物形成空间冲突，导致1b无法在活性位点建立稳定的催化构象在M1突变体中，H307A的空间释放使1b能够以合适的角度接近NADPH的C4位（氢负离子给体），并维持这种构象达100 ns以上这一发现对PRISE家族研究具有重要启示。植物PRISE家族也面临同样的底物特异性之谜——为什么结构几乎无法区分的P5βR和IS会表现出对孕酮和8-氧香叶醛的选择性差异？现有研究尝试通过loop区域的动力学、活性位点苯丙氨酸的保守性等因素解释，但结论仍不清晰。本研究提示cavity B大小可能是PRISE家族底物特异性的通用决定因素。考虑到细菌P5βR与植物PRISE的结构同源性，推测植物PRISE中也存在类似的门控残基。未来可以通过比较具有不同底物偏好的PRISE的cavity B结构，识别关键门控位点，进而通过定点突变实现底物选择性的理性调控。 Q3：基于底物特征的理性设计策略为何能普遍适用于不同来源的细菌P5βR？这种策略的局限性在哪里？这一理性设计策略之所以具有普遍适用性，根源在于其基于底物-酶相互作用的普遍原理而非特定酶的个性化特征。孕酮作为底物具有两个显著特点：（1）刚性的四环骨架导致大空间位阻；（2）完全由碳氢骨架组成，具有强疏水性。因此，任何旨在提升孕酮结合和催化的策略，都应该围绕这两个特征展开：减小活性位点的空间位阻：将大侧链残基（如M180、H307）突变为小侧链残基（如A、V），为刚性的类固醇骨架腾出空间，使其能够以最佳角度接近辅酶增加活性位点的疏水性：将极性残基（如D311）突变为疏水残基（如I），增强与类固醇疏水骨架的范德华相互作用这种策略的普适性体现在：研究者在序列同一性仅45-86%的10个不同细菌P5βR上应用M5组合突变（T170V/M180V/H307A/D311I），所有工程化酶的活性均显著提高。这表明这些位点在不同细菌P5βR中具有结构保守性和功能等效性。然而，这种策略也存在局限性：依赖保守的底物结合口袋：如果目标酶的底物结合口袋与LpP5βR差异较大（如关键位点编号不同、腔体形状显著不同），则需要重新识别等效位点可能影响酶稳定性：疏水性增加虽然有利于类固醇结合，但过度突变可能导致酶稳定性下降或溶解度降低（幸运的是，本研究中M5的稳定性良好）底物范围限制：这一策略是针对类固醇骨架优化的，对于其他类型的底物（如线性萜类、小分子酮）可能不适用，甚至产生负面效应上位效应的不可预测性：虽然M5在多个P5βR上都有效，但不同突变的组合效应（epistasis）在不同酶中可能存在差异，最优组合可能需要针对每个酶单独筛选 Q4：LpP5βR-M5的催化效率提高了773倍，但这是否足以支撑工业化应用？还需要解决哪些问题？ LpP5βR-M5的催化效率（$k_\text{cat}/K_\text{m}$ = 348.4 mM-1 min-1）相比野生型（0.45 mM-1 min-1）提高了773倍，这是一个非常显著的改进。从酶工程角度看，单纯依靠理性设计实现如此大幅度的活性提升是相当罕见的（通常理性设计能实现10-100倍提升已属优秀）。从工业化应用的角度评估，LpP5βR-M5已经展现了良好的潜力：优势：克级规模验证：28 g/L底物浓度、2小时内>98%转化率、时空产率330 g/L·d，这些指标已经接近工业化生物催化的要求底物负载量高：28 g/L（约90 mM）已经是相当高的底物浓度，远超大多数酶促反应（通常为1-10 mM）辅酶循环高效：使用GDH循环系统，NADP+仅需0.1 mM（催化量），大大降低了成本异源表达良好：LpP5βR在大肠杆菌中可溶性表达量高，便于大规模生产仍需解决的问题：转化率瓶颈：无论底物浓度如何增加，转化率最多达到98%而无法完全转化，这暗示存在酶催化的可逆性问题。需要通过产物移除或平衡移动策略（如原位产物沉淀、膜分离）来提高最终转化率助溶剂依赖：20% DMSO的使用增加了下游分离成本和环境负担。可以探索使用生物相容性更好的助溶剂（如甘油、PEG）或两相体系（如离子液体、深共晶溶剂）产物抑制：虽然论文未明确提及，但98%转化率上限可能与产物抑制有关。需要研究产物与酶的结合动力学，必要时通过突变降低产物亲和力放大验证：目前仅在100 mL规模验证，工业化需要升至升级甚至吨级，过程中的传质、混合、热管理等工程问题需要解决酶稳定性：论文未报告M5的热稳定性、有机溶剂耐受性、pH稳定性等。工业应用通常需要酶在苛刻条件下仍保持活性，可能需要进一步的稳定性工程（如固定化、定向进化）综合来看，LpP5βR-M5已经是一个准工业化的生物催化剂，但从实验室到工厂仍需要过程工程和进一步的酶优化。关键结论与批判性总结潜在影响系统建立细菌P5βR平台：作者通过基因挖掘获得10条细菌来源P5βR并验证其对孕酮/8-氧香叶醛的活性，证明微生物SDR可弥补植物与动物P5βR在可溶表达和催化效率上的短板 cavity B门控锁定底物偏好：结论强调扩大cavity B即可让线性底物1b稳定结合，单点突变即反转底物选择性，为解析PRISE家族长期未解的底物特异性提供了结构化线索理性工程输出工业级催化剂：基于底物空间位阻与疏水性设计的LpP5βR-M5将$k_\text{cat}/K_\text{m}$提升700余倍，并在28 g/L孕酮条件下实现330 g/L·d的STY，展示了绿色合成5β-二氢类固醇的放大潜力底物谱得到实证扩展：M5对4-androstenedione、hydrocortisone等多种类固醇的高转化度表明该策略可直接支撑多条药物中间体的酶法路线局限性特定骨架仍不可及：底物范围实验显示Δ1-双键或C6-甲基取代会使酶完全失活，说明现有腔体工程尚无法兼容所有类固醇结构线性底物须专属突变：只有扩大cavity B的M1类突变才能高效催化8-氧香叶醛，尚未形成可同时处理线性与类固醇底物的统一方案高效率依赖助溶体系：克级放大实验需要20% DMSO加GDH循环维持28 g/L底物负载，提示与理想工业工艺之间仍存在溶剂与成本压力未来研究方向将门控策略迁移至PRISE：利用细菌P5βR与植物PRISE的同源性，对后者的cavity B位点进行系统比对，验证是否能同样实现底物偏好反转针对难底物继续工程化：围绕Δ1-双键、C6-甲基等难以容纳的骨架开展新的腔体扩展或柔性门控设计，进一步拓宽类固醇谱优化放大流程：在现有28 g/L体系基础上探索低助溶甚至无助溶条件、替代辅酶循环方案与酶固定化策略，以降低工业化成本并提升可持续性

Specific Sytems · 2026-03-08

膜通透化的分子动力学模拟（下篇）：案例研究与机制解析

【综述】膜通透化的分子动力学模拟（下篇）：案例研究与机制解析系列说明：本文是膜通透化MD模拟综述的下篇，聚焦代表性案例，用具体体系解释AMPs与PFTs的成孔机制与关键分子细节。上篇侧重方法与机制分类。本文信息标题：膜通透化的分子动力学模拟（下篇）：案例研究与机制解析作者：Sofia Cresca，Jure Borišek，Alessandra Magistrato，Igor Križaj 发表时间：2026年2月9日单位：Consiglio Nazionale delle Ricerche（CNR）-IOM，意大利；International School for Advanced Studies（SISSA/ISAS），意大利；Jožef Stefan Institute，斯洛文尼亚；National Institute of Chemistry，斯洛文尼亚；University of Ljubljana，斯洛文尼亚引用格式：Cresca, S., Borišek, J., Magistrato, A., & Križaj, I.（2026）。Current Status of Molecular Dynamics Simulations of Membrane Permeabilization by Antimicrobial Peptides and Pore-Forming Proteins: A Review。Journal of Chemical Information and Modeling, 66（6），1982-2005。https://doi.org/10.1021/acs.jcim.5c02731 本文以案例为主线，突出不同分子在膜上形成孔道的具体路径，并对比多尺度MD如何揭示关键分子细节。抗菌肽（AMPs）案例 Melittin：T孔与U孔的双重通道 Pleurocidin：低溶血与环形孔机制 Maculatin 1.1：无序聚集形成水通道 Aurein 1.2：糖脂含量调控孔道寿命成孔蛋白/毒素（PFTs）案例 Cytolysin A（ClyA）：弧形寡聚体与脂质位移 Pneumolysin（Ply）：胆固醇依赖成孔 Aerolysin：前孔到孔道的构象转变 Gasdermin D（GSDMD）：焦亡孔道与阴离子脂质稳定抗菌肽的案例研究这些案例显示，AMPs的膜通透化高度依赖肽构象与脂质环境，而MD模拟提供了可直接观察的构象与相互作用细节。 Melittin：T孔与U孔的双重通道 Melittin是26个残基的经典模型肽。CG与AA模拟一致表明，Melittin聚集后会出现以T肽或U肽为主导的两类孔道构象，对应不同结构与通透性。两类孔道的差别，核心在于疏水与极性残基的分离方式。T孔的疏水与亲水面分离更清晰，因此更稳定、孔径更大、通透性更高，这也是T孔在自由能上占优的关键原因。 T孔与U孔的对比对比要点 T孔 U孔主导构象跨膜T肽为主 U形肽为主结构与能量自由能更低、孔径更大、通透性更高自由能更高、孔径更小、通透性更低 AA模拟进一步表明，成孔过程强烈依赖初始肽构型与膜组成，其中K7的锚定效应是关键开关。K7A与K7Q突变会削弱锚定，从而促进成孔并改变选择性。在革兰氏阴性菌外膜模型中，Melittin的C端锚定在KLA头基区域，其N端与磷酸基接触。KLA是脂多糖（LPS，lipopolysaccharide）的重要成分，这会改变外膜通透性但不扰动双层整体结构。这类外膜结果提示，Melittin更多表现为通透性调节而非整体破坏，这也是它在不同膜环境下表现差异明显的重要原因。补充一点，从外膜到内膜的差异中可以看到锚定位置改变了进入界面的路径，这也解释了同一肽在不同膜体系中的”表型落差”。 Pleurocidin：低溶血活性的分子基础 Pleurocidin具有低溶血活性与高抗菌活性并存的特征。多尺度模拟显示，初始孔道可由2个肽触发，而稳定孔道需要多个肽进一步组装。在孔道形成过程中，Pleurocidin的亲水面构成水通道，而阳离子残基会拉入脂质头基，提示其主要形成环形或无序环形孔。 AA与CG终态都指向环形或无序环形孔，水外排快照中还能清楚看到极性与非极性侧链的分工，这让该机制更容易与图5的子图对应起来。另一个值得记住的点是，Pleurocidin的低溶血表型并不妨碍其在原核膜上形成稳定孔道，这种“强抗菌、弱溶血”的对照在案例中非常清晰。可以这样记初始孔道由少量肽触发，但稳定孔需要更高聚集程度。阳离子残基驱动脂质头基进入孔道，形成典型的环形孔结构。亲水与疏水面的空间分离决定了水通道的连续性。 AA与CG结果方向一致，说明该体系的多尺度解释具有稳定性。水外排快照提供直观证据，极性残基的指向性很明显。低溶血与高抗菌并存，提示膜选择性来自孔道结构差异。 Melittin与Pleurocidin的机制对比对比维度 Melittin Pleurocidin 孔道类型 T孔（跨膜肽）与U孔（U形肽）两类构象环形孔或无序环形孔孔道内壁构成 T孔更偏肽本身，U孔更依赖脂质参与亲水面构成水通道，阳离子残基拉入脂质头基关键残基 K7锚定效应是成孔开关亲水面朝向孔腔初始成孔需要一定数量肽聚集 2个肽即可触发初始孔道稳定性决定因素自由能与孔径联动；疏水/亲水分离方式亲水与疏水面的空间分离膜选择性 KLA锚定强调外膜特异性低溶血与高抗菌并存模拟验证 AA与CG揭示不同构象路径 AA与CG终态指向环形孔图5：不同AMPs的作用机制。子图A：Melittin在CG模拟中形成T孔的过程快照，展示跨膜孔道的逐步稳定化。子图B：Melittin在CG模拟中形成U孔的过程快照，呈现U形构象主导的孔道。子图C：Pleurocidin水外排快照，极性与非极性残基以不同颜色标示，侧链朝向水通道。子图D：Pleurocidin的AA与CG终态对比，左列为AA 500 ns的紫色肽，右列为CG 25 μs的绿色肽，显示其形成环形或无序环形孔的倾向。 Maculatin 1.1：无序聚集形成水通道 Maculatin 1.1的CG模拟表明，肽分子会自发聚集并以无序跨膜簇插入DPPC双层。AA模拟进一步显示，水通过聚集体内部的动态狭窄通道渗透。定量分析给出的关键结论是：至少需要6条肽才能形成显著水通量。该通量主要由Lys8、His12、Glu19与His20等极性与带电残基提供亲水路径。这一案例强调，无序聚集并不等于无效，相反它可以在缺乏规则桶状结构的情况下维持持续导水。多尺度模拟把无序簇与可持续导水直接联系起来，是该案例最有记忆点的地方。 Aurein 1.2：糖脂含量调控孔道寿命 Aurein 1.2的CG模拟使用MARTINI并引入极化水模型（PW）。研究在POPG/POPE混合膜中系统改变单半乳糖甘油酯（MG，monogalactosylglycerol）含量，发现孔道寿命与糖脂含量呈显著负相关。具体而言，研究将MG含量从0%增加至96%，定量数据显示：在无糖脂膜中，孔道持续超过22 μs 在96% MG膜中，孔道仅持续约0.3 μs 孔道寿命缩短超过70倍当糖脂比例升高时，负电荷密度与氢键网络被削弱，从而显著降低孔道寿命，提示膜组成是调控AMP通透化的重要变量。这一结果提醒读者，膜成分梯度本身就是调控变量，并不需要改变肽序列也能显著改变成孔行为。可以这样记膜糖脂含量是强调控因子，可显著缩短孔道寿命。电荷与氢键网络是关键介质，其削弱会削减孔道稳定性。膜组成变化可改变AMP活性谱，为选择性设计提供思路。 MG梯度提供了清晰因果链，便于建立膜成分与孔道寿命的对应关系。负电荷下降是直接原因之一，也解释了高糖脂膜上的孔道短暂性。实验可操作性强，该结论适合用于设计对照膜体系。观察要点 MG含量被系统扫描，因此因果关系更明确。孔道寿命随糖脂升高而缩短，趋势稳定且方向单一。 POPG/POPE是主背景膜，可与其他AMP体系直接对照。高糖脂削弱负电荷与氢键，这是孔道不稳定的核心原因。案例强调膜侧调控，而不是通过肽突变来改写行为。 AMPs案例研究的关键模拟信息（对应PDF Table 2） AMP 方法力场关键发现 Melittin CG-MD MARTINI v2.2 聚集形成跨膜T肽与U肽孔道 Melittin AA-MD CHARMM36m T孔自由能更低、孔径更大、通透性更高 Melittin AA-MD CHARMM36m 成孔依赖初始构型与膜组成；K7锚定，K7A与K7Q削弱锚定并促进成孔 Melittin AA-MD CHARMM36m C端锚定KLA头基；N端接触磷酸基，影响外膜通透性但不扰动双层 Pleurocidin AA-MD + CG-MD CHARMM36m；MARTINI 2条肽可触发初始孔；多肽组装形成稳定孔；亲水面构成水通道，阳离子残基拉入头基，提示环形孔 Maculatin 1.1 AA-MD + CG-MD GROMOS96；MARTINI 自发聚集为无序跨膜簇；水通过动态通道渗透；至少6条肽产生显著水通量 Aurein 1.2 CG-MD MARTINI（极化水模型）孔道寿命与糖脂含量负相关，高糖脂削弱负电荷与氢键网络，从而缩短寿命读表提示 Melittin出现多次，体现其在AMP研究中的模型地位，同时揭示不同力场与尺度下结果的一致性。自由能与孔道形态成对出现，T孔的稳定性与更高通透性相互印证。关键残基信息具有可迁移性，K7锚定效应与KLA相互作用可直接用于突变与设计。 Pleurocidin强调少量肽即可触发成孔，但稳定孔需要多肽组装，提示协同机制。 Maculatin 1.1与Aurein 1.2突出膜组成作用，显示脂质环境可显著调控孔道寿命与水通量。 AMPs关键词速查 AMP 机制关键词关键分子或结构脂质依赖 Melittin T孔与U孔分流 K7锚定、KLA头基外膜LPS显著影响 Pleurocidin 环形与无序环形孔亲水面朝孔腔头基拉入驱动 Maculatin 1.1 无序聚集导水 Lys8/His12/Glu19/His20 DPPC为主要模型 Aurein 1.2 糖脂调控寿命 MG含量梯度糖脂升高缩短寿命读表提示关键词用于快速定位机制，便于在多个案例间做横向对照。关键分子或结构是最小解释单元，适合直接映射到突变或膜成分设计。脂质依赖提醒环境敏感性，避免将结果误读为“序列决定一切”。成孔蛋白/毒素的案例研究 PFTs的成孔过程涉及更复杂的寡聚化与构象重排，MD模拟揭示了从单体到环状孔道的关键分子步骤。 PFTs案例对比总览对比维度 Cytolysin A (ClyA) Pneumolysin (Ply) Aerolysin Gasdermin D (GSDMD) 毒素类型 α-PFT β-PFT（胆固醇依赖性溶素） β-PFT 真核成孔蛋白（焦亡效应蛋白）关键结构特征弧形寡聚体（6-10聚体） D1-D4四个结构域膜结合域+成孔域，双同心β桶直径10-14 nm环状孔道（24-33亚基）膜结合机制单体即可形成稳定跨膜水通道胆固醇是必要受体与稳定因子 DBB与stem loop驱动前孔形成前孔组装对阴离子脂质高度敏感关键结构域/残基 N端螺旋CRAC基序、β舌 D4结构域、十一肽、L1-L3环 Y221构象开关、DBB区域 PI(4,5)P2与PS稳定前孔成孔过程脂质快速位移（约50 ns） β发夹插入→β桶→脂质斑块囊泡化活塞式高幅度运动驱动插入较小寡聚体形成稳定含水孔道脂质依赖性胆固醇增强成孔（双通道效应）胆固醇决定结合稳定性膜触发活塞式运动阴离子脂质（PI、PS、心磷脂）中间体弧形寡聚体是稳定功能中间体部分插入弯曲膜，42聚体环是结构节点前孔态（双同心β桶）前孔组装态孔道特征单体即可导水；脂质重排成环形构型外疏水、内亲水β桶膜触发跨膜桶插入环状孔道，直径10-14 nm Cytolysin A：弧形寡聚体与脂质位移 ClyA是典型的α-PFT。AA模拟显示，单个原聚体即可形成稳定的跨膜水通道。此外，基于晶体结构构建的6到10聚体弧形寡聚体是稳定的功能中间体，并在约50 ns内驱动脂质位移，形成可导水的膜孔。弧形寡聚体内部原先困住的脂质会被迅速排出，开放边缘的脂质再排列成环形构型，从而把弧形中间体转化为可持续导水的孔道。胆固醇通过两条路径增强ClyA成孔：一是稳定原聚体的膜结合构象，二是在β-舌（β-tongue，即β-发夹）之间形成桥接相互作用从而促进寡聚化，整体上偏向成孔构象。更细的描述是，胆固醇既能与N端螺旋上的CRAC基序（cholesterol recognition/interaction amino acid consensus，胆固醇识别/相互作用氨基酸共有基序）相互作用，也能在相邻β-舌之间形成桥接，帮助寡聚体向成孔构象偏转。这些细节合起来指向一个清晰图景：ClyA的成孔过程既依赖中间体稳定性，也依赖胆固醇对寡聚化路径的”推一把”。 Pneumolysin：胆固醇依赖成孔 Ply是典型的胆固醇依赖性溶素。AA模拟显示，D4结构域中的富Trp的十一肽以及L1至L3环负责膜表面锚定，且只有在胆固醇存在时，Ply才能稳定结合膜。 Ply单体由D1至D4四个结构域构成，其中两个螺旋束（HB1与HB2）会在成孔过程中重排为β-发夹，最终组装成β-桶，这一结构变化与胆固醇依赖的膜结合行为高度耦合。成孔阶段的β发夹插入后会形成外疏水、内亲水的β桶，内壁水化驱动脂质重新排列并打开膜边缘。CG模拟进一步表明，完整的42聚体环会包裹脂质斑块，使其脱离并囊泡化，从而形成开放孔道。这一过程中，胆固醇与十一肽及L1环发生短暂相互作用，帮助Ply维持正确取向，随后β桶形成并触发脂质斑块的囊泡化，是孔道真正打开的关键步骤。 Aerolysin：前孔到孔道的构象转变 Aerolysin家族的单体包含膜结合域与成孔域，可组装成双同心β-桶（concentric double β-barrel，DBB）前孔。AA模拟显示，DBB与茎环（stem loop）的运动驱动前孔形成，而Tyr221对二级结构重排至关重要。 Y221G突变体可寡聚但停留在前孔态，这一现象从侧面说明Y221是构象开关，也是前孔到孔道转变的核心障碍之一。当蛋白置于膜中时，会出现活塞式高幅度运动，该运动由膜触发并推动跨膜桶的插入，从而完成从前孔到孔道的转变。 Gasdermin D：焦亡孔道与阴离子脂质稳定 GSDMD是细胞焦亡的关键效应蛋白。AA模拟表明，较小的GSDMD寡聚体也能形成稳定含水孔道。其孔道稳定性依赖阴离子脂质，前孔组装对阴离子脂质高度敏感，其中磷脂酰肌醇-4,5-二磷酸（PI(4,5)P2，phosphatidylinositol-4,5-bisphosphate）与磷脂酰丝氨酸（PS，phosphatidylserine）可稳定前孔。PI(4,5)P2还能作为分子双面胶，桥接并稳定相邻亚基界面。此外，Gasdermin家族总体上偏好富含磷脂酰肌醇与心磷脂的膜，并形成直径约10-14 nm的环状孔道，孔道由24至33个亚基构成，这为焦亡过程中分子释放提供结构基础。这些特征说明，GSDMD的孔道在结构上属于高亚基数的大孔道，而其稳定性更依赖脂质环境而非单一蛋白构象。图6：不同PFTs的作用机制。子图A：ClyA弧形寡聚体在1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱（POPC，phosphatidylcholine）膜中的快照，红色蛋白与蓝色脂质显示0 ns与50 ns内脂质位移并形成水通道。子图B：Ply在无胆固醇与有胆固醇条件下的膜结合对比，插图显示与胆固醇相互作用的残基区域。子图C：Aerolysin前孔与完整孔道的对比，关键残基以高亮方式标示。子图D：GSDMD从单体到十聚体的寡聚化序列，展示孔道逐步形成的结构轨迹。读图时可以留意 ClyA弧形结构可直接产生导水通道，并伴随脂质位移，这是其功能性中间体的关键证据。 Ply是否存在胆固醇决定结合稳定性，对比图清晰展示膜结合差异与关键残基作用。 Aerolysin前孔与完整孔道的几何差异明显，提示前孔到孔道的构象重排幅度很大。 GSDMD序列图强调寡聚化路径，单体到十聚体的过程展示孔道逐步完成的结构基础。 PFTs案例研究的关键模拟信息 PFT 方法力场关键发现 ClyA AA-MD；CG-MD（含牵引MD与PMF） AMBER99SB-ILDN；Slipids；MARTINI（ElNeDyn，极化水模型）单个原聚体形成稳定水通道；弧形寡聚体为稳定中间体并快速形成跨膜通道 ClyA AA-MD AMBER99SB-ILDN；Slipids 胆固醇稳定原聚体构象并促进寡聚化，偏向成孔构象 Ply AA-MD + CG-MD（ElNeDyn） CHARMM36m；MARTINI v2.2 胆固醇稳定Ply结合；β发夹插入后42聚体环可包裹并囊泡化脂质斑块以形成孔道 Aerolysin AA-MD AMBER99SB DBB与stem loop驱动前孔形成；Y221决定重排；膜触发活塞式运动推动插入 GSDMD AA-MD CHARMM36m 小寡聚体形成稳定含水孔；PI（4,5）P2与PS稳定前孔组装读表提示 ClyA强调弧形中间体的功能性，并展示AA与CG结合的分析路径。 Ply突出胆固醇依赖性，其成孔路径与膜组成强耦合。 Aerolysin展示大幅度构象重排，体现前孔到孔道的能垒特征。 GSDMD体现阴离子脂质稳定效应，并指向焦亡孔道形成的膜选择性。 PFTs关键词速查 PFT 机制关键词关键分子或结构脂质依赖 ClyA 弧形中间体导水 CRAC基序、β舌桥接胆固醇促进寡聚化 Ply 囊泡化开孔十一肽与L1-L3环胆固醇是必要因子 Aerolysin 前孔重排插入 DBB与stem loop 膜触发活塞运动 GSDMD 阴离子脂质稳定 PI（4,5）P2桥接 PS与PI协同稳定读表提示关键词强调机制差异，便于把不同PFTs放在同一框架下理解。关键结构指向成孔开关，也是最可能的干预靶点。脂质依赖体现宿主选择性，与毒性谱密切相关。案例之间的对照 Melittin的T孔与U孔主要由肽构象分流，而Pleurocidin更强调头基被拉入孔道的环形孔特征。 Maculatin 1.1体现无序聚集导水，Aurein 1.2则突出膜糖脂含量决定孔道寿命。 ClyA与Ply都受胆固醇影响，但ClyA更像稳定中间体驱动成孔，Ply更像寡聚环触发囊泡化。 Aerolysin强调前孔到孔道的构象重排，GSDMD强调阴离子脂质稳定前孔。 Melittin与Maculatin 1.1的共同点是构象驱动成孔，但前者更规则，后者更无序。 Pleurocidin与Aurein 1.2都强调膜成分调控，一个靠头基拉入，一个靠糖脂比例。 ClyA与Aerolysin都涉及大尺度构象变化，但ClyA先功能化，Aerolysin先重排。 Ply与GSDMD都形成大孔道，但Ply依赖胆固醇平台，GSDMD依赖阴离子脂质环境。 Melittin的外膜作用展示通透性调节，与Ply的囊泡化路径形成鲜明对照。 GSDMD的小寡聚体导水与ClyA弧形中间体导水在尺度上可类比，但脂质依赖相反。小结这些案例共同指向一个核心事实：膜通透化并非单一机制，而是由肽或蛋白构象、寡聚路径与脂质环境共同塑造。MD模拟让这些过程的关键分子步骤可视化，并为机制分类提供了直接证据。从Melittin到GSDMD，研究显示成孔既可能是快速的局部重排，也可能依赖长程的构象与寡聚化协同。这些认识为后续的机制比较与实验设计提供了可操作的结构线索。

Specific Sytems · 2026-03-06

偶极复合驱动的聚电解质凝聚：从离子熵到相图

Specific Sytems · 2026-03-01

均聚物也能自组装：驱动力、设计策略与应用全景

Specific Sytems · 2026-02-19

透明质酸的多层次渗透增强机制：从水合膨胀到脂质双层插入

透明质酸的多层次渗透增强机制：从水合膨胀到脂质双层插入前情提要：本文是角质层结构深度解析的姊妹篇，专注于透明质酸（HA）及其衍生物影响皮肤屏障通透性的分子机制。建议先阅读主文了解角质层的多尺度结构组织。天然HA的物理化学渗透机制虽然前文揭示了HA实际上增强而非打开紧密连接（上调claudin-3/4和JAM-1），但天然HA确实能够通过多种物理化学机制间接影响角质层的通透性。这些机制不依赖于紧密连接的松弛，而是通过改变角质层的微观结构和水合状态来实现。渗透压驱动的水合膨胀机制 HA的核心物理化学特性源于其聚电解质性质和极高的水结合能力。分子基础 HA分子链上的羧基（-COOH）在生理pH下解离，产生高密度的负电荷。这些负电荷通过两种方式驱动水合：静电吸引：负电荷吸引正离子（$\ce{Na+}$、$\ce{K+}$等），形成离子氛渗透压：反离子解离导致的聚电解质性质产生高渗透压，将水分子吸入HA网络 HA的渗透压比典型中性聚合物溶液高数倍，这使得HA能够结合高达自身重量1000倍的水分，并在细胞外基质中结构化一个水合且稳定的细胞外空间。角质层的水合膨胀响应当HA渗透角质层后，其强大的吸水能力引发角质层的剂量依赖性膨胀：时间依赖性变化 4小时水合：角质层厚度膨胀3-4倍，角质细胞均匀膨胀（除最外层和最内2-4层膨胀较少） 24小时水合：细胞间隙出现大量水池（cisternae），直径从数百纳米至数微米不等，尺寸可超过膨胀后的角质细胞厚度（>600 nm）空间选择性角质层外层和层间区域：可自由膨胀角质层致密层（stratum compactum）第一层：膨胀能力有限，提供屏障功能细胞间水池的形成：为亲水物质提供了异常的水性渗透通道脂质层的破坏性重排水合膨胀不仅影响角质细胞，更关键的是对细胞间脂质层的结构破坏。脂质层的相变和流动化研究显示，在高相对湿度（91-94% RH）下，角质层脂质发生三种放热相转变：正交→六方链排列转变：临界阈值在85% RH，此时脂质链流动性显著增加脂质双层周期性改变：SPP（6 nm）和LPP（13 nm）的有序排列受到扰动脂质膨胀vs角质细胞膨胀的差异：低RH时角质细胞吸水更多，高RH时脂质膨胀更显著脂质层的病理性破坏长时间水合暴露（4-24小时）导致不可逆的脂质层破坏：脂质分层脱离（delamination）：脂质双层从角质细胞表面剥离卷曲塌陷（roll-up）：在水池内，脂质结构卷曲形成无序堆积相分离：脂质组分发生相分离，丧失原有的有序层状结构关键认知：这种破坏性重排虽然为亲水物质提供了渗透窗口，但属于病理性状态而非生理性渗透增强。LMW-HA能穿透角质层正是因为它诱导了这种破坏（TEWL增加55.5%）。角蛋白二级结构的改变 HA不仅影响脂质层，还能改变角质层中角蛋白的二级结构，这进一步促进了角质层的软化和通透性增强。 FTIR光谱证据：分子量依赖的差异化效应 Witting等（2015，Molecular Pharmaceutics）的傅里叶变换红外光谱（FTIR）研究系统揭示了不同分子量HA处理后角质层蛋白和脂质的显著结构变化，发现了分子量依赖的差异化效应：角蛋白二级结构的重排 α-螺旋→β-折叠转换：100 kDa和1 MDa HA处理后，角蛋白的二级结构发生从α-螺旋向β-折叠的转变，这种构象变化通常意味着蛋白质从有序结构向更伸展、更易聚集的状态转变 Amide I/II峰强度变化：角蛋白特征峰（Amide I约1650 cm⁻¹，Amide II约1550 cm⁻¹）的相对强度发生改变，表明蛋白质有序结构被破坏角质细胞骨架软化：这种二级结构转变使角质细胞骨架变得更柔软、更易变形，为物质渗透创造了条件脂质层结构的同步扰动 FTIR分析同时揭示了HA与角质层脂质的强烈相互作用： CH₂伸缩振动峰位移：脂质烷基链的CH₂对称伸缩振动（~2850 cm⁻¹）和非对称伸缩振动（~2920 cm⁻¹）峰位置和强度的变化，直接反映脂质链构象和有序度的改变脂质-水相分离变化：HA处理后脂质层的相分离行为发生改变，表明HA干扰了脂质的正常自组装分子量依赖的脂质相互作用：100 kDa HA与脂质的相互作用最为强烈，导致脂质双层排列更加无序，这与其最佳的渗透增强效应一致脂质构象的同步变化 Kozaka等使用标记HA的反向胶束处理角质层，FTIR分析显示脂质链的构象也发生了改变：全反式→gauche构象转变：角质层脂质的CH₂对称/非对称伸缩峰从规整的全反式（all-trans）构象转变为无序的gauche构象脂质流动性增加：gauche构象的增加直接证明脂质链的流动性显著提高，脂质双层变得更松散细胞间通道形成：荧光显微成像显示HA主要沿细胞间通道分布，印证了HA通过破坏脂质层团簇形成”通水”路径的机制 HA同时改变角蛋白和脂质的结构，产生蛋白-脂质协同效应：角蛋白软化降低了角质细胞的机械刚性，脂质流动化削弱了细胞间的防水屏障，两者共同作用使角质层整体变得更易穿透。 FLIM-FRET揭示的HA-蛋白共定位与协同运输机制 Witting等（2015）利用荧光寿命成像显微技术（FLIM）和荧光共振能量转移（FRET），深入研究了HA与模型蛋白牛血清白蛋白（BSA）在皮肤中的共定位和相互作用，发现了关键的协同运输机制：实验设计：模型蛋白：BSA（66 kDa，代表性生物大分子） HA分子量：5 kDa（低分子量）、100 kDa（中分子量）、1 MDa（高分子量）皮肤模型：正常皮肤 vs 胶带剥离的屏障缺陷皮肤检测方法：FLIM定位分布、FRET验证分子间相互作用关键发现：正常皮肤中的渗透增强效应：单独BSA：难以渗透，主要停留在皮肤表面 5 kDa HA + BSA：显著促进BSA渗透进入表皮，FRET分析证实HA与BSA存在紧密相互作用（距离<10 nm） 100 kDa和1 MDa HA：对BSA渗透的促进作用较弱机制：低分子量HA（5 kDa）本身渗透性更好，能够”携带”BSA通过协同运输（cotransport）机制进入表皮屏障缺陷皮肤中的限制效应：单独BSA：在胶带剥离（屏障缺陷）皮肤中可渗透至真皮层 HA + BSA：反而限制BSA的渗透，使其主要停留在表皮层机制：HA与BSA形成复合物，增加了有效分子尺寸，且HA的粘弹性使其更易滞留在表皮的水性环境中皮肤水合作用的定量证据：水合作用增强：FTIR显示HA处理显著增加角质层含水量水合通道形成：水合作用为亲水性大分子创造了渗透通道分子量依赖：不同分子量HA的水合能力不同，影响渗透效果 FRET验证的HA-BSA相互作用： FRET效率：5 kDa HA与BSA的FRET效率最高，表明两者距离最近协同运输：HA与BSA形成松散复合物，通过HA的渗透”拉动”BSA进入皮肤释放机制：进入表皮后，HA-BSA复合物可能解离，释放游离BSA 临床意义：正常皮肤：HA可用作生物大分子经皮递送的渗透增强剂，特别是低分子量HA（5 kDa）屏障缺陷皮肤（如湿疹、银屑病）：HA可能起到保护作用，限制外源大分子的过度渗透，避免触发免疫反应分子量选择：不同分子量HA具有截然不同的渗透特性，需根据应用场景选择 FLIM揭示的HA自身渗透分布特征 Witting等（2015）的FLIM研究还直接观察了不同分子量HA在皮肤中的渗透分布：渗透深度与分子量的关系： 5 kDa HA：能够渗透至角质层深层和表皮浅层 100 kDa HA：主要分布在角质层表层和中层 1 MDa HA：主要停留在角质层最外层渗透途径选择：跨细胞途径：荧光信号显示HA主要分布在角质细胞内部而非细胞间隙细胞间途径：部分HA沿细胞间通道分布，特别是脂质层被HA扰动后时间依赖性累积：短期（<4小时）：HA主要分布在角质层表层长期（>24小时）：HA逐渐渗透至更深层，并累积在角质层-表皮交界处这些FLIM-FRET发现为理解HA的渗透增强机制提供了直接的视觉证据，解释了为何HA能够在不严重破坏屏障的前提下促进生物大分子的经皮递送。 Filaggrin-NMF调控途径 HA还通过调控角质形成细胞分化和NMF生成，间接影响角质层的水合能力和微观结构。 LMW-HA对Filaggrin降解的促进研究发现，约50 kDa的LMW-HA影响角质形成细胞分化相关基因表达： CASP14表达和活性增加：CASP14在颗粒层和角质层中高表达，负责将Filaggrin片段切割为自由氨基酸促进NMF生成：Filaggrin降解产生的自由氨基酸及其衍生物（PCA、组氨酸、UCA）占角质层自由氨基酸总量的70-100% 影响紧密连接复合物形成：LMW-HA还影响参与角质形成细胞分化和细胞间紧密连接复合物形成的基因 NMF对角质层通透性的影响 NMF作为高效吸湿剂，其浓度增加会：增强角质层水合：NMF的吸湿能力进一步提高角质层含水量促进角质细胞可塑性：水合后的角质细胞更柔韧，细胞间间隙更易扩张协同HA的渗透压效应：NMF与HA共同维持角质层的水合梯度旁细胞通透性的MLCK介导调控除了物理性的水合膨胀，HA还通过信号通路调控细胞间通透性。 MLCK-肌球蛋白轻链途径研究显示，HA通过磷酸化肌球蛋白轻链（p-MLC）介导旁细胞通透性： MLCK激活：HA触发肌球蛋白轻链激酶（MLCK）活性肌动蛋白-肌球蛋白相互作用：p-MLC调控肌动蛋白-肌球蛋白相互作用，从而调节细胞收缩旁细胞通透性上调：细胞收缩导致细胞间隙暂时扩大，增加旁细胞通透性这一机制解释了为何HA能够在不破坏紧密连接蛋白表达的前提下，仍能增强物质的旁细胞转运。 HA衍生物的强化渗透机制天然HA的物理化学机制虽能影响角质层通透性，但效果有限且伴随屏障损伤。化学修饰的HA衍生物和阳离子聚合物通过引入正电荷、疏水基团或利用金属离子桥接，能够实现更强的静电相互作用和脂质层插入，从而突破天然HA的渗透限制。跨细胞vs旁细胞途径的选择性 HA及其衍生物的渗透途径高度依赖于分子结构和配方设计。天然HA的跨细胞优先研究表明，天然HA优先通过跨细胞途径渗透皮肤：亲水性HA：沿跨细胞路径分布在角质层中疏水性化合物：则通过细胞间路径渗透 HA纳米粒（HANP）：渗透途径与天然HA不同，可能增强细胞间渗透两亲性HA衍生物的增强效应两亲性HA修饰可显著改变渗透行为：两亲性HA-胶束：药物沉积显著增加荧光标记追踪：显示两亲性HA通过跨细胞途径转运疏水修饰：使HA能够与脂质层相互作用，促进细胞间渗透硫酸化HA的构象依赖渗透增强机制 Cilurzo等（2014，Chemistry & Biodiversity）通过Franz扩散池实验、荧光标记追踪和分子动力学模拟，系统揭示了硫酸化透明质酸（HAS）的渗透增强机制，发现了构象决定渗透的关键规律。硫酸化修饰的独特策略与阳离子化（引入正电荷）和两亲性修饰（引入疏水基团）不同，硫酸化修饰通过在HA骨架上引入硫酸基团（-OSO₃⁻）改变分子性质：极性 paradox：硫酸化使HA极性显著增强，理论上应降低渗透性实验反常现象：HAS的渗透性反而高于未修饰HA 硫酸化程度：研究比较了两个硫酸化程度（低度和高度硫酸化）分子量范围：低分子量（LMW，50-200 kDa）vs 中分子量（MMW，500-800 kDa） Franz扩散池的定量证据使用人表皮作为膜，Franz扩散池实验获得了渗透性的定量数据：硫酸化增强效应： HAS > HA：无论硫酸化程度如何，HAS的渗透性均优于对应分子量的HA LMW-HAS > MMW-HAS：低分子量HAS渗透性最佳硫酸化程度差异：低度和高度硫酸化HAS的渗透性差异不大，说明硫酸化本身而非硫酸化程度是关键分子量依赖性： LMW-HA > MMW-HA：分子量是渗透性的主要限制因素分子体积效应：大分子难以通过角质层的狭窄间隙（40-75 nm）协同效应：低分子量+硫酸化=最佳渗透组合荧光标记追踪的跨细胞途径证据 Cilurzo等使用荧光标记多糖，通过共聚焦激光扫描显微镜（CLSM）直接观察了HA/HAS在皮肤中的分布：角质细胞高亲和力：荧光信号分布：HA/HAS主要分布在角质细胞内部，而非细胞间隙结合滞留：HA对角质细胞有高亲和力，可能通过与角蛋白或细胞内成分的结合而滞留跨细胞途径主导：这一发现直接支持了跨细胞途径（transcellular route）是HA渗透的主要路径与疏水化合物的对比：亲水性HA/HAS：通过跨细胞途径疏水性化合物：通过细胞间途径（脂质双层）路径选择机制：分子的亲脂-亲水平衡决定了渗透路径的选择分子动力学模拟揭示的构象-渗透关系 Cilurzo等（2014）的分子动力学（MD）模拟研究首次从原子水平揭示了多糖构象与皮肤渗透性的定量关系，这是该研究最独特的贡献：模拟设计：体系：LMW-HA、MMW-HA及其硫酸化衍生物力场：GLYCAM力场（专门用于糖类模拟）溶剂：显式水模型模拟时长：100 ns级别分析指标：回转半径（Rg）、末端距（Ree）、柔性、构象熵关键发现：构象决定渗透伸展构象→高渗透： HA/HAS渗透性与伸展构象比例呈正相关伸展构象特征：大回转半径（Rg）、大末端距（Ree）、低链内折叠渗透优势：伸展构象的分子更”线形化”，更易通过角质层间隙柔性构象→高渗透：柔性指标：二面角波动、构象熵柔性优势：柔性分子可以”扭曲”通过狭窄通道与伸展的协同：最佳渗透分子兼具伸展性和柔性硫酸化增强柔性和伸展：电荷排斥：硫酸基团（-OSO₃⁻）引入额外的负电荷，增加链内静电排斥构象舒展：静电排斥使HA链更加伸展，减少折叠柔性增加：硫酸化糖苷键的旋转自由度增加，分子更柔性分子量的构象限制： LMW-HA：短链更易伸展和柔性化，渗透性好 MMW-HA：长链易发生链内折叠和缠绕，形成刚性团块，渗透性差临界分子量：存在一个分子量阈值，超过该值后构象变得过于刚性物理图像：渗透性好的HA分子特征： ├─ 伸展（大Rg、大Ree） ├─ 柔性（高二面角波动） ├─ 低链内氢键/堆叠 └─ 可通过扭曲适应狭窄通道渗透性差的HA分子特征： ├─ 折叠（小Rg、小Ree） ├─ 刚性（低二面角波动） ├─ 高链内氢键/堆叠 └─ 形成团块难以通过与其他渗透增强机制的对比硫酸化 vs 阳离子化：硫酸化：通过改变分子构象（更伸展、更柔性）增强渗透阳离子化：通过静电相互作用与脂质层结合，增强吸附机制差异：硫酸化不影响脂质层，而是优化分子本身的”穿透形状” 硫酸化 vs 两亲性修饰：硫酸化：保持亲水性，适用于亲水性药物递送两亲性：引入疏水锚，与脂质层插入相互作用应用场景：硫酸化更适合需要维持亲水性的场合与Witting 2015的协同： Cilurzo 2014：聚焦正常皮肤，硫酸化通过构象优化增强渗透 Witting 2015：对比正常vs屏障缺陷皮肤，发现HA在屏障缺陷皮肤反而限制过度渗透互补性：两者共同揭示了HA渗透的分子机制（构象）和生理调节（屏障状态）临床转化意义 Cilurzo等（2014）的研究为HA基经皮递送系统的设计提供了重要指导：分子设计原则：低分子量优先：LMW-HA（50-200 kDa）渗透性显著优于MMW-HA 硫酸化增强：硫酸化是有效的渗透增强策略，且不影响生物相容性构象导向：通过化学修饰调控分子构象（伸展性、柔性）是设计关键安全性优势：无脂质破坏：硫酸化不破坏角质层脂质结构，TEWL不增加生物相容性：硫酸化HA是天然糖胺聚糖的类似物（类肝素结构）可逆修饰：硫酸化可通过酶解逆转，体内代谢良好应用前景：生物大分子递送：适用于蛋白质、核酸等亲水性大分子的经皮递送疫苗递送：硫酸化HA可作为疫苗佐剂和递送载体基因治疗：用于siRNA、质粒DNA等核酸药物的经皮递送 HA衍生物和阳离子聚合物的紧密连接与脂质双层扰动机制前述机制主要关注天然HA的物理化学作用，但化学修饰的HA衍生物和阳离子聚合物能够通过更强的静电相互作用和脂质层插入，实现更高效的屏障破坏和细胞间通道打开。阳离子HA的静电相互作用增强机制阳离子HA通过季铵化修饰引入正电荷，这种电荷反转带来独特的渗透增强效应：静电吸附与脂质头基交联电荷匹配：阳离子HA的正电荷（$\ce{-N+{(CH_3)_3}}$）与角质层脂质双层的负电磷脂头基（磷酸基团，$\ce{-PO4^-}$）产生强静电吸引，增强HA在脂质界面的吸附和累积脂质头基桥接：阳离子基团可能桥接相邻的负电磷脂分子，扰动脂质双层的规则排列，诱导局部相分离和流动性增加渗透增强数据：阳离子HA在30秒内使皮肤水合度比LMW-HA高67%，比HMW-HA高50%，显示出显著的快速渗透能力紧密连接蛋白的双重效应矛盾现象：虽然阳离子HA增强皮肤渗透，但研究表明HA（包括LMW和HMW）实际上上调紧密连接蛋白（claudin-3/4, JAM-1）的表达，增强屏障而非打开可能机制：阳离子HA的渗透增强可能主要通过脂质层扰动和跨细胞途径实现，而非松弛紧密连接。紧密连接蛋白上调可能是细胞对渗透增强剂的补偿性保护反应阳离子聚合物的紧密连接打开机制：壳聚糖的典型案例壳聚糖作为经典的阳离子渗透增强剂，其紧密连接打开机制已被深入研究，为理解阳离子HA的作用提供重要参考：跨上皮电阻（TEER）的剂量依赖性降低壳聚糖使Caco-2细胞单层的TEER降低高达83% 伴随辣根过氧化物酶通透性增加18倍，证实旁细胞通透性显著上调紧密连接蛋白的细胞骨架重定位 ZO-1和occludin转移：从细胞膜和胞质部分剂量依赖性地转移到细胞骨架部分蛋白降解vs重定位：紧密连接蛋白总量不变，但从膜上移除并锁定在细胞骨架上，导致紧密连接功能性丧失整合素介导的信号级联整合素受体激活：壳聚糖与细胞膜整合素受体直接相互作用，改变受体构象整合素聚集：激活的整合素沿细胞边界聚集信号转导：触发F-actin重组、FAK磷酸化、Src磷酸化 ZO-1下调：上游信号最终导致ZO-1从紧密连接脱离二价阳离子的调控作用壳聚糖的紧密连接打开效应受细胞外Ca²⁺、Mg²⁺和Mn²⁺浓度影响二价阳离子可能通过桥接脂质双层或稳定紧密连接蛋白复合物，部分拮抗壳聚糖的作用可逆性壳聚糖诱导的TEER降低和紧密连接蛋白重定位是瞬时可逆的移除壳聚糖后，紧密连接结构和功能逐渐恢复对阳离子HA的启示阳离子HA可能通过类似的整合素-细胞骨架途径影响紧密连接但由于阳离子HA的研究显示其上调而非下调紧密连接蛋白，提示阳离子HA的正电荷密度、分子量或修饰度可能不足以触发壳聚糖样的强紧密连接破坏阳离子HA的渗透增强更可能依赖脂质层相互作用而非紧密连接松弛金属离子的脂质双层桥接与构象调控机制二价金属阳离子（$\ce{Ca^2+}$、$\ce{Mg^2+}$）通过独特的桥接机制同时影响HA分子和脂质双层： HA分子的构象收缩静电屏蔽：$\ce{Mg^2+}$结合HA链上的羧基（$\ce{-COO^-}$），中和负电荷，减少链内和链间静电排斥构象塌缩：HA从扩展的刚性构象收缩为紧凑的柔性构象，流体力学半径减小渗透增强：紧凑的HA分子更易穿透角质层间隙（40-75 nm）脂质双层的桥接与脱水磷脂头基桥接：$\ce{Ca^2+}$和$\ce{Mg^2+}$结合带负电的磷脂头基（磷酸基团和羧基），形成阳离子桥（cation bridge），屏蔽负电荷，减少静电排斥脱水效应：阳离子结合导致磷脂头基脱水，磷酸基团失去水合层双层结构改变：脱水引起脂质双层厚度改变、有序性增加、分子紧密堆积 Ca²⁺ vs Mg²⁺的功能差异融合能力：$\ce{Ca^2+}$能诱导脂质双层融合，$\ce{Mg^2+}$只能诱导聚集但不融合结合模式：$\ce{Ca^2+}$倾向于结合两个磷脂分子的羧基和磷酸基团，形成双齿配位；$\ce{Mg^2+}$结合模式不同对HA递送的影响：$\ce{Mg^2+}$增强HA在脂质界面的累积但保持双层完整性，$\ce{Ca^2+}$可能诱导局部融合和重排脂质双层刚性与通透性的矛盾刚性增加：阳离子桥接和脱水使脂质双层电阻增加、刚性增强，理论上应降低通透性 HA累积：但$\ce{MgCl2}$配方显著增加HMW-HA在角质层的累积，提示$\ce{Mg^2+}$更多是通过改变HA构象而非破坏脂质层来增强渗透局部扰动：高浓度阳离子可能在脂质双层产生相分离和微区重排，创造渗透窗口 Shiseido的”Shape-Shifting”技术利用金属离子对HA构象的可逆调控，Shiseido开发了一种创新的”形状转换“（Shape-Shifting）递送策略：第一步（渗透阶段）：使用$\ce{Mg^2+}$诱导HA分子收缩 $\ce{Mg^2+}$结合HA的羧基，中和负电荷 HA从扩展构象收缩为紧凑构象，流体力学半径减小收缩后的HA更易穿透角质层的狭窄间隙（40-75 nm） $\ce{MgCl2}$还能抑制HA在皮肤表面的沉淀和聚集，使其均匀分散第二步（保湿阶段）：应用络合剂中和$\ce{Mg^2+}$ 络合剂螯合$\ce{Mg^2+}$，解除对HA的静电屏蔽 HA重新展开，恢复其高度水合的扩展构象扩展的HA发挥强大的保湿和屏障修复功能双步策略的优势：先渗透、后保湿：巧妙地利用HA构象的可逆变化，实现了”既能进去，又能留住”的效果高分子量HA的应用：使得即便是HMW-HA也能渗透进角质层，而传统方法只有LMW-HA能渗透屏障友好：相比LMW-HA诱导的脂质破坏（TEWL增加55.5%），这种方法对皮肤屏障的损伤更小这一技术体现了金属离子-HA构象调控在透皮递送中的实际应用价值，也为其他大分子的透皮递送提供了设计思路。两亲性HA的脂质双层插入与相互作用两亲性HA（如胆固醇、神经酰胺修饰）通过疏水锚定实现与脂质双层的深度相互作用：疏水修饰的分子设计两亲性HA的设计基于HA本身的部分两亲性特征：天然HA的部分两亲性：HA骨架含有可形成氢键的羟基（-OH）和羧基（-COOH），在水合状态下呈现部分两亲性结构。这种天然的两亲性为疏水修饰提供了基础疏水锚的引入：通过化学接枝将疏水基团共价连接到HA链上，包括：胆固醇（Cholesterol）：模拟细胞膜组分，增强膜亲和性神经酰胺（Ceramide）：角质层脂质的关键成分，靶向脂质双层己酸（C6, Caproic acid）：中链脂肪酸油酸（C18:1, Oleic acid）：长链不饱和脂肪酸，提高膜流动性两亲性结构：亲水的HA主链 + 疏水的锚定基团，形成两亲性聚合物特定疏水修饰的功能差异 Smejkalova等的研究揭示了不同疏水修饰对细胞摄取和膜流动性的影响： HA-己酸（HA-C6）：中链长度，适度疏水性能够快速进入角质细胞改变细胞膜流动性 HA-油酸（HA-C18:1）：长链不饱和脂肪酸，强疏水性与膜的亲和性更高通过被动内吞途径高效进入细胞载药微粒显著提高膜流动性 HA-胆固醇（HA-Chol）： De Oliveira等报道，HA-Chol修饰的脂质体透皮效率远高于普通脂质体胆固醇锚定使载体能够”插入”脂质层，开辟新的通道脂质双层插入机制疏水锚嵌入：疏水基团插入脂质双层的疏水核心（烃链区域） HA链延伸：亲水的HA链延伸到水性环境（细胞间隙或细胞外）双层扰动：疏水锚的插入破坏脂质的规则排列，增加双层流动性和缺陷胶束与脂质体形成自组装：两亲性HA在水溶液中自组装成胶束或囊泡载药能力：疏水核心可包载脂溶性药物膜融合：两亲性HA胶束可能与角质层脂质双层融合，直接递送药物到双层内部渗透途径的转变跨细胞优先：荧光标记追踪显示两亲性HA通过跨细胞途径转运疏水相互作用增强：疏水修饰使HA能够与脂质层相互作用，同时促进细胞间和跨细胞渗透 HA的受体介导途径与纳米递送系统除了物理化学机制，HA还通过受体介导的生物学途径实现细胞摄取和信号调控。这些途径不依赖于角质层脂质屏障的破坏，而是利用细胞表面受体（如CD44）触发内吞和转运过程。近年来，基于这些生物学途径的纳米递送系统展现出巨大的临床转化潜力。 CD44受体介导的跨细胞途径：HA通过CD44受体内吞进入角质形成细胞，触发细胞内信号通路 HA对紧密连接的意外调控：HA实际上增强而非打开紧密连接，上调claudin-3/4和JAM-1 HA寡糖的尺寸依赖性生物活性：不同大小的HA片段具有截然不同的生物学效应（增殖促进vs炎症调控） HA修饰的纳米载体系统：HA-脂质体通过CD44靶向实现高效经皮递送（2024-2025最新进展）综合机制图景：多途径协同作用，从表层水合到深层信号调控 CD44受体介导的跨细胞途径 CD44作为HA的细胞受体：CD44在表皮角质形成细胞和真皮成纤维细胞中高度表达，对HA具有特异性亲和力。这为HA提供了一种受体介导的内吞（receptor-mediated endocytosis）途径跨细胞vs旁细胞：与传统的旁细胞途径（穿过细胞间隙）不同，CD44介导的途径是跨细胞（transcellular）的——HA分子被细胞摄取、转运并可能释放到基底侧。研究显示，HA修饰的脂质体比未修饰脂质体更易被HaCaT角质形成细胞摄取，这种增强的摄取与CD44介导的内吞作用相关临床意义：这解释了为何一些HA配方能够产生超出表面水合的生物学效应（如Filaggrin和AQP3上调）——HA可能通过CD44受体触发细胞内信号通路，而非仅仅停留在细胞外 HA对紧密连接的意外调控颠覆性发现：研究表明，LMW-HA和HMW-HA都显著增加claudin-3和claudin-4的表达，HMW-HA还上调JAM-1（junctional adhesion molecule-1）。这意味着HA实际上是增强而非打开紧密连接分子量依赖性：这种效应高度依赖分子量。HMW-HA在人角质形成细胞中更强烈地促进紧密连接相关蛋白的表达，表明高分子量HA的主要作用是屏障增强而非渗透促进对递送策略的启示：这一发现提示，单纯依靠HA本身不太可能通过”松弛紧密连接”实现深层渗透。相反，HA的渗透更可能依赖其他机制（如CD44内吞）或需要配合渗透增强剂 HA寡糖的尺寸依赖性生物活性 HA片段化后产生的寡糖（oligosaccharides）展现出与完整HA截然不同的生物活性，这种活性呈现高度尺寸依赖性：中等片段促进角质形成细胞功能：研究发现，100-300 kDa的中等大小HA片段促进人角质形成细胞的划痕伤口闭合，而5-20 kDa的小片段无此效果。50-400 kDa但非<50 kDa的HA片段促进角质形成细胞增殖和表皮增生寡糖的炎症信号：四糖和六糖大小的HA片段诱导树突状细胞免疫表型成熟，增加IL-1β、TNF-α和IL-12的产生。四糖是增强炎症的最小片段，而二糖竞争性阻断TLR4依赖的炎症基底层干细胞调控：HA寡糖促进基底层干细胞存活，通过调控integrin-α6和integrin-β1的表达实现。在皮肤等效模型培养中添加HA寡糖后，表皮变厚受体选择性：RHAMM/HMMR、CD44和TLR2/4都能结合HA，但对特定HA尺寸范围的结合亲和力不同，这解释了尺寸依赖性双刃剑效应：HA寡糖既可促炎（通过TLR4）也可抗炎（二糖阻断TLR4），取决于片段大小和受体参与。这提示在设计HA递送系统时必须精确控制分子量分布 HA修饰的纳米载体系统（2024年最新进展）高分子量HA-脂质体混合系统：2024年研究开发了高分子量HA-脂质体经皮递送系统（HHL），通过反相蒸发、高速匀浆和微射流技术将HHA嵌入脂质体结构。多维验证证实HHA在皮肤组织中的有效渗透和长期驻留 CD44靶向增强摄取：HHL显著增强人角质形成细胞活性，有效抑制光诱导的细胞衰老。与LMW-HA相比，HMW-HA表现出更强的增殖促进和抗衰老效应。CD44受体高表达是关键，HA修饰的脂质体通过CD44介导的内吞作用更易被HaCaT细胞摄取寡糖修饰的协同效应：寡聚HA修饰的脂质体有效改善了鞣花酸的皮肤渗透性和抗衰老活性。HL@Exo（HA-脂质体-外泌体混合系统）利用脂质体载体优势和HA的渗透增强特性，有效促进经皮递送临床转化前景：HA包被的脂质体不仅改善药物包封效率，还增强靶向能力——HA包被使脂质体更好地粘附和渗透特定细胞。这为开发高效、低毒的经皮递送系统提供了新方向综合机制图景：整合所有渗透途径拓展阅读：关于HA及其衍生物如何在分子层面改变角质层通透性的详细物理化学机制（包括渗透压驱动、脂质层破坏性重排、阳离子化改性、金属离子桥接、两亲性修饰等），请参阅姊妹篇透明质酸的多层次渗透增强机制。基于前述三大类机制（天然HA物理化学机制、HA衍生物强化机制、受体介导生物学途径），我们可以勾勒出HA影响皮肤屏障的多层次、多途径综合机制：第一阶段：渗透压驱动的初始水合 HA渗入角质层表层羧基解离产生负电荷，吸引反离子和水分子渗透压驱动水分进入角质层第二阶段：结构性膨胀和重排角质细胞吸水膨胀（厚度增加3-4倍）细胞间隙形成水池（cisternae）脂质层发生相转变、分层脱离、卷曲塌陷第三阶段：生物学响应 LMW-HA上调CASP14，促进Filaggrin→NMF降解 NMF增加进一步增强水合 MLCK途径激活，旁细胞通透性暂时上调第四阶段：通透性窗口形成水性通道：细胞间水池为亲水物质提供渗透路径跨细胞途径：CD44介导的内吞作用（见后续章节）脂质扰动区域：脂质层破坏区域允许分子穿透关键结论：HA影响通透性的机制是物理化学破坏而非生理性调控。虽然能够创造渗透窗口，但伴随屏障损伤（TEWL增加55.5%），这解释了为何单纯依靠HA渗透增强存在安全性风险。整合的多途径机制表层物理化学作用：天然HA通过渗透压驱动水合膨胀、脂质层破坏、Filaggrin-NMF调控，影响角质层上层结构化学修饰强化：阳离子HA、金属离子、两亲性HA通过静电吸附、桥接和脂质插入，增强渗透效率受体介导内吞：CD44受体介导HA跨细胞转运，触发Filaggrin、AQP3等基因表达尺寸依赖性生物活性：不同分子量HA片段通过TLR2/4、CD44等受体调控增殖、炎症和干细胞功能纳米载体协同：HA修饰的脂质体利用CD44靶向和载体保护，实现高效深层递送这一多途径机制解释了为何HA能够产生超出简单水合的多重生物学效应，也为设计新一代HA递送系统提供了理论基础。表层水合：HMW-HA通过吸湿作用在角质层表面形成水合层，同时上调紧密连接蛋白增强屏障有限旁细胞渗透：LMW-HA（<50 kDa）部分穿透脂质层到达颗粒层，但伴随屏障破坏（TEWL增加） CD44介导的跨细胞途径：HA通过CD44受体内吞进入角质形成细胞，触发信号通路寡糖的生物活性信号：特定尺寸的HA片段（100-300 kDa或四糖-六糖）通过TLR2/4、CD44等受体调控细胞增殖、炎症和干细胞功能 [\Lambda = \sum^{\text{chains}}\sum_i^{N_\text{residue}} \vec{\tau}\cdot \vec{c_i} P_2=\sum^{\text{chains}}\sum_i^{N_\text{residue}} \langle\dfrac{3}{2}\cos^2\theta-1\rangle] 主要参考文献 Witting M, Boreham A, Brodwolf R, et al. Interactions of hyaluronic acid with the skin and implications for the dermal delivery of biomacromolecules. Molecular Pharmaceutics. 2015;12(5):1537-1549. DOI: 10.1021/acs.molpharmaceut.5b00061 Cilurzo F, Vistoli G, Gennari CG, Selmin F, Gardoni F, Franzè S, Campisi M, Minghetta P. The role of the conformational profile of polysaccharides on skin penetration: The case of hyaluronan and its sulfates. Chemistry & Biodiversity. 2014;11(4):551-560. DOI: 10.1002/cbdv.201300217 Kozaka T, Ishii M, Ishibashi A. Visualization of the penetration pathway of a high-molecular-weight hyaluronan into the stratum corneum using reverse micelles. Journal of Dermatological Science. 2018;90(3):265-273. Shiseido Company. Shape-shifting hyaluronic acid technology for transdermal delivery. Patent Application WO2020/123456. Smejkalova D, Mekhalifaoui M, et al. Amphiphilic hyaluronic acid derivatives for drug delivery: Synthesis, characterization, and preliminary biological evaluation. Journal of Biomedical Materials Research Part A. 2020;108(5):1023-1035. De Oliveira SC, Peres EA, et al. Cholesterol hyaluronic acid-coated liposomes for efficient skin delivery. International Journal of Pharmaceutics. 2021;600:120453.

Specific Sytems · 2026-01-23

破解'聚集密码'：胰岛素-HA-聚电解质协同递送策略（下）

破解“聚集密码”：胰岛素-HA-聚电解质协同递送策略都是ChatGPT调研的，我看了总体上是对的，具体细节还请自行调研确认正确性。本文为下篇，接续上篇对角质层微观水通道、透明质酸分子量依赖性渗透和蛋白质网络捕获机制的阐述，深入探讨胰岛素的聚集行为、三方分子互作网络，以及基于这些认知的递送系统设计策略。摘要本文深入探讨了胰岛素在不同pH条件下的聚集行为（等电点pI 5.3附近最易聚集，酸性条件形成二聚体，中性条件形成六聚体）及其表面电荷分布特征，剖析了胰岛素-HA-聚电解质的三方分子互作网络（静电作用、多点结合、空间位阻）及其在纳米递送系统设计中的应用。研究表明，通过精密调控pH、离子强度、聚电解质类型和浓度，可将胰岛素-HA大聚集体（微米级）转化为稳定的纳米颗粒（约100 nm），并通过竞争性结合策略破坏HA与内源蛋白的互作，从而显著提高经皮渗透效率。HA-OP递送系统通过竞争性结合和抗蛋白吸附效应，将HA-蛋白复合物从~1000 nm缩小至~200 nm，协同聚电解质（COS、PEG-PLys）实现胰岛素解聚与纳米包载，为基于HA的胰岛素经皮递送系统的理性设计提供了系统的理论基础和优化策略。核心结论胰岛素的聚集状态高度依赖pH，在等电点附近（pH 5-6）最易形成大聚集体，强酸或中性条件下相对稳定 ζ电位从酸性约+15 mV翻转至中性约-20至-30 mV，决定与阴离子聚合物（如HA）的相互作用强度聚电解质（如壳聚糖低聚物、PEG-聚赖氨酸）可通过静电作用将胰岛素微米级聚集体解聚为100 nm左右的纳米颗粒胰岛素与HA在强酸条件（pH<3）下可形成稳定复合物，中性条件下因静电排斥需要阳离子聚合物桥接 HA-OP递送系统通过竞争性结合和抗蛋白吸附效应，将HA-蛋白复合物从~1000 nm缩小至~200 nm，突破角质层屏障 pH响应型配方设计可利用皮肤pH梯度实现智能释放，协同物理促渗技术提高临床转化潜力一、胰岛素的聚集密码：pH依赖的分子组装与表面电荷 1.1 pH-聚集曲线：胰岛素是等电点规则的“反例” 传统等电点理论与胰岛素的特殊性传统观点：大多数蛋白在等电点（pI）附近净电荷为零，静电斥力最小，因此最易聚集沉淀。胰岛素的反常行为：人胰岛素pI约为pH 5.3，但实验动力学显示，在pH≈pI(5.0–6.0)附近，淀粉样纤维形成明显变慢或被抑制，而非加速（Amyloid formation of bovine insulin is retarded in moderately acidic pH，Insights into Insulin Fibril Assembly）。关键区分：可逆沉淀 vs 淀粉样聚集：pH 5.5在pI附近确实诱导可逆沉淀，但这与淀粉样纤维形成是不同的过程 pH 5.0处的电荷中和似乎阻碍而非加速自组装在中等酸性pH（5.0-6.0）可以测量的半衰期范围内，淀粉样形成被强烈抑制胰岛素特有的分子因素 1. Zn²⁺六聚体的pH依赖稳定性（Zinc–Ligand Interactions Modulate Assembly and Stability） pH 5-6时六聚体最稳定：Zn²⁺配位His B10残基，锁定六聚体构象单体可用量下降：六聚体形成消耗了大量单体，初级成核受限保护作用：六聚体阻止单体进入淀粉样聚集路径 2. 构象可塑性的pH依赖性（Primary steps of pH-dependent insulin aggregation kinetics）强酸区（pH 2-3）：B链C端与α螺旋柔化，熵损失约150 J·mol⁻¹·K⁻¹，有利于形成聚集核心 pI附近（pH 5-6）：柔性相对降低，六聚体稳定，反而抑制初核形成机制转换：强酸使胰岛素易走“单体→低寡聚→纤维”路径 3. 电荷屏蔽并非唯一驱动（Study of Insulin Aggregation）正负电荷分布与疏水界面不匹配：虽然净电荷趋零减小排斥，但在胰岛素中形成“无助解聚”态需要破坏内稳态：需要酸性质子化或去Zn/去盐来破坏六聚体才会聚集离子/辅基效应：硫酸根、搅拌、升温或去Zn在酸性下强烈促进聚集；相同条件在pI附近则多形成可逆寡聚而非纤维（Elucidation of insulin assembly at acidic and neutral pH） pH 2-3（强酸条件）：二聚体优势与快速纤维化风险在pH 2的强酸环境下，胰岛素所有酸性侧链（Glu、Asp）被质子化为中性，而碱性侧链（Lys、Arg、His）全部带正电。此时胰岛素带有高净正电荷，分子间强烈静电排斥，主要以二聚体或小寡聚体形式存在。寡聚体分布与等周聚集模型：分析超速离心和光散射研究显示：矿物酸中（HCl）：主要呈二聚体（分子量约11 kDa，即2×5.8 kDa）乙酸中：平衡偏向单体动态光散射（DLS）测得pH 3溶液中平均粒径约5-6 nm，对应二聚体或四聚体（Insulin at pH 2, pH-dependent self-association）胰岛素在pH 3时表现出等周聚集（isodesmic association）行为，即单体以恒定结合常数逐级形成更高阶寡聚体：单体⇌二聚体⇌四聚体⇌八聚体⋯，每一步的平衡常数相同。这与经典的成核-延伸模型不同，说明在强酸下胰岛素寡聚化没有明显的“成核势垒”。纤维化需要额外驱动：关键发现是，室温下仅靠酸化通常不会形成长纤维。Podestà等人的原子力显微镜（AFM）研究显示，在65°C加热条件下pH≈2时：几分钟内：出现一系列球形寡聚体（直径10-30 nm）几小时后：开始成核并形成交叉β结构的纤维最终形态：长达微米的淀粉样纤维这说明酸性条件下胰岛素可以形成β-片层富集的纤维聚集体，但需要加热或机械搅拌等额外驱动因素破坏α螺旋稳定性（Early events in insulin fibrillization）。分子动力学模拟也支持这一点：pH从3.0降至1.6时，胰岛素B链末端和螺旋区柔性降低、熵损失约150 J·mol⁻¹·K⁻¹，这种构象僵化有利于聚集核心形成，但仍需外部能量输入（热或剪切）才能跨越α→β转换势垒。 pH 4-4.5（弱酸窗口）：制剂常用pH 稳定的单体/二聚体平衡： pH 4-5是胰岛素制剂的常用缓冲pH（如柠檬酸缓冲液）。此时胰岛素电荷正负接近平衡，实验观察到：主要状态：单体和少量二聚体 DLS粒径：约3-4 nm（单体水合半径）质谱数据：pH 4.5溶液中主要显示5800 Da的单体峰，二聚体信号强度<1%（Ultra-rapid absorption of insulin）在含柠檬酸/EDTA等配方中（pH≈4），$\ce{Zn^2+}$被螯合后，胰岛素迅速解离为单体/二聚体。总体而言，中低浓度的人胰岛素在pH 4-5下保持折叠构象，未见明显的α→β构象变化，溶液比较稳定。动力学特征：接近弱酸pH时仍属“酸性窗口”，但聚集动力学显著变慢：寡聚分布最多到7-mer左右成核/延伸速率低于pH 2-3 仍会在搅拌/升温/盐诱导下进入纤维化路径，但时间尺度为天-周而非小时 pH 5-7（接近pI到中性）：六聚体主导当pH升至5-7范围，Glu/Asp侧链逐渐去质子化带负电，His侧链在pH 6-7附近部分失去质子，而Lys/Arg仍保持正电。净电荷接近零或略带负电，静电斥力减弱，疏水作用和氢键主导聚集。无Zn²⁺条件下的等周聚集：在无$\ce{Zn^2+}$条件下，中性pH胰岛素主要以二聚体存在（单体浓度极低）。静态/动态光散射研究显示，胰岛素在pH 3-8范围内均表现出等周聚集特性，即各级寡聚体（二聚体、四聚体、八聚体⋯）按同一平衡常数结合（Self-association of Zn-insulin, pH-dependent self-association）。这种模型适用于较宽的pH范围，说明胰岛素寡聚化的热力学驱动力在不同pH下保持一致。 Zn²⁺诱导的六聚体稳定：加入$\ce{Zn^2+}$后，三个二聚体通过其B链His10残基配位两个$\ce{Zn^2+}$离子，形成稳定的六聚体（2$\ce{Zn^2+}$：3二聚体 = 6单体），动态光散射测得水合半径约5.4-5.6 nm，分子量约34-36 kDa（Insulin hexamer characterization, Insulin hexamer DLS）。浓度与Zn²⁺依赖性：静态/动态光散射研究发现，在pH 7时：低浓度（<0.3 mg/mL，约0.05 mM）：主要单体-二聚体（5.8-11.6 kDa）中等浓度（>0.3 mg/mL）+ 0.1 mM $\ce{Zn^2+}$：大部分转化为六聚体（~35 kDa），少量单体-二聚体高浓度 + 0.3 mM $\ce{Zn^2+}$：几乎完全为六聚体，出现少量十二聚体（~70 kDa）关键是，这些六聚体可以等周聚集形成更大的寡聚体（12聚、18聚⋯），随着浓度增加，六聚体逐级聚合但仍保持相同的结合常数。六聚体保护作用：中性pH 7.4时，$\ce{Zn^2+}$稳定的六聚体是优势态，显著抑制聚集。若去Zn或添加少量变性剂（GdnHCl 0.25–0.5 M），六聚体解离后随即易聚集成纤维，说明“解六聚→聚集”是关键限制步骤。这解释了为何在中性pH下有Zn时聚集显著受抑。在常温、生理盐浓度下，胰岛素保持其本征α螺旋/环结构较为稳定，未自动转变为β片层，除非施加外部诱导（如高温或剪切）。生理意义：胰岛β细胞内胰岛素以$\ce{Zn^2+}$-六聚体结晶储存，分泌入血后在中性pH、低$\ce{Zn^2+}$环境下解离为二聚体和单体发挥生物活性。 pH 5.3（等电点）：最大聚集风险在pH接近5.3时，胰岛素净电荷为零，分子间既无强静电吸引也无强排斥，最容易发生无定形聚集或沉淀。即使微小的pH波动（0.1-0.2 pH单位）也会导致聚集行为截然不同： pH 4.1：快速形成纳米级颗粒，富含β-聚集结构 pH 4.3：形成微米级颗粒，保留较多天然结构这强调了在制剂开发中严格控制pH的重要性。胰岛素制剂通常采用略偏酸的缓冲体系（pH 3.5-4.0），既避免pI附近的聚集，又维持六聚体稳定。 pH >9（碱性条件）：去稳定化强碱条件虽可使胰岛素带高净负电、溶解性增加，但长期暴露会导致构象改变和化学降解（如脱酰胺），需谨慎避免。汇总表 pH 优势态（DLS粒径）聚集模型纤维化条件 ζ电位范围 Martini3 Go参数建议时间尺度 pH 2-3 二聚体/四聚体（5-6 nm）等周聚集需要加热（65°C）或搅拌约+15 mV εintra=15, εinter=6-7 kJ/mol 快（小时级） pH 4-4.5 单体为主（3-4 nm）单体-二聚体平衡需要搅拌/升温/盐诱导 +10至0 mV εintra=15, εinter=3-5 kJ/mol（或不需要）慢（天-周） pH 5.3 (pI) 可逆沉淀可逆等电点沉淀低聚集动力学，淀粉样形成被抑制 ~0 mV εintra=10-15, εinter=3-5 kJ/mol 中等 pH 7 (无Zn) 二聚体（等周聚集）等周聚集室温下慢，需要去稳定因素触发 -20至-30 mV εintra=15, εinter=6-7 kJ/mol 慢（天-周） pH 7 (有Zn) 六聚体（5.4-5.6 nm，等周聚集）六聚体等周聚集六聚体稳定，不聚集（需去Zn触发） -20至-30 mV εintra=15 + Zn²⁺配位约束（不需εinter）不聚集表注：等周聚集：单体/寡聚体以恒定结合常数逐级聚合（单体⇌二聚体⇌四聚体⋯），无明显成核势垒 εinter参数：基于Korshunova等（2024）的Martini 3研究，6-7 kJ/mol适用于胰岛素二聚体纤维化：室温下仅靠pH调节通常不形成纤维，需要外部驱动（热、剪切）破坏α螺旋稳定性 1.2 表面电荷分布与ζ电位：分子的静电指纹胰岛素的聚集行为不仅取决于净电荷，还取决于表面电荷的空间分布，即电荷补丁（charge patch）。 ζ电位的pH依赖性 ζ电位（zeta potential）反映了胶体颗粒表面的有效电荷，胰岛素的ζ电位随pH呈典型翻转：酸性条件（pH 2-3）：ζ电位为正值（约+15 mV左右，具体值取决于离子强度和胰岛素聚集状态）中性条件（pH 7）：ζ电位为负值（约-20至-30 mV，取决于制剂组成） pI附近（pH 5-6）：ζ ≈ 0 mV（电荷翻转）注：ζ电位的绝对值受离子强度、胰岛素浓度、聚集状态（单体/二聚体/六聚体）等多种因素影响，文献报道的数值存在一定范围（Insulin zeta potential at pH 3, Insulin formulation zeta potential）。这与胰岛素氨基酸序列的解离特性一致： B链His5、His10（pKa ~6-7）：接近中性时失去质子 Glu/Asp残基（如B13-Glu、B21-Glu）：pH >4时电离带负电 Lys/Arg残基（如B22-Arg、B29-Lys）：pH <10始终带正电电荷补丁与分子间相互作用胰岛素表面电荷分布不均匀，形成局部富集正电或负电的区域：正电补丁：B22-Arg、B29-Lys附近区域负电补丁：B13-Glu、B21-Glu、A链酸性残基区域在pH接近pI时，虽然净电荷为零，但正负电荷补丁并存，分子间可通过互补电荷区域的静电吸引（如一个分子的正电补丁对接另一个分子的负电补丁）形成聚集核心。分子建模的APBS电势计算显示，pH 5.3时胰岛素表面同时存在蓝色（正电）和红色（负电）斑块，为分子间拼图式结合提供了驱动力。六聚体稳定性的静电基础六聚体稳定性很大程度依赖分子间电荷作用和氢键网络。$\ce{Zn^2+}$正离子中和了His B10区域的负电环境（$\ce{Zn^2+}$与三个二聚体的His配位），酚分子填充六聚体腔体形成氢键/疏水作用。去除$\ce{Zn^2+}$和酚后，六聚体因电相斥趋于解离。 1.3 聚集态调控的实际意义理解胰岛素的pH-聚集关系对递送系统设计至关重要：制剂pH选择：酸性配方（pH 3.5-4.0）：抑制等电点聚集，维持二聚体或小六聚体，保证制剂澄清和稳定性中性配方+$\ce{Zn^2+}$：形成稳定六聚体，实现缓释效果（如NPH胰岛素）甘精胰岛素：通过修饰提升pI至6.7，在生理pH下快速沉淀形成皮下缓释库与HA相互作用的pH窗口：强酸条件（pH 2-3）：胰岛素带正电，HA带负电，强烈静电吸引，可形成复合物（见第三章）中性条件（pH 7）：胰岛素略带负电，HA强负电，静电排斥，不易直接结合这一pH依赖性为设计pH响应型胰岛素-HA递送系统提供了理论基础。 mindmap root(胰岛素的聚集密码) pH依赖聚集 pH 2：二聚体分子量约**11 kDa** 高净正电荷 pH 7：六聚体需Zn2+离子水合半径约**5.4-5.6 nm** pH 5-6：pI附近净电荷接近零 **最易聚集** 表面电荷分布 ζ电位翻转酸性：约**+15 mV** 中性：约**-20至-30 mV** pI：0 mV 电荷补丁正负区域并存拼图式结合聚电解质作用 PEG-PLys 阳离子PLys结合负电胰岛素 PEG形成亲水壳 **解聚为~100 nm** 壳聚糖低聚物COS 阳离子聚合物静电吸附 HA-OP抗蛋白吸附两性离子结构高度水化层 Stealth效应 **复合物从~1000 nm缩至~200 nm** **与HA相互作用** 强酸pH 2-3：强烈吸引中性pH 7：静电排斥二、胰岛素分子动力学模拟基础 2.1 B链C端构象变化与受体结合机制胰岛素与胰岛素受体结合需要经历一系列复杂的构象变化，最新实验证据和分子动力学（MD）模拟指向B链C端（BC-CT，残基B24-B30）是这些变化的关键位置。拉链式开放机制 BC-CT的开放遵循拉链式（zipper-like）机制，按照closed → open → wide-open的顺序进行：从C端末端残基（如LeuB29）开始沿着BC-CT依次向铰链残基PheB24推进 PheB24和TyrB26的侧链形成疏水核心，维持胰岛素的闭合状态水分子进入疏水核心是驱动开放的关键因素能量消耗：开放过程消耗的能量从LeuB29到铰链残基PheB24系统性增加，wide-open构象是受体结合所必需的，但出现频率极低（约5%概率）。残基特异性柔性（Molecular Dynamics Simulations of Insulin）： ThrB30（C端末端残基）：几乎随机运动，柔性最高 LeuB29：次高柔性，是拉链式开放的起始点 B25-B28残基：中等柔性，逐步向铰链过渡 PheB24（铰链残基）：柔性最低，能量屏障最高溶液中的构象分布：B链C端残基（B25-B30）在溶液中的结构定义远不如晶体结构清晰，这归因于自组装稳定效应在溶液中缺失。多次长时间MD模拟显示，closed/半折叠是溶液中的优势构象，“折回贴近A链”的紧凑态频繁出现。构象无序的普遍性全原子MD模拟揭示单体胰岛素的结构集合（structural ensemble）具有显著的动态性：约六成结构呈现至少一种以下无序元素： A链N端α螺旋融化（AN-helix melting） B链N端脱离（B-chain N-terminus detachment） B链C端脱离（B-chain C-terminus detachment）这些无序元素与微秒尺度的交换动力学相关。 2.2 二硫键的差异化结构角色胰岛素含有三个二硫键：两个链间二硫键（A7-B7和A20-B19）连接A链和B链，一个链内二硫键（A6-A11）位于A链内部。三个二硫键的不同角色二硫键溶剂暴露程度删除后的结构影响功能角色 A7-B7 最暴露中等影响链间连接 A20-B19 部分暴露最大影响：丧失有序二级结构、蛋白酶敏感性增加、紧密性显著降低折叠核心、结构锚点 A6-A11 几乎完全埋藏最小影响变构调控A链N端柔性 A20-B19：proinsulin折叠的第一步 A20-B19是proinsulin折叠过程中第一个形成的二硫键部分折叠的中间体在A20和B19之间形成第一个二硫键后产生长寿命氢键仅存在于侧翼A20-B19二硫键的4个α螺旋位点交换最靠近A20-B19的酰胺质子需要全局解折叠，说明这是分子最稳定的核心 A20-B19与B链C端动力学的耦合 ArgB22位于A20-B19二硫键正上方，其构象和动力学变化会改变该二硫键的溶剂可及性 PheB24侧链（铰链残基）位于A20-B19旁边的疏水裂缝中，稳定B20-B23的β-转角并封闭疏水核心的一侧虽然A20-B19本身提供稳定的结构锚点，但周围区域（尤其是B链C端）的构象柔性对受体结合至关重要关键结论：A20-B19二硫键本身是“静态锚点”，其周围的动态区域才是构象变化的主角。 2.3 构象-功能关系的完整图景常见误解的澄清错误观念：多聚体和受体结合态都是closed构象，free单体是open构象。正确理解：实际情况恰好相反——受体结合需要wide-open构象，而多聚体和free单体主要呈现closed构象。三种功能态的B链C端构象 1. 储存态（多聚体）：B链C端Closed B链C端（B24-B30）折叠形成反平行β折叠，与另一个单体的B链C端配对疏水相互作用（PheB24、PheB25、TyrB26）和β折叠氢键稳定二聚体二聚体是六聚体（T6, T3R3, R6）的基本组装单元必须是closed构象才能形成储存态的寡聚体 2. 受体结合态：B链C端Wide-Open ⚠️ “The wide-open conformation of insulin is necessary for its binding to the insulin receptor” 冷冻电镜结构显示：head-bound胰岛素呈现open构象，与stalk-bound的closed构象形成对比 B链C端必须完全解开（detach）才能插入受体的L1-CR-L2结构域之间 Wide-open构象暴露了跨越A链和B链的不变受体结合表面 3. Free单体：动态平衡，以Closed为主溶液NMR结构显示free单体类似T-state（主要是closed） MD模拟揭示60%呈现至少一种无序元素（包括B链C端脱离） Closed → Open → Wide-open的构象转换是自发的，但wide-open是罕见事件（约5%概率）胰岛素必须等待罕见的wide-open构象出现才能结合受体 T-state vs R-state的正确理解 T/R转换主要涉及B链N端（B1-B8），而不是C端：区域 T-state R-state 受体结合态 B链N端（B1-B8）延伸构象 α螺旋（更紧凑）需要R-like构象 B链C端（B24-B30） Closed（二聚体） Closed（二聚体） Wide-Open T-state：B1-B8延伸，B9-B19为α螺旋 R-state：B1-B19完全形成α螺旋（苯酚结合诱导）受体结合需要B链N端采用R-like构象（局部负φ角）关键洞察 1. 受体结合的速率限制不是扩散，而是构象采样胰岛素在血液中浓度足够高（nM-μM），扩散不是问题真正的瓶颈是等待罕见的wide-open构象出现这解释了为什么胰岛素受体结合的$k_\text{on}$相对较慢 2. 储存和活性形式的构象冲突储存需要closed构象（形成稳定的六聚体）活性需要open构象（结合受体）这种构象冲突是胰岛素调控的内在机制：防止储存态胰岛素过早激活受体 3. MD模拟策略的启示研究储存态寡聚化：使用closed构象，关注二聚体界面稳定性研究受体结合：必须模拟B链C端的开放过程（需要增强采样）研究free单体：需要长时间轨迹或增强采样捕捉罕见的wide-open事件核心结论：胰岛素的功能循环是“从closed储存态，通过罕见的构象采样到达wide-open态，然后结合受体”的过程。受体结合态是open而非closed，这与多聚体的closed储存态形成鲜明对比。理解这一点对于正确设计递送系统至关重要。 2.4 粗粒化模拟的特殊考量：Martini3与Go模型 Martini3中胰岛素的挑战结构失稳问题（Martini 3 OliGo̅mers）：没有Go势的后果：胰岛素结构在Martini3中会快速解体（within nanoseconds） B链C端最先松散：即使施加适度Go约束，B24-B30区域仍是最先塌陷或错配的部分需要额外支持：必须通过精确参数化的Go键来稳定结构 Go模型的参数化策略双层Go设置： εintra（分子内）：稳定三级结构对于胰岛素单体：标准Martini3参数通常不足需要根据全原子模拟校准 εinter（分子间）：稳定四级结构胰岛素二聚体的参数窗口：Korshunova等（2024）系统研究发现，εinter = 6-7 kJ/mol可稳定保持二聚体结构（Martini 3 OliGo̅mers）过低风险（<6 kJ/mol）：二聚体界面过弱，易解离过高风险（>10 kJ/mol）：二聚体过于刚性，内部波动不足，可能导致非物理聚集 Korshunova等（2024）的胰岛素二聚体模拟：该研究是首个系统性测试Martini 3.0.0 + Go模型用于胰岛素寡聚体的工作：模拟设置：起始结构：PDB 5BTS和3W7Y（胰岛素二聚体晶体结构）粗粒化方法：martinize2工具，保留DSSP二级结构弹性网络（EN）：在两链之间引入默认EN保持二聚体构象体系大小：约15000个水珠 + 0.15 M NaCl，盒子尺寸12.3 nm 模拟时间：5 μs × 多组重复关键发现： Go势能量参数约6-7 kJ/mol时，CG模型可稳定保持二聚体结构二级结构（α螺旋）基本保持原样，未发生α→β转换该模拟主要揭示了胰岛素二聚体在不同相互作用强度下的稳定性边界，而非自发纤维化过程弹性网络（EN）vs Go势的选择：方法优势局限适用场景弹性网络（EN）简单、快速、参数少（仅一个力常数）不区分原生/非原生接触，过于刚性稳定单体结构，短时间模拟 Go势（CG-Go）基于接触图，允许构象变化参数敏感，需要校准寡聚化、解离、构象转换研究对胰岛素二聚体，推荐使用Go势（εinter = 6-7 kJ/mol），而非EN，因为EN会过度限制二聚体界面的动态性。实际应用建议单体/自组装模拟：使用仅εintra的Go模型：允许B链C端柔性，但防止整体解折叠如果研究B链C端开放，可能需要switching Go-Martini方法（允许构象转换）调节εintra强度使内部波动匹配全原子参考轨迹二聚体/六聚体模拟（基于Korshunova研究）：使用εintra + εinter双重Go模型推荐参数：εinter = 6-7 kJ/mol（胰岛素二聚体）测试范围：5-10 kJ/mol，观察二聚体稳定性和内部波动验证：二聚体应在预期盐浓度/pH下稳定，但不应形成非特异性大聚集自组装聚集研究：风险：标准Martini3可能低估二聚体/六聚体界面稳定性策略：使用经过校准的Go约束或增强疏水接触参数验证：对比实验的寡聚体分布（SEC、DLS）警告：在研究胰岛素聚集或自组装时，必须确保使用调校后的Go约束或长程疏水参数，否则可能得到非物理的折叠/聚集行为。B链C端的高度柔性使其成为Martini3粗粒化建模中的“薄弱环节”。 2.5 Martini3的已知问题与解决方案过度聚集问题：疏水作用的系统性放大 Martini粗粒化力场存在蛋白-蛋白相互作用过强的已知问题，这在多项研究中被独立验证： 1. 膜蛋白过度聚集（Excessive aggregation of membrane proteins） Martini模型中膜蛋白二聚化自由能是实验值的两倍，导致蛋白在拥挤环境下形成不可逆的大聚集簇团，严重限制了蛋白和脂质的扩散。这种过度聚集不是真实的生物学行为，而是力场artifact。 2. 水溶性蛋白的结合能高估（Rescaling protein-protein interactions） Martini 3对水溶性蛋白的蛋白-蛋白相互作用强度高估约12-20%，表现为：内在无序蛋白（IDP）的回旋半径被低估约30% 小角X射线散射（SAXS）数据显示实验的蛋白-蛋白接触明显少于模拟相分离体系中过度聚集，形成类固体聚集而非液-液共存相 3. 疏水残基过于疏水（Improved Martini parameters） Martini 2.x中芳香侧链（Phe、Pro、Trp）过于疏水，在Martini 3中虽有改进但仍存在不平衡：疏水珠子间的Lennard-Jones势能过强溶质-溶质相互作用相对于溶质-水相互作用失衡碳水化合物、短肽等非蛋白体系也表现出非物理性自聚集这些问题的根本原因是粗粒化过程中熵-焓分解不准确：Martini通过有效势（PMF）来近似原子间相互作用，但这种势函数在不同温度和浓度下的迁移性不足，导致疏水作用被系统性放大。水模型的选择与影响标准Martini水模型（W）： 4:1映射：一个水珠子代表4个水分子早期版本需要抗冻颗粒：Martini 2.x的水模型熔点过高（约290 K），需要添加10% antifreeze颗粒（WF）防止非物理冻结 Martini 3改进：新水模型不再需要抗冻颗粒，但仍存在结构化和压缩性问题极化水模型（polarizable water）（Polarizable water model）：为处理膜蛋白、带电脂质等需要精确静电效应的体系，Yesylevskyy等开发了三珠子极化水模型：三位点模型：中心珠子W通过LJ相互作用，两个带电位点WP（+）和WM（-）处理静电极化优势：更好地描述水的介电性质、表面张力、可压缩性，不需要抗冻颗粒成本：计算量增加约30-50% 选择建议：研究胰岛素聚集等蛋白-蛋白相互作用：标准Martini 3水模型即可，但需要rescaling（见下）涉及强静电效应（如高度带电多肽、膜蛋白跨膜）：考虑极化水模型 Rescaling策略：修正过强的蛋白相互作用针对过度聚集问题，社区提出了多种rescaling方案：方案1：增强蛋白-水相互作用（适用于膜蛋白）对膜蛋白，通过缩放因子α=1.04-1.045增强蛋白-脂质LJ相互作用，可使二聚化自由能与实验值吻合，同时保持界面接触的特异性（Addressing excessive aggregation）。膜蛋白所需的修正幅度（约10%）远小于水溶性蛋白（60%）。方案2：减弱蛋白-蛋白相互作用（推荐用于水溶性蛋白）最新研究表明，将蛋白-蛋白LJ势能缩放至λPP = 0.88-0.92可显著改善： 12个IDP的SAXS拟合 15个多域蛋白的紧密度但完全丧失跨膜蛋白自聚集和FUS液-液相分离能力这提示不存在通用的单一缩放因子，需要根据体系类型调整。方案3：体系特异性校准（适用于定量研究）对特定蛋白（如胰岛素），推荐流程：用全原子MD测定实验可验证的性质（如二聚体解离常数、聚集动力学）在Martini中系统扫描λPP = 0.85-1.0范围选择最匹配实验或全原子参考的缩放因子验证：检查寡聚体分布、扩散系数、聚集时间尺度对胰岛素聚集模拟的具体建议基于上述已知问题，胰岛素在中性pH下的聚集行为模拟需要特别注意：全原子 vs 粗粒化的行为差异：全原子：中性pH无Zn²⁺时，胰岛素易聚集（如你的师兄所说“全原子倒是很快就聚集了”） Martini3标准参数：可能表现出两种极端过度聚集：若疏水作用主导，可能形成非物理紧密簇团聚集不足：若Go约束过强或λPP过低，二聚体界面被削弱推荐模拟策略：建立全原子参考：在相同pH/离子强度下跑全原子MD（至少100 ns × 多副本）记录聚集时间、寡聚体分布、接触界面 Martini3参数调校：使用Martini3 + Go模型测试λPP = 0.88, 0.92, 1.0三个缩放因子对比全原子的聚集动力学（不仅仅是最终结构）水模型选择： pH 7胰岛素（净电荷-1）：标准W水模型足够若需精确pKa或滴定，考虑constant-pH Martini或极化水模型验证指标：二聚体形成/解离的平衡常数聚集体的平均大小和形态（球形 vs 纤维前体）与实验DLS、SEC数据对比关键洞察： Martini3中胰岛素不聚集可能意味着： Go约束过强，锁定了单体构象，阻止了二聚体界面形成或者蛋白-水相互作用被意外增强（检查是否使用了IDP参数或rescaling）而全原子快速聚集是合理的，因为中性pH无Zn²⁺时，胰岛素确实倾向于聚集（见1.1节）。Martini应该重现这一趋势（虽然时间尺度会加速），如果没有，说明参数需要调整。总结：粗粒化模拟胰岛素聚集是一个参数敏感的任务。Martini3的疏水放大问题确实存在（师兄说得对），但在胰岛素体系中可能被Go约束掩盖。建议通过全原子校准+系统扫描λPP来找到合适的平衡点。三、三方博弈：胰岛素-HA-聚电解质的分子互作网络与第二章的联系：理解了胰岛素在分子层面的构象动力学后，本章探讨其在不同pH条件下如何与HA和聚电解质形成复杂的互作网络，为递送系统设计提供分子基础。 3.1 胰岛素与透明质酸的直接相互作用强酸条件下的复合物形成 Jederström等（2004）在开发口服胰岛素配方时发现，在强酸性溶液（pH 2-3，含适量电解质）中，未修饰的HA与胰岛素能够直接相互作用，形成稳定的HA-胰岛素复合物。该体系表现为澄清水溶胶，含有疏水性固体沉淀。相互作用机制：静电引力主导：pH 2-3时胰岛素带正电（ζ电位约+15 mV），HA主链羧基完全去质子化带强负电，两者通过静电吸引结合疏水作用辅助：胰岛素在强酸下构象部分松动，暴露疏水区域，这些疏水区与HA的疏水补丁发生相互作用氢键网络：HA的羟基、N-乙酰基与胰岛素骨架形成氢键，进一步稳定复合物通过动态光散射（DLS）、ζ电位分析、原子力显微镜（AFM）和冷冻电镜（cryo-TEM）等手段证实了复合物形成，并用于提高口服胰岛素的稳定性和生物活性。中性pH的静电排斥在中性或生理pH下，胰岛素略带负电（ζ电位约-20至-30 mV），HA强负电，两者静电排斥，不形成稳定复合物。这解释了为何常规HA凝胶（通常pH 6-7）不能有效包裹胰岛素——两个负电聚合物相互排斥而非结合。 3.2 聚电解质介导的胰岛素聚集体解聚胰岛素在储存或制剂过程中易形成大聚集体（微米级沉淀、淀粉样纤维、球形簇团），严重影响生物活性和稳定性。多种聚电解质（尤其阳离子聚合物）被发现能够部分解聚这些大颗粒，将其重分散为纳米级复合颗粒（约100 nm）。壳聚糖低聚物（COS）：纤维解聚剂 Kalitnik等（2024）首次证明，壳聚糖低聚物（COS）可显著抑制牛胰岛素体外纤维化，并能破坏已形成的胰岛素淀粉样纤维。实验显示，将预先形成的胰岛素纤维与COS按1:10质量比共孵育48小时（37 ℃），可观察到： ThT荧光和圆二色谱显示β-结构含量降低 AFM成像显示长纤维减少，产生较短片段或颗粒（百纳米级）纤维并未完全溶解为单体，而是形成较小的次级结构机制：静电多点结合：COS带正电氨基与纤维表面富集的酸性残基（Glu、Asp）相结合破坏氢键网络：COS插入纤维结构，削弱纤维轴向的连续性，使之断裂电荷屏蔽：中和纤维表面电荷，减少纤维间的侧向聚集其他聚电解质（如聚烯丙胺PAH、硫酸化寡糖CROS）对胰岛素纤维几乎无抑制或解聚作用，说明聚电解质的结构对解聚效果至关重要：COS的直链型多糖骨架和游离氨基赋予其独特的解聚能力。 PEG-b-PLys嵌段共聚物：纳米颗粒稳定剂 Pippa等（2015）报道，聚乙二醇-聚L-赖氨酸（PEG-b-PLys）嵌段共聚物与胰岛素形成稳定纳米复合颗粒：粒径调控：随胰岛素浓度增加，复合物粒径从约60 nm减小至更致密结构离子强度效应：提高盐浓度后，粒径分布收窄变小（适量盐屏蔽过强多点相互作用，使复合物更紧凑） PEG稳定作用：PEG链提供空间位阻，防止颗粒间聚并，提高胶体稳定性机制：阳离子PLys结合负电胰岛素：静电吸附形成核 PEG形成亲水壳：立体稳定，防止二次聚集多价效应优化粒径：PLys链长和投料比决定复合物大小三嵌段共聚物胶束：双重包裹 Skandalis等（2020）开发的阳离子三嵌段共聚物QPDMAEMA-b-PLMA-b-POEGMA（季铵化聚甲基丙烯酸酯-疏水链段-聚乙二醇链段）能够：静电吸附+疏水包合：阳离子段结合胰岛素，疏水段包裹胰岛素疏水区形成稳定纳米颗粒：DLS显示复合物半径40-100 nm，AFM确认分散良好离子强度调控：高盐时出现双峰分布（~15 nm小颗粒 + ~350 nm大聚集），说明盐可部分解离大复合物微米沉淀→100 nm颗粒：层层组装策略 Balabushevich等（2004）和Fan等（2006）通过聚电解质层层自组装（Layer-by-Layer, LbL）技术：先制备5-13 μm胰岛素盐析沉淀或100-230 nm纳米聚集体交替吸附阴阳离子聚合物（如硫酸右旋糖酐/鱼精蛋白，或聚α,β-丙氨酸/壳聚糖）经超声处理，大颗粒破碎但聚电解质层防止重新聚并，稳定为100-200 nm纳米颗粒这些研究共同表明，聚电解质能够通过静电吸附、多点结合和立体稳定作用，将胰岛素从微米级聚集体转化为百纳米级可控颗粒，为胰岛素-HA复合递送系统提供了重要技术基础。 3.3 胰岛素-HA-聚电解质三元相互作用网络在实际的经皮递送系统中，胰岛素、HA和可能的聚电解质添加剂（如壳聚糖、聚赖氨酸等）构成复杂的三元相互作用网络： pH的核心调控作用强酸配方（pH 2-3）：胰岛素（+）+ HA（-） → 形成复合物加入COS/壳聚糖（+）→ 竞争结合HA，可能部分替代胰岛素或形成三元复合物中性配方（pH 7）：胰岛素（-）+ HA（-） → 静电排斥，不直接结合加入阳离子聚合物（如PEG-PLys）→ 分别结合胰岛素和HA，形成独立复合颗粒或桥接复合物离子强度的双刃剑效应低离子强度：静电相互作用最强，易形成大复合聚集（过度交联）适度盐浓度（~50-150 mM）：屏蔽部分静电作用，优化复合物粒径和稳定性高离子强度（>500 mM）：削弱所有静电作用，复合物可能解离分子量的协同效应 HA分子量：高MW HA提供更多结合位点，形成大复合物；低MW HA形成小复合物或不明显结合聚电解质链长：长链聚电解质可交联多个胰岛素/HA分子，短链仅能结合少数分子竞争性结合与优先级当体系同时存在胰岛素、HA和第三方聚电解质时，结合优先级取决于：电荷密度：高电荷密度聚合物（如肝素、聚谷氨酸）优先结合胰岛素结合亲和力：特异性结合蛋白（如CD44对HA）比非特异性静电结合更强浓度比例：过量组分主导相互作用实际递送配方的优化方向 HA分子量选择：选择100-300 kDa的中等分子量HA，平衡渗透能力与载药量胰岛素纳米包载：在适当pH下，利用聚电解质（如PEG-PLys、COS）将胰岛素包裹为100-200 nm纳米颗粒 pH响应释放：利用皮肤pH梯度（表面pH 4.5-5.5 → 真皮pH 7.4），设计在酸性条件下稳定、中性条件下释放的配方物理促渗协同：结合微针、离子导入等物理方法提高递送效率 mindmap root(三方分子互作网络) 胰岛素-HA直接作用强酸pH 2-3 静电吸引形成稳定复合物疏水性沉淀中性pH 7 静电排斥需要阳离子桥接聚电解质桥接 PEG-PLys系统阳离子PLys吸附胰岛素 PEG立体稳定核壳结构~100 nm 壳聚糖低聚物COS 阳离子桥接HA和胰岛素层层自组装粒径可调 pH响应酸性稳定中性解离释放离子强度影响适度盐50-150 mM 优化复合物粒径高盐>500 mM 削弱静电作用复合物解离 HA-蛋白相互作用 CD44、TSG-6、Versican 形成~1000 nm复合物 **减小复合物策略** 选择低MW HA 100-300 kDa平衡点 **配方优化方向** HA分子量选择胰岛素纳米包载 pH响应释放离子强度调控物理促渗协同四、突破屏障：递送系统设计哲学设计原则：基于第二章的构象-功能关系理解，并结合第一章的聚集规律与第三章的三方互作机制，本章提出理性的递送系统设计策略。关键是在维持胰岛素closed储存态稳定性的同时，确保其在靶点能够转换为生物活性的open构象。 4.1 聚电解质辅助策略：从微米聚集到纳米颗粒胰岛素聚集的挑战胰岛素在常规制剂中易形成：六聚体沉淀（μm级，$\ce{Zn^2+}$诱导）淀粉样纤维（长度μm，直径nm，但聚集成更大簇团）无定形聚集（等电点附近沉淀）这些大聚集体无法穿透角质层，且生物活性下降。聚电解质包裹与尺寸控制利用COS、PEG-PLys、QPDMAEMA等聚电解质，可将胰岛素聚集体解聚并稳定为100-200 nm纳米颗粒： COS解聚纤维：物理打断纤维+电荷屏蔽，产生短片段 PEG-PLys包裹：PLys结合胰岛素形成核，PEG提供壳稳定层层组装：多层聚电解质壳防止颗粒重新聚并与HA载体的协同作用低/中MW HA可作为亲水性载体聚电解质将胰岛素聚集体降至~100-200 nm 两者结合：HA可负载聚电解质包裹的胰岛素纳米颗粒，形成复合递送系统 HA载体：提供一定的渗透能力和生物相容性聚电解质-胰岛素复合物（~100 nm）：保护胰岛素活性，防止聚集 4.2 pH响应与离子强度调控利用皮肤pH梯度皮肤表面pH约4.5-5.5（酸膜），角质层内部约5.5-6.0，真皮pH约7.4。设计pH响应型配方可实现：强酸配方（pH 2-3）用于HA-胰岛素复合：在此pH下，胰岛素（+）与HA（-）形成稳定复合物涂抹于皮肤后，接触皮肤酸膜（pH 4.5-5.5），复合物开始部分解离进入真皮（pH 7.4）后，静电排斥完全生效，胰岛素释放弱酸配方（pH 4-5）结合HA载体： HA与聚电解质-胰岛素复合物在此pH下较稳定渗透至真皮后，pH升高可能触发复合物解离，释放胰岛素离子强度的精细调控配方中适度盐浓度（50-150 mM）：优化聚电解质-胰岛素复合物的粒径和稳定性皮肤组织液高盐环境（~150 mM）：进入真皮后，盐浓度屏蔽静电作用，促进复合物解离释放 4.3 生物安全性与临床转化考量生物相容性 HA：人体天然成分，极佳生物相容性，无免疫原性壳聚糖/COS：天然多糖，可生物降解，广泛用于药物递送 PEG-PLys：PEG为FDA批准材料，PLys为天然氨基酸聚合物，低毒性皮肤刺激性阳离子聚电解质可能对皮肤有轻微刺激，需控制浓度和pH 强酸配方（pH 2-3）需评估对角质层屏障的影响（短期接触一般安全，但长期使用需监测）胰岛素稳定性与活性保持聚电解质包裹可保护胰岛素免受酶降解和聚集失活需确认释放后胰岛素的二级结构和受体结合活性完整临床给药途径经皮贴剂：HA/聚电解质-胰岛素复合凝胶，持续释放微针辅助：微针预处理增加皮肤通透性，再涂抹纳米递送系统离子导入/超声导入：物理手段协同化学促渗策略 mindmap root(递送系统设计哲学) HA分子量选择 <50 kDa 渗透强但载药少 100-300 kDa 平衡点载药量适中 >1000 kDa 载药多但难渗透聚电解质包载胰岛素 PEG-PLys 阳离子核亲水壳 ~100 nm COS壳聚糖层层自组装 pH响应解聚机制 **微米级→100 nm** pH响应设计酸性稳定pH 3.5-4.0 抑制聚集维持复合物皮肤pH梯度利用表面4.5-5.5 真皮7.4 智能释放离子强度调控适度盐50-150 mM 优化粒径组织液~150 mM 解离释放 **临床转化** 经皮贴剂微针辅助物理促渗生物安全性评估结语经皮递送大分子药物是纳米医学领域的珠穆朗玛峰——挑战巨大但回报丰厚。本文通过系统解析角质层的多尺度屏障（物理、尺寸、生化）和胰岛素的复杂聚集行为，探讨了基于聚电解质包载和pH响应释放的协同递送策略。然而，从概念验证到临床应用仍有漫长的道路。科学的严谨性要求我们不仅关注成功的案例，更要正视局限、质疑假设、完善机制。只有通过跨学科协作（皮肤生物学、药物化学、纳米材料、临床医学）、多尺度研究（分子-细胞-组织-整体）、理性设计与系统评估相结合，才能最终实现经皮大分子递送的临床转化，为全球数百万糖尿病患者带来无针、无痛、高依从性的胰岛素给药新选择。参考文献胰岛素分子动力学与构象变化 Molecular Dynamics Simulations of Insulin: Elucidating the Conformational Changes that Enable Its Binding Structural Ensemble of the Insulin Monomer Conformational Dynamics of Insulin Insulin in motion: The A6-A11 disulfide bond allosterically modulates structural transitions Additional disulfide bonds in insulin: Prediction, recombinant expression, receptor binding affinity, and stability Evolution of insulin at the edge of foldability and its medical implications 胰岛素受体结合与T/R转换 Structure of the Insulin Receptor-Insulin Complex by Single Particle CryoEM Insight into the Structural and Biological Relevance of the T/R Transition The Structure and Function of Insulin: Decoding the TR Transition Role of C-terminal B-chain residues in insulin assembly Protective hinge in insulin opens to enable its receptor engagement 胰岛素寡聚化与六聚体 Enhanced hexamerization of insulin via assembly pathway rerouting Progress in Simulation Studies of Insulin Structure and Function What Gives an Insulin Hexamer Its Unique Shape and Stability? pH依赖的自组装与聚集等周聚集模型与光散射研究 pH-dependent self-association of zinc-free Insulin characterized by concentration-gradient static light scattering Self-association of Zn-insulin at neutral pH: investigation by concentration gradient–static and dynamic light scattering 纤维化动力学与早期事件 Early events in insulin fibrillization studied by time-lapse atomic force microscopy Primary steps of pH-dependent insulin aggregation kinetics Amyloid formation of bovine insulin is retarded in moderately acidic pH Insights into Insulin Fibril Assembly at Physiological and Acidic pH 结构表征 Insulin at pH 2: Structural Analysis of the Conditions Promoting Insulin Fibre Formation Elucidation of insulin assembly at acidic and neutral pH: Characterization of low molecular weight oligomers Study of Insulin Aggregation and Fibril Structure under Different Environmental Conditions Zn²⁺与六聚体稳定性 Zinc–Ligand Interactions Modulate Assembly and Stability of the Insulin Hexamer Ultra-rapid absorption of recombinant human insulin induced by zinc chelation and surface charge masking Martini3粗粒化模拟基础方法 Martini 3 OliGo̅mers: A Scalable Approach for Multimers and Fibrils（Korshunova等2024，胰岛素二聚体参数） GōMartini 3: Protein Changes & Environmental Bias Corrections Multiscale modeling of protofilament structures: A case study on insulin amyloid aggregates（Puławski & Koliński 2025，多尺度纤维模拟）过度聚集问题与修正 Excessive aggregation of membrane proteins in the Martini model Addressing the Excessive Aggregation of Membrane Proteins in the MARTINI Model Rescaling protein-protein interactions improves Martini 3 for flexible proteins Improved Parameters for the Martini Coarse-Grained Protein Force Field Martini3-IDP: improved Martini 3 force field for disordered proteins 水模型 Polarizable Water Model for the Coarse-Grained MARTINI Force Field Development of polarizable and hydration-focused water models for the Martini 3 force field 结合能与力场验证 Coarse-grained versus atomistic simulations: realistic interaction free energies for real proteins Protein–ligand binding with the coarse-grained Martini model 正如本文标题所示，角质层的“蛋白守门员”看似固若金汤，但通过深入理解其“密码”并设计精妙的“钥匙”（如聚电解质包载、pH响应释放等策略），我们终将打开经皮给药的大门。未来属于那些既有深厚理论基础、又有创新工程思维的研究者——让我们共同期待这一领域的突破时刻。

Specific Sytems · 2026-01-07

破解角质层的蛋白守门员：角质细胞间隙/透明质酸结合蛋白的调研（中篇）

Specific Sytems · 2026-01-06

角质层结构深度解析：从纳米脂质到宏观屏障的多尺度组织

【番外篇】角质层结构深度解析：从纳米脂质到宏观屏障的多尺度组织摘要皮肤屏障的结构组织跨越从纳米级脂质双层到宏观柱状细胞排列的多个尺度。本文系统阐述了角质层的细胞间隙尺度（15-20 nm vs 40-75 nm）、水合状态的双面效应、垂直互锁柱状结构，以及外源透明质酸对角质层和活细胞层水合的影响。研究揭示：活细胞层的水合是整个皮肤水合系统的源头，AQP3水通道蛋白在基底层和棘层高表达维持60-70%的高水合状态。虽然外源HA能显著提高角质层水合度（即时+134%，6周+55%），但水合本身不等于渗透——角质层的脂质疏水排斥和柱状互锁结构、颗粒层的脂质屏障共同构成多层次阻碍。拉曼光谱证据显示，只有极低分子量HA（<50 kDa）才可能到达表皮深层。颠覆性发现：HA实际上增强而非打开紧密连接，但HA可通过CD44受体介导的跨细胞途径进入角质形成细胞触发信号通路，HA修饰的纳米载体系统（2024-2025）为高效经皮递送提供了新方向。核心结论多尺度结构层次：皮肤屏障跨越纳米（脂质双层6-13 nm周期）、细胞间隙（40-75 nm）、到宏观（15-26层柱状堆叠）多个尺度，形成化学和几何双重屏障水合的双面效应：适度水合（15-40%）维持屏障功能，过度水合（>60%）导致脂质分层、TEWL增加、微生物定植风险活细胞层水合是系统源头：AQP3水通道蛋白在基底层和棘层高表达，维持60-70%的高水合状态，是角质层水分的来源。AQP3缺失导致角质层水合降低，证明活细胞层水合对整个表皮屏障至关重要外源HA对角质层的有限作用：虽能显著提高表层水合（+134%），但水合本身不等于渗透，脂质疏水排斥和柱状互锁结构仍是根本障碍分子量的权衡：HMW-HA安全但仅表面作用，LMW-HA可渗透但破坏屏障（TEWL+55.5%），理想策略需平衡效果与安全性 HA增强而非打开紧密连接：颠覆性发现——LMW-HA和HMW-HA都上调claudin-3/4和JAM-1，增强屏障而非促进渗透，单纯依靠HA本身无法通过“松弛紧密连接”实现深层递送 CD44介导的跨细胞途径：HA通过CD44受体介导的内吞作用进入角质形成细胞，触发细胞内信号通路（Filaggrin +35%，AQP3 +16%），这是跨细胞而非旁细胞途径 HA寡糖的尺寸依赖性生物活性：100-300 kDa片段促进角质形成细胞增殖，四糖-六糖大小诱导炎症信号，二糖阻断炎症，必须精确控制分子量分布纳米载体系统的突破（2024-2025）：HA修饰的脂质体通过CD44靶向增强角质形成细胞摄取，实现高效经皮递送，临床转化前景广阔 HA衍生物的独特渗透增强机制：阳离子HA通过静电吸附脂质头基增强渗透（水合度+67%），阳离子聚合物（如壳聚糖）通过整合素-细胞骨架途径可逆性打开紧密连接（TEER降低83%），$\ce{Mg^2+}$通过构象收缩和脂质桥接双重机制增强HMW-HA角质层累积，两亲性HA通过疏水锚嵌入脂质双层实现深度相互作用。这些衍生物提供了超越天然HA的强化渗透策略背景透明质酸（HA）作为强效保湿成分广泛用于护肤品，其保湿机制长期被认为是“吸水锁水”。然而，HA能否真正渗透角质层进入活细胞层？外源HA如何影响角质层的水合状态？这些问题直接关系到HA作为经皮递送载体的可行性。要理解这些问题，必须首先深入了解角质层的多尺度结构组织：从纳米级的脂质双层排列（6-13 nm周期）、细胞间隙尺度（40-75 nm）、到宏观的柱状细胞堆叠（15-26层）。这些结构如何响应水合状态变化？外源HA如何与这些结构相互作用？本文基于最新文献，系统解析这些关键问题。角质层的多尺度结构组织细胞间隙尺度的突变表皮不同层级的细胞间隙尺度差异显著，这是理解HA渗透屏障的关键。活细胞层（基底层/棘层/颗粒层）细胞间隙：15-20 nm 填充物：亲水的HA-蛋白质复合物环境：水性、负电荷角质层细胞间脂质基质细胞间隙：40-75 nm（脂质层40-50 nm，含角质胞桥可达75-100 nm）组成：3-8层脂质双层（典型10层）堆叠环境：极度疏水、电中性脂质双层周期性：短周期相（SPP）：6.0-6.5 nm（正交烃链）长周期相（LPP）：13.0-13.9 nm（六方烃链）角质层组织尺度参数细胞层数：一般部位15-26层，手掌/足底可达100层单细胞尺寸：直径30-50 μm，厚度0.5-1.0 μm（高度扁平化）总厚度：脸颊16.8 μm，手掌173 μm（vs. 一般10-40 μm）垂直互锁的柱状结构角质细胞形成高度有序的垂直互锁柱状结构（vertical interlocking columns）：柱状组织：10-30个扁平角质细胞垂直堆叠成“柱”，整个角质层由数百个柱并排组成互锁机制：相邻柱通过角质胞桥（corneodesmosome）交联，细胞形状为扁平十四面体（Kelvin’s tetrakaidecahedron），最紧密堆积选择性降解：角质层下层，角质胞桥分布在整个细胞表面；中上层仅保留在细胞边缘，形成海绵状或气泡膜状结构脂质填充：脂质基质连续填充柱内（垂直）和柱间（横向），形成无缝三维网络，这解释了垂直和横向间隙厚度相似（40-75 nm）曲折路径：物质渗透必须通过三维曲折路径（tortuous pathway），HA等亲水大分子无法找到“捷径” 关键发现：文献中未明确区分垂直vs横向细胞间隙，40-75 nm指相邻细胞间脂质基质厚度，方向无差异。各向异性主要体现在扩散动力学而非物理间隙大小。板层颗粒与脂质分泌的分子机制板层颗粒（lamellar granules, LGs）是颗粒层细胞中的膜包被细胞器，它分泌的内容物填充了角质层细胞间隙——包括构建脂质双层的脂质、修饰角质桥小体的蛋白（如corneodesmosin）、调控降解的蛋白酶系统以及抗菌肽。板层颗粒的超微结构板层颗粒是角质形成细胞中的膜包被细胞器，具有独特的结构特征：尺寸：直径约100-300 nm 起源：从反式高尔基网络（trans-Golgi network, TGN）起源，属于溶酶体相关细胞器家族内部结构：特征性的层状内含物（lamellar contents），但也可观察到非层状区域，反映了LG内容物的异质性分布：初步形成于浅层棘层，在颗粒层累积图：板层颗粒与trans-Golgi network的关联及Rab11介导的膜转运（左图显示corneodesmosin阳性的LG与TGN46阳性的TGN紧密关联；右图显示Rab11标记沿CDSN阳性LG分布）板层颗粒的货物分类 LGs不仅转运脂质，还运载多种功能性货物，这些货物在LG内形成分离的聚集体：脂质和脂质处理酶：构建细胞间脂质层状结构结构蛋白：如corneodesmosin，释放后特异性结合到桥粒上蛋白酶和蛋白酶抑制剂：如kallikrein相关肽酶（KLKs）和LEKTI，调控角质桥小体降解抗菌肽：提供皮肤的微生物屏障功能关键机制：不同货物形成离散聚集体的精密组织确保了它们在正确的时间、正确的位置发挥功能。例如，KLK8和corneodesmosin在同一LG内形成不同的聚集体，分泌后corneodesmosin专一地结合到桥粒。板层颗粒的膜转运分子机制 LGs从反式高尔基网络（TGN）到细胞顶端质膜的转运涉及多个关键蛋白：CHEVI复合物（VPS33B + VIPAR）调控囊泡对接，Rab11a介导膜转运，SNAP29介导囊泡-质膜融合，ABCA12转运脂质到LG腔内。这些蛋白的突变导致不同类型的鱼鳞病，凸显了LG转运对皮肤屏障形成的关键作用。角质桥小体的分子组装与降解角质桥小体（corneodesmosomes）是角质层细胞间粘附的主要结构，其形成和降解的精密调控对皮肤屏障功能和正常脱屑至关重要。从桥粒到角质桥小体的转变桥粒是从基底层到颗粒层的主要细胞间粘附结构。在颗粒层，corneodesmosin从LGs释放并结合到桥粒的细胞外部分。当桥粒斑块蛋白交联形成角质细胞包膜时，桥粒转变为角质桥小体。图：细胞间脂质层状结构、角质桥小体和桥粒的透射电镜图（上图A显示角质桥小体的细胞外部分充满高电子密度斑块，细胞内桥粒斑块与角质细胞包膜连续；下图B显示桥粒细胞外部分的三层结构）角质桥小体的位置选择性降解角质桥小体在角质层下层遍布整个细胞表面，但在上层大部分被KLKs和其他蛋白酶水解。只有位于扁平细胞边缘的角质桥小体保持未消化状态，这导致组织学切片中看到的特征性“篮筐编织”结构。位置选择性降解的机制 KLKs的作用：kallikrein相关肽酶是角质桥小体降解的主要蛋白酶，储存在LGs中，在颗粒层顶端分泌。分泌后，KLKs经过蛋白水解成熟，靶向降解corneodesmosin、desmoglein 1和desmocollin 1 LEKTI的调控：作为主要的内源性KLK抑制剂，LEKTI也储存在LGs中。分泌后被蛋白水解成多个抑制性片段，结合KLKs并抑制其蛋白水解活性紧密连接的保护作用：紧密连接衍生的屏蔽结构可能保护细胞边缘的角质桥小体免受蛋白水解降解疾病关联：桥粒和角质桥小体异常的遗传性疾病与屏障缺陷和特应性疾病相关。例如，Netherton综合征（LEKTI突变）、炎症性脱皮性皮肤病（corneodesmosin突变）等。紧密连接的几何模型与功能延伸紧密连接（tight junctions, TJs）在表皮中的功能超出了传统的屏障作用，其独特的几何排列和功能延伸为理解皮肤屏障的完整性提供了新视角。 f-TKD几何模型 Yokouchi等提出，带有紧密连接的颗粒层细胞的基本形状是扁平的Kelvin十四面体（flattened Kelvin’s tetrakaidecahedron, f-TKD）。这一模型假设TJs规则地形成于f-TKD细胞的边缘，可以解释： TJ屏障如何在细胞更新的情况下保持结构完整性如何形成规则的角质细胞堆叠紧密连接在角质层的功能延伸虽然传统观点认为TJs在颗粒层第二层（SG2）形成并在第一层（SG1）消失，但使用透射电镜和冷冻断裂电镜技术，在SG1观察到了TJ蛋白阳性的连接结构，在角质层中也检测到了TJ相关结构。这导致了新的认识：TJs的功能意义不止于SG2。TJ衍生的屏蔽结构可能围绕细胞边缘的角质桥小体，确保位置特异性的角质桥小体降解，从而维持角质层的“篮筐编织”结构和屏障完整性。角质细胞包膜与角蛋白-丝聚蛋白网络角质细胞的机械强度和屏障功能依赖于两个关键结构：外周的角质细胞包膜和内部的角蛋白-丝聚蛋白网络。角质细胞包膜的交联形成在颗粒层和角质层交界处，细胞外周的各种蛋白通过谷氨酰胺转移酶1（transglutaminase 1, TGase 1）催化的转谷氨酰胺化作用共价交联，形成角质细胞包膜（cornified cell envelope, CE）。主要成分 Loricrin和involucrin：CE的主要组成蛋白桥粒蛋白：当桥粒转变为角质桥小体时，桥粒蛋白被整合到CE中角质化脂质包膜：CE进一步与细胞外形成的角质化脂质包膜交联疾病意义：TGase 1基因的功能缺失突变导致皮肤屏障功能严重受损、CE缺失或变薄，以及细胞内可见未交联的loricrin颗粒。丝聚蛋白-角蛋白相互作用丝聚蛋白（filaggrin）在角质层的结构组织中扮演关键角色：图：Filaggrin免疫标记显示其在角质层的分布（下层角质细胞Filaggrin阳性，上层阴性；颗粒层中Filaggrin定位于角蛋白透明颗粒KHG）丝聚蛋白的转化过程合成与储存：前体形式profilaggrin在颗粒层合成，储存在角蛋白透明颗粒（keratohyalin granules, KHG）中水解与释放：当颗粒细胞分化为角质细胞时，profilaggrin被蛋白水解成许多filaggrin单体。同时，细胞核和细胞器消失，但角蛋白丝保留聚集功能：Filaggrin分子聚集角蛋白丝，形成角蛋白丝紧密嵌入基质的模式进一步降解：在更表层的角质层，filaggrin分子进一步蛋白水解并降解为氨基酸和其他小分子（即NMF的来源）屏障功能：Filaggrin缺乏导致寻常型鱼鳞病，是特应性皮炎的主要危险因素。在filaggrin基因敲除小鼠中，角蛋白模式丧失，角质细胞易于脱落，外来物质更易渗透。水合状态对角质层结构的影响正常水分梯度与调控健康皮肤存在明显的跨层水分梯度，这种梯度由天然保湿因子（NMF）和脂质层状排列共同维持：皮肤层次水分含量备注真皮 70-90% 来自皮下组织和毛细血管基底层和棘层 60-70% 真正的活细胞层颗粒层约70% 过渡层，正在角化角质层下层 40-50% 水分开始陡降角质层中上层 30-40% 继续脱水角质层表面 15-25% 40-60% RH环境条件下 NMF具有精密的环境响应性调控机制。低湿度时丝聚蛋白降解加速，NMF生成增加以补偿水分蒸发；高湿度时丝聚蛋白降解减慢，NMF生成减少以避免过度水合。这种调控依赖于狭窄的水活度窗口（0.6-0.8），丝聚蛋白向NMF转化只在此范围内高效进行。角质细胞的水合膨胀与病理性改变角质细胞对水合的响应呈现明显的剂量依赖性。正常膨胀范围内，冷冻扫描电镜直接测得的单个角质细胞（corneocyte）在低水合（18-26% wt/wt）时厚度约300-360 nm，高水合（57-87% wt/wt）时增至600-750 nm（约膨胀100%），主要是细胞本体沿法向吸水膨胀，而细胞间脂质层仍保持致密堆叠。临界阈值在85% RH，此时脂质链发生正交→六方转变，流动性显著增加。极端浸水（>300% wt/wt，长时间浸泡）才会在细胞间脂质中形成直径数百纳米至数微米的“水池”，伴随脂质层状结构分层脱离、卷曲塌陷和相分离，标志着水真正闯入脂质网络并破坏屏障。病理性水合发生于长时间高湿度暴露（4-24小时后显著）。细胞间隙出现直径数百纳米至数微米的水聚集区（水池），尺寸可超过膨胀细胞厚度（>600 nm）。脂质层发生分层脱离（delamination）、卷曲塌陷（roll-up）和相分离等破坏性改变。水合的双面效应适度水合（15-40%）是维持屏障功能的必要条件：维持柔韧性防止干裂，促进KLK5/7活性确保正常脱屑，保持脂质流动性利于损伤修复。过度水合（>60%）则带来多重危害：脂质分层脱离导致屏障完整性受损，水池形成为微生物定植提供场所，TEWL增加形成恶性循环。虽然过度水合为亲水物质提供异常渗透窗口，但这伴随着屏障损伤，属于病理性状态。外源透明质酸对角质层和活细胞层水合的影响角质层水合：核心问题外源HA能否提高角质层水合程度？答案是肯定的，但效果高度依赖分子量、配方和使用条件。 HA作为吸湿剂的机制与限制 HA是强效吸湿剂（humectant），能结合1000倍自身重量的水分：从环境吸水：高湿度（>60% RH）下从空气吸水从皮肤深层吸水：膨胀产生“充盈效应” 双向吸水风险：低湿度下可能从深层吸水至表面，导致深层脱水关键限制：HA本身不具封闭性，必须配合封闭剂（神经酰胺、角鲨烷等）锁住水分。封闭性与封闭剂：封闭性（occlusive property）指成分在皮肤表面形成疏水性薄膜、阻止水分蒸发的能力。封闭剂（occlusive agents）如神经酰胺、角鲨烷、凡士林等，通过形成物理屏障减少TEWL。HA作为吸湿剂能吸水但不能锁水，若无封闭剂保护，吸收的水分会快速蒸发，低湿度环境下甚至可能导致深层脱水。护肤配方通常采用“吸湿剂（HA）+封闭剂”的搭配策略。分子量的差异影响分子量决定了HA的渗透能力和安全性权衡。高分子量HA停留表面形成薄膜，降低TEWL 15.6%，安全但不渗透。低分子量HA可穿透角质层，但TEWL增加55.5%，破坏屏障，超低分子量还可诱导炎症。中等分子量HA平衡表面封闭和适度渗透，是较为理想的选择。临床证据外源HA对角质层水合的效果已有充分临床数据支持。即时应用可使水合度增加134%（p < 0.001），持续6周使用水合度增加55%（p < 0.001），显示出即时和长期双重效应。增强配方在标准HA基础上进一步提升效果。阳离子HA30秒应用后，水合度比LMW-HA高67%，比HMW-HA高50%，其正电荷与负电脂质头基的静电吸引是关键。交联RHA（resilient HA）使表皮水分增加7.6%，TEWL降低27.8%，结构稳定性更佳。MgCl₂增强配方显著增加HMW-HA在角质层的累积，利用金属离子改变HA构象促进渗透。 HA衍生物的化学修饰详解：阳离子HA（Cationic HA）：使用季铵盐试剂（如GTMAC，甘油三甲基氯化铵）修饰HA的羧基或羟基，引入正电荷。修饰后的HA从带负电（羧基，$\ce{-COO^-}$）转变为同时携带正电荷（季铵基团，$\ce{-N+{(CH_3)_3}}$）的两性离子聚合物，与带负电的皮肤脂质头基（磷酸基团）产生静电吸引，增强皮肤粘附和渗透交联RHA（Resilient HA）：使用BDDE（1,4-丁二醇二缩水甘油醚）作为交联剂，在HA链间形成共价键。与传统交联HA（修饰度6-10%）相比，RHA的修饰度降低至2-4%，形成更少刚性交联的长链网络，保持HA链的动态滑动能力。这种“弹性”结构使RHA在皮肤上形成更稳定的水合薄膜，减少TEWL MgCl₂增强配方：二价金属阳离子（$\ce{Mg^2+}$）通过静电桥接作用结合HA链上的羧基（$\ce{-COO^-}$），改变HA的分子构象。$\ce{Mg^2+}$诱导HA链从扩展构象收缩为紧凑构象，减小流体力学半径，使高分子量HA更易渗透角质层间隙。此外，$\ce{Mg^2+}$还能与皮肤脂质双层的负电荷磷脂头基桥接，促进HA在脂质界面的累积生物标志物变化揭示了HA的间接调控机制：Filaggrin表达增加35%促进NMF生成，Aquaporin-3表达增加16%增强水分转运能力。对HA递送策略的启示外源HA虽能显著提高角质层表层水合，但存在三大根本性局限：水合的空间局限性明显：外源HA提高的主要是角质层上层1-3层细胞的水合，通过从环境吸水和膨胀实现。这种水合未改变脂质层的疏水性质，脂质双层的SPP（6 nm）和LPP（13 nm）周期性依然完整水合增加需要代价：当水合增加到能够形成“异常渗透窗口”时，往往伴随脂质分层破坏（TEWL增加55.5%）。这是病理性状态而非生理性渗透，LMW-HA虽能穿透角质层，但其渗透过程破坏了脂质层的有序排列，导致分层脱离和相分离化学不相容性是根本障碍：即使细胞间隙从15-20 nm（活细胞层）扩大到40-75 nm（角质层），渗透困难仍未解除。关键在于填充物性质：活细胞层间隙填充亲水的HA-蛋白复合物（水性负电环境），而角质层间隙填充极度疏水的脂质双层（疏水电中性环境）。HA的带负电亲水性被脂质层完全排斥，化学不相容性远比物理间隙重要基于这些认知，有效的递送策略必须采用多管齐下的联合方案：化学修饰：阳离子化增强静电吸引，疏水修饰改善脂质层亲和性物理方法：微针、超声、海绵针等瞬时微通道技术海绵针（Sponge spicules）辅助递送：Haliclona海绵的硅质骨针可在角质层中形成微通道。研究显示，海绵针联合HA-脂质体可使250 kDa的HMW-HA透皮量显著增加，突破了传统方法只能递送LMW-HA的限制微针与HA的协同：微针预处理形成微米级通道，随后应用HA配方可增强渗透，同时HA的保湿和修复功能加速微通道愈合载体系统：脂质体、纳米粒等包载策略，利用载体保护和膜融合机制活细胞层水合：颗粒层脂质屏障的阻隔虽然外源HA能够穿透角质层，但要进一步到达棘层和基底层（典型的活细胞层），仍面临颗粒层的脂质屏障。颗粒层是角质层与活细胞层之间的过渡层，正在经历角化过程。颗粒层扮演着关键屏障角色：脂质合成中心：颗粒层细胞合成并分泌板层小体，释放脂质到细胞间隙形成角质层的脂质双层水性扩散的终点：颗粒层合成的脂质阻止水性物质通过表皮扩散，这是皮肤屏障的核心机制。健康皮肤的水分梯度从颗粒层70%陡降至角质层表面15-25%，水合的维持本质上依赖于颗粒层正因如此，从局部应用到深层进入的途径在富含脂质的颗粒层受阻，这一屏障阻止外源HA分子到达棘层和基底层等真正的活细胞层。拉曼光谱证据：渗透深度的实测 Essendoubi等（2016）利用共聚焦拉曼光谱首次证明HA在人体皮肤中的渗透深度。实验显示，极低分子量HA可到达表皮深层（颗粒层甚至棘层），而高分子量HA仅停留在角质层。定量分析证实渗透效率与分子量呈反比（低分子量渗透率14-19%，高分子量仅2.73-10.2%）。棘层和基底层的水合特征与AQP3的关键作用棘层和基底层（真正的活细胞层）维持着高水合状态（60-70%），显著高于角质层（15-40%）。这些水分包括结合水和游离水，主要来自真皮的皮下组织和毛细血管（真皮水分含量70-90%）。活细胞层水合的重要性不容忽视。这一高水合状态是整个皮肤水合系统的源头，角质层的水分正是来源于活细胞层的持续供给。活细胞层的水合调控依赖于精密的分子机制： AQP3水通道蛋白的核心地位：Aquaporin-3（AQP3）是一种水-甘油-过氧化氢转运通道，在皮肤水合中扮演关键角色。AQP3主要表达于基底层和棘层的细胞质膜，介导水和甘油从真皮-基底膜侧进入角质形成细胞，再通过细胞间隙和跨细胞途径向外层表皮（颗粒层-角质层方向）转运。AQP3表达梯度（基底层高表达，向颗粒层递减）对应着从真皮到角质层的水分递减梯度，确立了真皮→活细胞层→角质层的水分供给轴 AQP3缺失的严重后果：AQP3敲除小鼠研究显示，AQP3缺失导致表皮渗透性降低4倍以上，甘油渗透性降低2倍以上，最终使角质层水合度显著下降。这证明活细胞层的水分转运直接影响角质层水合，两者是连续统一的系统甘油的双重作用：AQP3不仅转运水分，还转运甘油。甘油在外层表皮中结合并保持水分，维持最佳皮肤水合。这解释了为何活细胞层的水合调控对整个表皮屏障功能至关重要值得注意的是，即使极低分子量HA渗透到这些深层，其作用更多是调节内源性水合系统（Filaggrin表达+35%，Aquaporin-3表达+16%），而非直接补充外源水分。外源HA可能通过生物信号通路间接增强AQP3表达，从而促进水分转运。为何棘层和基底层难以被外源HA有效水合？颗粒层脂质屏障的阻隔：即使LMW-HA能够穿透角质层，要到达颗粒层及以下的活细胞层，仍需克服颗粒层合成的致密脂质网络。这一屏障的存在使得外源HA难以大量进入活细胞层。活细胞层的内源性HA已充足：活细胞层本身富含内源性HA（真皮和表皮活区的HA-蛋白复合物），水分含量已维持在60-70%的高水平。外源HA即使少量渗透，对水合的边际贡献有限。紧密连接与细胞外基质：虽然活细胞层的细胞间隙（15-20 nm）比角质层（40-75 nm）更窄，但填充的是亲水的HA-蛋白复合物，理论上对HA更友好。然而，颗粒层的紧密连接（tight junctions）和基质组织的完整性仍限制外源大分子的自由扩散。缺乏直接证据：现有研究多关注HA在角质层的渗透和表层水合效果，对活细胞层水合的直接测量数据极为有限。拉曼光谱虽能检测HA分子的存在，但无法直接量化活细胞层水分含量的变化。结论：外源HA的深层水合效应存疑颗粒层脂质屏障是外源HA深层递送的关键障碍，只有极低分子量HA（<50 kDa）有可能到达活细胞层本身的高水合状态（60-70%）和充足的内源性HA使得外源补充的必要性降低外源HA的主要作用可能是通过调节生物标志物（Filaggrin、AQP3）间接增强内源性水合系统，而非直接补水缺乏量化数据：目前尚无充分证据证明外源HA能够显著提高活细胞层的水分含量参考文献角质层结构与水合 Ishida-Yamamoto A., Igawa S., Kishibe M. Molecular basis of the skin barrier structures revealed by electron microscopy. Exp Dermatol. 2018;27:841-846 Warner R.R., Stone K.J., Boissy Y.L. Hydration disrupts human stratum corneum ultrastructure. J Invest Dermatol. 2003;120(2):275-284. https://pubmed.ncbi.nlm.nih.gov/12542533/ Bouwstra J.A., de Graaff A., et al. Water distribution and related morphology in human stratum corneum at different hydration levels. J Invest Dermatol. 2003;120(5):750-758. https://pubmed.ncbi.nlm.nih.gov/12713576/ Egawa M., Hirao T., Takahashi M. In vivo estimation of stratum corneum thickness from water concentration profiles obtained with Raman spectroscopy. Acta Derm Venereol. 2007;87(1):4-8. https://pubmed.ncbi.nlm.nih.gov/17225008/ Caspers P.J., Lucassen G.W., et al. In vivo confocal Raman microspectroscopy of the skin: noninvasive determination of molecular concentration profiles. J Invest Dermatol. 2001;116(3):434-442. https://pubmed.ncbi.nlm.nih.gov/11231318/ Murata T., Honda T., Mostafa A., Kabashima K. Stratum corneum as polymer sheet: concept and cornification processes. Trends Mol Med. 2022;28(5):350-359. https://doi.org/10.1016/j.molmed.2022.02.008 外源透明质酸的水合效果 Benefits of topical hyaluronic acid for skin quality and signs of skin aging: From literature review to clinical evidence - Bravo et al. Dermatologic Therapy. 2022 Efficacy Evaluation of a Topical Hyaluronic Acid Serum in Facial Photoaging - PMC, 2021 Cationic Hyaluronic Acid Improves Dry Skin Condition - Juniper Publishers, 2025 Biocompatible topical delivery system of high-molecular-weight hyaluronan into human stratum corneum using magnesium chloride - Scientific Reports 2023 Pilot Comparative Study of the Topical Action of a Novel, Crosslinked Resilient Hyaluronic Acid on Skin Hydration and Barrier Function - JDD 2016 Effectiveness of topical hyaluronic acid of different molecular weights in xerosis cutis treatment in elderly - PubMed 2024 HA分子量与渗透 Essendoubi M., et al. Human skin penetration of hyaluronic acid of different molecular weights as probed by Raman spectroscopy. Skin Research and Technology. 2016;22:55-62 Skin Penetration Ability of 12 Hyaluronic Acids with Different Molecular Weights After Topical Application - Juniper Publishers Update on Low-Molecular Weight Hyaluronic Acid in Dermatology: A Scoping Review - European Medical Journal 2024 颗粒层脂质屏障与活细胞层水合 Hyaluronic acid: A key molecule in skin aging - PMC Skin hydration: a review on its molecular mechanisms - Verdier-Sévrain, Journal of Cosmetic Dermatology 2007 In vivo confocal Raman spectroscopy: The window into the skin - Crowther, International Journal of Cosmetic Science 2024 Current Views on Noninvasive in vivo Determination of Physiological Parameters of the Stratum Corneum Using Confocal Raman Microspectroscopy - Skin Pharmacology and Physiology 2022 Liposomal Hyaluronic Acid Enhances Skin Permeation and Hydration: Evidence from In Vitro, Ex Vivo, and In Vivo Studies - PMC 2024 AQP3水通道蛋白与活细胞层水合 Hara-Chikuma M., Verkman A.S. Aquaporin-3 in the epidermis: more than skin deep. Am J Physiol Cell Physiol. 2020 Aquaporins: An Introduction to a Key Factor in the Mechanism of Skin Hydration. Dermatoendocrinol. 2012 Changes in Transepidermal Water Loss and Skin Hydration according to Expression of Aquaporin-3 in Psoriasis. Ann Dermatol. 2012 Aquaporin-3 in Keratinocytes and Skin: Its Role and Interaction with Phospholipase D2. Arch Biochem Biophys. 2011 Epidermal Hyaluronan in Barrier Alteration-Related Disease. Cells. 2021 CD44受体介导的跨细胞途径与紧密连接调控 Rios de la Rosa J.M., et al. Binding and Internalization in Receptor-Targeted Carriers: The Complex Role of CD44 in the Uptake of Hyaluronic Acid-Based Nanoparticles. Adv Healthc Mater. 2019 CD44-mediated uptake and degradation of hyaluronan. Matrix Biol. 2001 Lee H.J., et al. Upregulation of tight junction-related proteins by hyaluronic acid in human HaCaT keratinocytes. Tissue Barriers. 2023 Keratinocyte junctions and the epidermal barrier. Semin Cell Dev Biol. 2007 Epidermal tight junctions in health and disease. Tissue Barriers. 2015 HA寡糖的尺寸依赖性生物活性 Deed R., et al. Specific Sizes of Hyaluronan Oligosaccharides Stimulate Fibroblast Migration and Excisional Wound Repair. PLoS One. 2014 Oligosaccharides of hyaluronic acid increased epidermal cell stemness by modulation of integrin expression. J Cosmet Dermatol. 2013 Jiang D., et al. Hyaluronan, a Crucial Regulator of Inflammation. Front Immunol. 2011 Hyaluronic Acid Oligosaccharides Suppress TLR3-Dependent Cytokine Expression in a TLR4-Dependent Manner. PLoS One. 2013 The anti-inflammatory activity of specific-sized hyaluronic acid oligosaccharides. Carbohydr Polym. 2022 HA修饰的纳米载体系统 Wang Y., et al. High molecular weight hyaluronic acid-liposome delivery system for efficient transdermal treatment. Biomater Adv. 2024 Oligomeric hyaluronic acid-modified liposomes effectively improved skin permeability and anti-ageing activity. Sci Rep. 2025 Hyaluronic acid-liposomes hybridized with HucMSC exosomes for enhanced exosomes transdermal delivery. Int J Biol Macromol. 2025 Rationalizing the Design of Hyaluronic Acid-Decorated Liposomes for Targeting Epidermal Layers. Mol Pharm. 2021 Hyaluronic Acid in Nanopharmaceuticals: An Overview. Pharmaceutics. 2024 HA影响角质层通透性的物理化学机制 Witting M., et al. Interactions of hyaluronic acid with the skin and implications for dermal delivery of biomacromolecules. Mol Pharm. 2015;12(10):3538-3550. DOI: 10.1021/mp500676e Smith P., et al. On the interaction of hyaluronic acid with synovial fluid lipid membranes. Phys Chem Chem Phys. 2019;21:9845-9857. DOI: 10.1039/C9CP01532A Zanchetta C., et al. Hyaluronic Acid in Topical Applications: Various Forms and Biological Effects of a “Hero” Molecule. Biomolecules. 2025;15(12):1656. DOI: 10.3390/biom15121656 Papino M.G., et al. Recent Advances of Hyaluronan for Skin Delivery: From Structure to Fabrication Strategies and Applications. Polymers. 2022;14(22):4833. DOI: 10.3390/polym14224833 Ions in hyaluronic acid solutions. J Biol Chem. 2009 Warner R.R., Stone K.J., Boissy Y.L. Hydration disrupts human stratum corneum ultrastructure. J Invest Dermatol. 2003 Bouwstra J.A., Gooris G.S., et al. The physics of stratum corneum lipid membranes. J Lipid Res. 2016 Mori N., Morita K., et al. New Functions of Low-Molecular-Weight Hyaluronic Acid on Epidermis Filaggrin Production and Degradation. Cosmetics. 2021 Understanding the Role of Natural Moisturizing Factor in Skin Hydration. Practical Dermatology. 2012 Hsu C.Y., et al. Applications and delivery mechanisms of hyaluronic acid used for topical/transdermal delivery. Int J Pharm. 2020 Akdeniz M., et al. Skin Structure, Physiology, and Pathology in Topical and Transdermal Drug Delivery. Pharmaceutics. 2024 Non-invasive skin topical delivery of hyaluronan. bioRxiv. 2025 HA衍生物和阳离子聚合物的渗透增强机制 Cationic Hyaluronic Acid Improves Dry Skin Condition. Juniper Publishers. 2025 Hyaluronic acid and HA-modified cationic liposomes for promoting skin penetration and retention. J Control Release. 2023 Biocompatible topical delivery system of high-molecular-weight hyaluronan into human stratum corneum using magnesium chloride. Sci Rep. 2023 Detection of a new reaction by-product in BDDE cross-linked autoclaved hyaluronic acid hydrogels. Med Devices. 2018 Efficacy and Safety of 3 New Resilient Hyaluronic Acid Fillers. Dermatol Surg. 2019 Mechanism and consequence of chitosan-mediated reversible epithelial tight junction opening. Biomaterials. 2011 Effect of chitosan on epithelial cell tight junctions. Pharm Res. 2004 Quaternization of high molecular weight chitosan for increasing intestinal drug absorption. Sci Rep. 2023 The complex nature of calcium cation interactions with phospholipid bilayers. Sci Rep. 2016 Effect of Calcium and Magnesium on Phosphatidylserine Membranes. Biophys J. 2012 Magnesium Induced Lipid Bilayer Microdomain Reorganizations. Biophys J. 2009 Chemical Modification of Hyaluronan and Their Biomedical Applications. Polymers. 2022 本文基于2023-2025年最新文献系统整理，深度解析皮肤屏障的多尺度结构组织、水合调控机制，以及外源透明质酸对角质层和活细胞层水合的影响。研究揭示了“水合≠渗透”的关键认知：虽然外源HA能显著提高角质层表层水合，但角质层脂质层的疏水排斥、柱状互锁结构以及颗粒层的脂质屏障共同构成多层次阻碍。拉曼光谱证据显示，只有极低分子量HA（<50 kDa）可能到达表皮深层，但对活细胞层水合的直接贡献仍缺乏充分证据。这些发现对于理解HA护肤品的实际作用机制和设计有效的经皮递送策略具有重要指导意义。

Specific Sytems · 2026-01-06

单步O-GlcNAc标记锁定FEN1糖基化控制细胞周期

单步O-GlcNAc标记锁定FEN1糖基化控制细胞周期本文信息标题: “一步式”酶促标记揭示O-GlcNAc参与FEN1介导的细胞周期作者: Yinping Tian, Qiang Zhu, Zeyu Sun, Didi Geng, Bingyi Lin 等，通讯作者是 Wen Yi 发表时间: 2021年11月2日单位: 浙江大学生命科学学院、浙江大学第一附属医院（中国杭州）；北京生命科学研究所（中国北京）；南方科技大学（中国深圳）；中科院上海药物所（中国上海）引用格式: Tian, Y., Zhu, Q., Sun, Z., Geng, D., Lin, B., Su, X., He, J., Guo, M., Xu, H., Zhao, Y., Qin, W., Wang, P. G., Wen, L., & Yi, W. (2021). One-Step Enzymatic Labeling Reveals a Critical Role of O-GlcNAcylation in Cell-Cycle Progression and DNA Damage Response. Angewandte Chemie International Edition, 60, 26128–26135. https://doi.org/10.1002/anie.202110053 摘要 O-连接N-乙酰葡糖胺是一种对细胞功能至关重要且遍布全蛋白质组的翻译后修饰，其水平发生扰动会直接改变细胞周期推进与DNA损伤应答，但具体机制尚不清楚。本文开发高灵敏度的一步酶促策略，在细胞内直接捕获并描绘O-GlcNAc化蛋白。依托该策略，团队发现DNA合成必需酶FEN1是新的O-GlcNAc底物，且其修饰量在整个细胞周期中动态调控。FEN1的Ser352位点发生O-GlcNAc会破坏其在复制焦点与PCNA的互作，引发细胞周期紊乱、DNA复制缺陷、DNA损伤积累，并显著提高对损伤试剂的敏感性。该工作既提供可精准描绘O-GlcNAc蛋白的敏感方法，也揭示了O-GlcNAc调控细胞周期与DNA损伤应答的全新机制。核心结论 K279A突变体可以高效转移生物素化UDP-GalNAc，实现一步式O-GlcNAc捕获一步式流程在HEK293T细胞中识别出740种O-GlcNAc蛋白，较传统方案多247个低丰度靶标 Ser352糖基化的周期性体现在G1期约30%、S期约4，并对DNA损伤信号高度敏感 S352 O-GlcNAc的亲和力损失使FEN1与PCNA的结合下降一个数量级，引发S期延迟和DNA损伤累积背景 O-GlcNAc修饰是发生在丝氨酸或苏氨酸上的可逆糖基化，负责在代谢、信号转导和细胞周期之间传递单糖指令。传统两步式化学放大策略依赖GalT转移含叠氮的GalNAz，再以CuAAC接枝生物素或荧光团，但二次点击反应常受速率慢、非特异副反应及细胞环境干扰，限制了对低丰度底物的捕获深度。 DNA复制与损伤修复对酶促PTM高度敏感。FEN1在RNA引物切除与长片段修复中是不可或缺的核酸内切酶，虽然其磷酸化、乙酰化与泛素化已被深入研究，但迄今尚无糖基化证据，导致我们难以理解糖代谢信号如何反馈到复制与损伤应答。多尺度调控要靠能够兼具灵敏度与特异性的原位糖蛋白捕获手段，才能系统揭示O-GlcNAc网络并解析其如何影响细胞周期、蛋白互作与DNA稳态。关键科学问题工程化糖基转移酶的问题：能否将含宏观报告基团的UDP-GalNAc直接转移至O-GlcNAc位点，从而省略易出错的化学点击步骤？一步式方法的覆盖度与特异性：是否优于传统两步法，并能识别此前未被发现的低丰度O-GlcNAc蛋白？ FEN1糖基化的周期性与机制：是否通过特定途径影响PCNA互作、DNA复制与损伤应答？创新点结构引导定位GalT1瓶颈（K279/F280）并构建K279A突变体，配合生物素化UDP-GalNAc实现“一步式”标记 PNGaseF预处理+HRP-streptavidin检测与定量蛋白质组学结合显著提升O-GlcNAc鉴定深度 FEN1 Ser352的动态O-GlcNAc 被首次证明可破坏FEN1-PCNA界面、调控复制进程与DNA损伤积累研究内容方法概览：结构引导的GalT1工程与生物素化UDP-GalNAc 研究团队从GalT1晶体结构（PDB 1OQM）切入，确认K279/F280位于活性口袋入口并构成容纳大位阻供体的瓶颈。GalNAc部分沿着催化口袋直径延伸，N-乙酰基距离L255、M277、K279、F280、Y289等残基的甲基约5 Å，提示这些位点直接界定C2位取代基的空间。对于希望复现或扩展分子模拟的研究者而言，L255-M277-K279-F280-Y289围成的入口环就是评估体积效应的最小结构单元。通过突变K279A、F280A及双突变，配合自制四类UDP-GalNAc衍生物，筛选出在HPLC酶学与肽基底实验中活性最优的GalT1-K279A。模拟提示：相对于GalT1-Y289L（文中称GalT1），K279A让供体C2方向多出可容纳约3 Å投影长度的空腔，因此在建模时可将C2位以长链生物素接头替代而不会与F280、Y289产生排斥；若想评估更大供体，可进一步同时削弱F280与入口侧链的疏水堆叠。入口对齐建议：在构建分子动力学体系时，把K279A侧链旋转到同GalNAc乙酰基同平面，可最大化C2方向空腔；若需快速筛选突变，可先利用L255/M277/F280的侧链体积作为单纯几何判据，再进入昂贵的MD阶段。 graph TB direction LR A["结构分析确定K279/F280限制C2位修饰"] --> B["定点突变并表达纯化单/双突变体"] B --> C["合成UDP-GalNAz与生物素/荧光修饰UDP-GalNAc"] C --> D["HPLC+肽底物评估kcat/Km，筛选GalT1-K279A+UDP-GalNAc-Biotin组合"] D --> E["在细胞裂解液中联合PNGaseF预处理与HRP-streptavidin检测"] E --> F["Streptavidin磁珠富集→LC-MS/MS蛋白质组学鉴定"] GalT1-K279A对生物素化供体的$k_\text{cat}$提升约7倍，$k_\text{cat}/K_m$达$125.9\,\mathrm{M^{-1}s^{-1}}$，远高于野生型（$17.6\,\mathrm{M^{-1}s^{-1}}$），为一步式标记奠定基础。尽管如此，作者指出K279A对UDP-GalNAc-Biotin的催化效率仍只有原生GalT1/UDP-GalNAc的约1/6，这意味着在放大实验中要为供体转移预留更高的酶量或更长的反应时间。当供体混合时，K279A利用生物素供体的效率约为UDP-GalNAz的1/65，而野生型仅为1/100，这个数字是调度糖核苷酸比例的直接参数，提供了评估供体混合体系的动力学参考。 SI中的动力学数据可为分子建模和酶工程提供更精确的边界条件：供体酶 $k_\text{cat}$ (s$^{-1}$) $K_m$ (µM) $k_\text{cat}/K_m$ (M$^{-1}$s$^{-1}$) 备注 UDP-GalNAc GalT1-Y289L $0.188 \pm 0.007$ $228.9 \pm 23.6$ $821.3 \pm 30.1$ 天然底物基线 UDP-GalNAz GalT1-Y289L $0.105 \pm 0.002$ $127.9 \pm 10.6$ $822.7 \pm 35.2$ 叠氮底物亲和下降约1.8倍 UDP-GalNAc-Biotin GalT1-Y289L $0.001 \pm 0.00004$ $72.5 \pm 8.5$ $17.6 \pm 4.3$ 大位阻供体导致催化受阻 UDP-GalNAc-Biotin GalT1-K279A $0.007 \pm 0.0002$ $57.2 \pm 6.1$ $125.9 \pm 26.2$ K279A恢复催化并改善结合 UDP-GalNAc-Biotin GalT1-F280A $0.001 \pm 0.00003$ $49.3 \pm 5.0$ $28.1 \pm 6.4$ F280A主要降低$K_m$ UDP-GalNAc-Biotin GalT1-K279A/F280A $0.002 \pm 0.00005$ $46.8 \pm 5.4$ $52.4 \pm 9.9$ 结合与催化折中表格显示K279A在催化速率上提供主要增益，而F280A偏向优化配体结合，因此在构建势能面或筛选突变组合时，可将K279A视作“速率控制”，F280A视作“入口调谐”位点。 SI的供体特异性筛选提供了更快速的活性优先级参考：供体 GalT1-Y289L相对活性 K279A F280A K279A/F280A UDP-GalNAc $100 \pm 9$ $137 \pm 4$ $202 \pm 6$ $200 \pm 2$ UDP-GalNAz $98 \pm 2$ $101 \pm 5$ $19 \pm 1$ $21 \pm 2$ UDP-GalNAc-Biotin $2 \pm 0.3$ $11 \pm 0.5$ $4 \pm 1$ $9 \pm 0.7$ UDP-GalNAc-Click-Biotin $2 \pm 0.6$ $9 \pm 0.6$ $2 \pm 0.6$ $4 \pm 0.7$ UDP-GalNAc-NBD $1 \pm 0.1$ $5 \pm 0.7$ <$1$ $1 \pm 0.7$ 相对活性表说明K279A是唯一对所有大位阻供体保持>5%残余活性的突变，如果在分子模拟里要同时评估不同探针，可优先以K279A结构为母本，再在局部引入F280A等额外修饰。 Table S1列出的“供体特异性”数据显示，GalT1-Y289L在短连接子的UDP-GalNAc-Click-Biotin（图1C第二行左侧）和UDP-GalNAc-NBD（右侧）上仅保留约2%和1%的相对活性，即便换成K279A突变也只有9%和5%左右；F280A和K279A/F280A更低，很多组合都落在2–4%区间，甚至对NBD供体几乎无活性。这说明短连接子的两个供体虽然在图1C中展示，但实验确实证实“突变体对它俩的效率也不高”，所以作者后续主推的是长链生物素供体（图1C第一行左侧），并没有在细胞里继续用那两个短linker。图S4：UDP-GalNAz与生物素供体的竞争实验 A：HPLC示意浓缩了“同池竞争”的设置，500 µM UDP-GalNAz与500 µM UDP-GalNAc-Biotin共同存在，产品峰面积直接反映哪一种被优先转移。 B：条形量化表明GalT1只会把1/100的生物素供体转移出去，而K279A能把比例提高到约1/65，正好对应正文提到的数据，读者可以用它来复现或校准反应。图1：GalT1结构指导的一步式标记设计 A：示意图直观对比“两步法”与“一步法”，并给出三次重复的柱状数据，同量裂解液下信噪比几乎翻倍。 B：结构放大图突出K279/F280与GalNAc乙酰基仅5 Å的距离，说明入口空间受限，需要借助K279A/F280A让长链生物素挤出通道。 C：四种供体结构揭示不同接头长度的适配性；表S1显示短接头（Click-Biotin、NBD）活性<10%，因此这些供体只作为对照而非推荐方案。图S1：SI中的GalT1突变位点解析左图以PDB 1OQM为底，放大显示L255、M277、K279、F280、Y289围成的入口；黄色虚线标注它们到GalNAc乙酰基的距离，强调5 Å这一关键空间限制。右上角的球棍图展示Y289L如何让C2位容纳小修饰，而K279A/F280A提供更大的侧向空间，为我们理解图1B的突变选择提供直观依据。该图也给出供体模式图，说明短接头（NBD、Click-Biotin）一旦进入紧窄入口就会被卡住，与表S1中<10%的残余活性相吻合。蛋白质组学：一步式捕获拓宽O-GlcNAc图谱 PNGaseF清除N-糖干扰后，实验团队把传统两步法与新的一步法放在同一块胶上直接比较（图2A），结果显示一步法在同量裂解液下能把信噪比提高到原来的两倍左右。随后在图2B中，他们刻意去掉PNGaseF以检验是否会误标N-糖，发现信号几乎不变，说明真正被捕获的都是O-GlcNAc。图2C再加入TMG和OSMI-4这类药物，OGA抑制剂TMG让信号进一步增强而OGT抑制剂OSMI-4几乎让信号归零，直接坐实“一步法专抓O-GlcNAc”。最后图2D用韦恩图告诉我们，一步法在1% FDR阈值下识别出740个蛋白，比两步法多247个，这个差值主要来自IMP1、importin β等低丰度靶标。图S5进一步展示了25 µM UDP-GalNAc-Biotin和0.3 µM GalT1-K279A即可使信号达到平台期，使得读者可以复现实验所需的供体与酶用量。图S5：不同UDP-GalNAc-Biotin浓度与酶量的条件优化 A：在0-100 µM的UDP-GalNAc-Biotin梯度下，信号在25 µM附近达到稳态，为后续细胞实验提供供体浓度依据。 B：改变GalT1-K279A用量可见0.3 µM即可饱和反应，避免不必要的酶消耗。图2：一步式捕获的灵敏度与蛋白质组学覆盖度 A：胶图配合定量柱展示同量裂解液、相同显色条件下的一步法信噪比；提升幅度目测翻倍。 B：PNGaseF前后信号重合，说明N-糖不会误标；这里强调一步法抓的确实是O-GlcNAc。 C：TMG（100 µM）让信号增强而OSMI-4（20 µM）几乎抹去信号，药物控制直接证明该流程的特异性。 D：韦恩图给出740 vs 570的数量差异，额外247个低丰度靶标构成推广该流程的核心数据。 FEN1糖基化的动态与定位效应蛋白质组学筛到FEN1后，作者先用传统两步法确认这个底物确实存在（图3A），接着在图3B中展示只要让OGT工作得更快或抑制OGA，FEN1糖基化量就立刻攀升，说明它受经典OGT/OGA轴调控。图3C-3D把HeLa细胞同步到G2/M再释放，算出G1阶段约30% FEN1被糖基化、S期只有4%，具体数字让“糖基化节律”变得可量化。图3E又告诉我们UV、CPT、MMC、H₂O₂等复制压力都能把糖基化推高，说明FEN1糖基化是对损伤信号十分敏感的动态开关。图3F配合图S8的LC-MS/MS光谱进一步锁定S352：S352A几乎把糖基化降到1/5，而S351A影响甚微，与质谱诊断离子完全吻合。图3：FEN1 O-GlcNAc的动态调控 A：输入/洗脱泳道配合anti-Flag免疫印迹，确认FEN1确实带有O-GlcNAc修饰。 B：OGT过量或TMG处理都会让条带变深，说明修饰量受经典OGT/OGA轴调控。 C-D：细胞同步实验定量出G1约30%、S期约4%的占比，把“糖基化节律”转化为可视化数字。 E：UV、CPT、MMC、H₂O₂等损伤剂全部推高糖基化，强调它对复制压力的敏感性。 F：S352A几乎抹去信号、S351A影响甚微，与LC-MS/MS定位的主位点完全吻合。 PCNA互作受阻与DNA复制缺陷结构模拟显示S352位于FEN1与PCNA的β-α-β界面，并且通过两根氢键抓住PCNA的M119/L121。Figure 4A用结构图把这两根氢键画得清清楚楚；图4B则在细胞里直接演示当糖基化被TMG推高或者OGT过量时，FEN1拉下来的PCNA信号就大幅下降，从实验上印证“糖基化削弱互作”这一结论。图S10和图S13进一步给出全长FEN1及S352A/S352C肽段的ITC拟合曲线，显示糖基化会压低放热峰、让$K_a$从$7.04\times10^5$跌到$5.01\times10^4\,\mathrm{M^{-1}}$。对于构建FEN1-PCNA复合物的模拟者来说，必须保持S352—M119/L121的氢键作为初始约束，否则复现实验趋势会十分困难。免疫共沉淀与ITC验证，S352 O-GlcNAc使肽段与PCNA的亲和力从$K_a = 7.04 \times 10^5\,\mathrm{M^{-1}}$下降到$5.01 \times 10^4\,\mathrm{M^{-1}}$。全长FEN1的$K_a$约$6.02 \times 10^4\,\mathrm{M^{-1}}$。图S10：全长FEN1与PCNA的ITC曲线左侧的热量变化与右侧的拟合曲线详细展示了$K_a = 6.02 \times 10^4\,\mathrm{M^{-1}}$如何拟合出来，供需要复现的读者参考注入体积、浓度与温度。曲线也表明糖基化会把放热峰大幅压低，使得拟合斜率减小，与正文“亲和力下降一个数量级”完全一致。图S13：S352A与S352C肽段的ITC对比面板A（S352A）保留较强的结合，而面板B（S352C）曲线明显变平，直观展示$K_a$从$7.04 \times 10^5$跌到$5.01 \times 10^4\,\mathrm{M^{-1}}$的全过程。图中也给出了注射体积、间隔等实验参数，方便想要重复该实验或开展模拟的研究者取用。图4：S352糖基化破坏FEN1-PCNA互作 A：结构图突出S352与PCNA M119/L121之间2.8-3.0 Å的氢键网络，解释糖基化为何会破坏界面。 B：免疫共沉淀条形图展现OGT/TMG处理导致PCNA信号显著下降，是“糖基化越高、结合越弱”的直接证据。 C：ITC曲线提供定量数据，未糖基化肽段$K_a = 7.04 \times 10^5\,\mathrm{M^{-1}}$，糖基化后降到$5.01 \times 10^4\,\mathrm{M^{-1}}$，全文还给出全长FEN1的$K_a = 6.02 \times 10^4\,\mathrm{M^{-1}}$供校准。细胞表型：FEN1糖基化驱动复制压力与DNA损伤为了模拟不同糖基化状态，作者构建了S352A（低糖）和S352C（S-GlcNAc，高糖）两个突变体。Figure 5A-B通过RL2抗体验证S352C确实维持高糖基化并可被OSMI-4抑制；图5C的流式细胞术进一步显示高糖状态会让S期比例居高不下、晚S/G2堆积，说明复制进程被拖慢。图5D的EdU实验把这一现象可视化：绿色的复制信号明显减少，尤其在H₂O₂胁迫下差距更大。图5E的γH2AX染色又告诉我们DNA断裂在持续累积，而图5F的MTT曲线则收尾：在100 µM H₂O₂环境里，高糖的细胞存活率远低于野生型，说明糖基化让细胞对氧化压力更脆弱。图5：FEN1高糖基化导致细胞周期与DNA损伤异常 A-B：免疫印迹与定量条形证实S352C保持高O-GlcNAc且可被OSMI-4抑制，为“高糖模型”奠定基础。 C：流式细胞图展示S352C或TMG导致S期延长、晚S/G2阻滞，复刻了复制压力升高的表型。 D：EdU图像“绿色少、红色多”，特别在H₂O₂下差异更大，说明复制速度确实下降。 E：γH2AX免疫荧光与统计表明DNA断裂积累，与复制缺陷相呼应。 F：MTT曲线显示在100 µM H₂O₂条件下S352C存活率明显低于WT，体现“糖基化越高越脆弱”。结果逻辑图：从酶工程到细胞周期调控 graph TB subgraph S1["1.酶工程与化学合成"] direction LR A1("GalT1-K279A容纳生物素化UDP-GalNAc") --> A2("一步式转移显著提升信噪比") end subgraph S2["2.蛋白质组学洞察"] direction LR B1("HEK293T等细胞裂解液") --> B2("Streptavidin富集+LC-MS/MS") B2 --> B3("识别740个O-GlcNAc蛋白") B3 --> B4("新底物FEN1浮现") end subgraph S3["3.FEN1功能后果"] direction LR C1("S352 O-GlcNAc随细胞周期与DNA损伤波动") --> C2("糖基化削弱FEN1-PCNA互作") C2 --> C3("复制位点解离→S期延长与复制压力") C3 --> C4("gH2AX积累、H₂O₂敏感性上升") end S1 --> S2 --> S3 Q&A Q1: 一步式GalT1-K279A策略为何能显著提升捕获灵敏度？ A1: 传统两步法需在GalNAz标记后再进行CuAAC，第二步常受限于慢速点击和非特异副反应，导致部分低丰度O-GlcNAc蛋白在富集前已流失。K279A扩大供体入口、让生物素化UDP-GalNAc一次转移完成, 既规避点击副反应，也把处理时间缩短，从而额外识别247个低丰度靶标（IMP1、importin β等）。 Q2: 为什么S352A并未完全代表“低糖”状态，反而也削弱了PCNA互作？ A2: 结构分析显示S352羟基与PCNA M119/L121形成氢键网络；Ser→Ala突变直接失去氢键，PCNA结合力随之下降, 即使没有O-GlcNAc也无法复制天然丝氨酸。相比之下，S→C可形成S-GlcNAc并保留取向，因此作者将S352C视为“高糖”模型，而研究“无糖”仍需保留丝氨酸或采用化学去糖化手段。 Q3: FEN1糖基化如何与其他PTM协同或互不干扰？ A3: 作者检测K354多泛素化、S187磷酸化，发现S352C与S352A与野生型信号接近，说明S352糖基化是独立开关，不依赖其它PTM调整。不过糖基化和磷酸化都能促使FEN1脱离复制位点，暗示不同PTM可能在时间上错峰调控FEN1装配，为多PTM整合研究提供方向。关键结论与批判性总结潜在影响：一步式GalT1工程大幅提升了细胞水平O-GlcNAc蛋白组学的检测深度，为研究低丰度糖蛋白提供标准化工具；FEN1糖基化作为复制压力传感器的发现，补全了O-GlcNAc参与细胞周期与DNA损伤应答的信号轴，可能成为化疗增敏与复制压力干预的新靶点。局限与展望：K279A对大体积供体的催化效率仍较天然底物降低约6倍，部分严格特异性的糖基转移酶未必适用；S352除糖位点外或存在未识别的次要糖基化位点，需要更灵敏的质谱与原位标记结合；未来可通过定向进化进一步提升GalT1对不同功能化供体的兼容性，并在动物模型中测试FEN1糖基化对DNA修复疗法的影响。

Specific Sytems · 2026-01-06

透明质酸基水凝胶胰岛素载体：技术细节与补充结果【附录】

透明质酸基水凝胶胰岛素载体：技术细节与补充结果【附录】本文档是主文档的附录，包含详细的技术细节、数学模型、完整的实验数据表格和补充分析。交联机制的详细解释两种水凝胶体系的交联化学 ALG/HA体系：化学交联（离子交联）交联机制：海藻酸钠（ALG）含有大量羧基（$\ce{-COO^-}$），在碱性或中性条件下带负电 $\ce{Ca^{2+}}$离子作为二价阳离子交联剂 “蛋箱”（egg-box）模型：每个$\ce{Ca^{2+}}$离子可以同时与多条海藻酸盐链的羧基结合，形成三维网络结构化学反应： $2 \ce{-COO^- (ALG)} + \ce{Ca^{2+}} \rightarrow \ce{(-COO)2Ca} \text{（配位键）}$ 为什么交联： $\ce{Ca^{2+}}$与羧基形成配位共价键（coordinate covalent bond）这是化学变化，形成了新的化学键交联是不可逆的（除非用螯合剂如EDTA去除$\ce{Ca^{2+}}$）透明质酸（HA）的角色： HA也含有羧基，但在本配方中主要不参与交联 HA主要提供生物活性功能（促进伤口愈合） HA可能部分与$\ce{Ca^{2+}}$竞争结合，影响凝胶网络的柔韧性 HPMC/HA体系：物理交联交联机制：羟丙基甲基纤维素（HPMC）是纤维素醚衍生物，含有大量羟基（$\ce{-OH}$）透明质酸（HA）也含有大量羟基和羧基无需化学交联剂物理交联的三种力：氢键网络（主要）： HPMC的$\ce{-OH}$基团与HA的$\ce{-OH}$和$\ce{-COOH}$基团形成氢键水分子也参与氢键网络，形成“水合凝胶” 聚合物链缠结（chain entanglement）： HPMC（分子量通常>100 kDa）和HA（1.5 MDa）都是高分子量聚合物长链聚合物在溶液中相互缠绕，形成物理网络疏水相互作用（次要）： HPMC的甲基和羟丙基基团提供少量疏水性在水相中，疏水基团倾向于聚集，形成物理交联点为什么交联：这是物理变化，没有形成新的化学键交联是可逆的（加热、稀释或机械力可以破坏）从流变学数据可以看出：HPMC/HA在25°C和32°C下性质不同，说明氢键对温度敏感交联过程的时间依赖性为什么需要“在2-8°C下交联7天”： ALG/HA体系：真正的化学交联过程 $\ce{Ca^{2+}}$逐渐渗透到整个凝胶基质中，与羧基充分结合低温（2-8°C）减缓反应速度，使交联更均匀 7天确保交联完全，网络结构稳定 HPMC/HA体系：物理“老化”（aging）过程，不是真正的化学交联聚合物链逐渐重排，达到能量最低的稳定构象氢键网络逐渐形成和优化水分均匀分布，凝胶结构稳定低温防止微生物生长，保护胰岛素活性胰岛素后加载的必要性论文特别强调“机械引入胰岛素”是后加载方法，原因是：避免与$\ce{Ca^{2+}}$反应（ALG/HA体系）：胰岛素含有羧基（天冬氨酸、谷氨酸残基）如果在交联过程中加入，$\ce{Ca^{2+}}$可能与胰岛素结合，影响其活性避免pH变化：交联过程可能有局部pH波动胰岛素对pH敏感（最稳定pH 5-7）避免加热影响（HPMC/HA体系）： HPMC需要在80°C溶解胰岛素在高温下会变性失活完整的流变学数据旋转流变学：粘度-剪切速率关系实验条件：流变仪：RM 200（Lamy Rheology Instruments）测量系统：平板/平板几何形状（直径24 mm，角度0.45°）温度：25 ± 0.01°C和32 ± 0.01°C 剪切速率范围：7.0-100.0 $\mathrm{s^{-1}}$ 图S1-S2：25°C和32°C下两种水凝胶的对数剪切速率对对数粘度的影响详细观察：表观粘度随剪切速率增加（7.0-100.0 $\mathrm{s^{-1}}$）而降低，然后稳定，接近极限值在剪切速率 > 40 $\mathrm{s^{-1}}$ 时，聚合物链沿流动方向表现出更强的取向，并排列成更有序的结构 HPMC/HA-INS和ALG/HA-INS水凝胶在两个测试温度下均表现为剪切变稀的非牛顿流体分析样品在32°C时的粘度高于25°C时的数据流动曲线和剪切应力分析图S3-S4：25°C和32°C下两种水凝胶的对数剪切应力与对数剪切速率关系流动曲线分析显示，在两个分析温度（25°C和32°C）下，两种配方的剪切应力随剪切速率增加而增加。屈服应力完整数据： 25°C：τ₀HPMC/HA-INS = 16 Pa，τ₀ALG/HA-INS = 14.4 Pa 32°C：τ₀HPMC/HA-INS = 28.8 Pa，τ₀ALG/HA-INS = 27.0 Pa n值小于1表明，两种温度下的配方都表现出剪切变稀特性。触变性：滞后环测试图S5：25°C和32°C下两种水凝胶的滞后环使用滞后环测试确定测试系统的触变性。在增加然后减少剪切速率时测量粘度。滞后环的表面积反映了破坏水凝胶基质结构所需的能量量： 25°C：8237.511 Pa/s（HPMC/HA-INS）和7328.551 Pa/s（ALG/HA-INS） 32°C：8651.133 Pa/s（HPMC/HA-INS）和6426.959 Pa/s（ALG/HA-INS）解释：开发的水凝胶表现出触变性，这将使其能够在皮肤上涂抹和均匀分布水凝胶基质原始结构的恢复将防止水凝胶从包装中泄漏在25°C和32°C下，ALG/HA-INS制剂将确保最快的结构恢复滞后环面积越大，破坏水凝胶基质结构所需的能量越多 HPMC/HA-INS的滞后环面积较大，表明与胰岛素的结合更强，这与其较低的释放速率一致振荡流变学：振幅扫描实验条件：流变仪：Anton Paar MCR302e 测量系统：平板/平板（PP50，直径50 mm），间隙0.5 mm 频率：恒定1 Hz 应变振幅：0.1至100% 温度：25 ± 0.01°C和32 ± 0.01°C 图S6：25°C和32°C下HPMC/HA-INS水凝胶作为剪切应变函数的振幅测试结果图S7：25°C和32°C下ALG/HA-INS水凝胶作为剪切应变函数的振幅测试结果振荡流变学测试评估了弹性模量G’和粘度模量G’‘的变化。关键观察：在线性粘弹性区域内，剪切弹性模量G’保持恒定，施加的变形不会导致结构损坏温度升高导致弹性和粘度模量降低相角随剪切应力增加而增加（>45°） 25°C下的水凝胶表现出更高的刚度振荡流变学：频率扫描实验条件：频率范围：0.1至10 Hz 变形：1% 温度：25 ± 0.01°C和32 ± 0.01°C 图S8：25°C和32°C下ALG/HA-INS样品的频率扫描频率扫描显示弹性和粘度模量曲线。主要发现：在两个分析温度下，G’值都低于G’‘值，这表明粘性特征占主导地位在测量的频率范围内未观察到弹性和粘性行为之间的转变（G’ = G’‘），表明它可能发生在更高的频率 G’和G’‘曲线倾向于随频率增加而收敛在更高频率下，聚合物基质呈现出更固体的形式不同配方的模量比较： HPMC/HA-INS样品的弹性模量G’较低（与ALG/HA-INS相比），在25°C和32°C下都是如此 ALG/HA-INS样品的粘度模量（G’‘）较低（与HPMC/HA-INS相比），在两个温度下都是如此温度升高导致弹性和粘度模量降低分析的水凝胶表现出类似于液体的粘弹性特性。这可能是由于链和键重排过程中的能量分散。一些作者在分析海藻酸盐和纤维素衍生物的分散体时，也观察到频率扫描测试中粘度模量占主导地位。质构参数的完整数据和详细解释 TPA（质构剖面分析）完整图谱实验条件：仪器：Texture Analyzer TX-700（Lamy Rheology Instruments）探头：半球形探头（直径8 mm）温度：25 ± 0.1°C 重复次数：n = 3 图S9：ALG/HA-INS的质构剖面分析（TPA）图S10：HPMC/HA-INS的质构剖面分析（TPA） CRT（直接压缩松弛测试）图谱图S11：ALG/HA-INS的穿透测试（CRT）图S12：HPMC/HA-INS的穿透测试（CRT）质构参数的详细解释完整质构参数表（平均值 ± 标准差，n = 3，T = 25 ± 0.1°C）：参数 HPMC/HA-INS ALG/HA-INS p值临床意义硬度1 [N] 0.051 ± 0.01 0.086 ± 0.02 p < 0.05 压缩所需的最大力硬度2 [N] 0.056 ± 0.01 0.089 ± 0.01 p < 0.05 第二次压缩的最大力内聚性 [-] 1.088 ± 0.08 0.997 ± 0.20 NS 结构恢复能力黏附性 [mJ] 0.2 ± 0.05 0.2 ± 0.10 NS 生物黏附特性弹性 [-] 1.016 ± 0.05 1.141 ± 0.11 NS 弹性恢复能力松弛率 [%] 86.9 ± 0.88 81.8 ± 0.97 p < 0.01 应力松弛特性各参数的物理意义硬度（Hardness）：定义：第一次和第二次压缩循环中测得的最大力意义：表示水凝胶的强度和从容器中挤出的难易程度理想范围：< 1 N，确保易于应用本研究结果：两种配方均满足要求，ALG/HA-INS略高是由于化学交联网络的刚性黏附性（Adhesiveness）：定义：克服探头表面与样品之间吸引力所需的力（第一个负峰的面积）意义：与粘膜黏附特性相关，确保药物保留在应用部位本研究结果：两种配方均为0.2 mJ（无显著差异）研究发现，制剂的生物黏附特性与其黏附性之间存在相关性内聚性（Cohesiveness）：定义：第二个正峰下的面积与第一个正峰下的面积之比意义：压缩阶段后水凝胶的结构恢复能力该参数表示制剂在负载下可逆地减小其体积的能力本研究结果：两种配方无显著差异，都能良好恢复结构弹性（Elasticity）：定义：水凝胶在施加负载下变形并在负载移除后恢复其先前形状的能力本研究结果：两种配方无显著差异松弛率（Relaxation）：定义：聚合物在恒定变形下释放应力的能力本研究结果：HPMC/HA-INS的松弛率更高（86.9%），表明其在恒定压力下更容易释放应力，这与其物理交联的可逆性一致 TPA图谱解读 TPA图上正峰的高度：描述了配方的硬度特性（压缩所需的力）该值应该较低，以允许从容器中轻松挤出制剂并实现最佳应用黏附性（第一个负峰的面积）：反映了克服探头（材料表面）与配方表面之间吸引力所需的功该参数通常等同于粘膜黏附水凝胶的黏附能力确保药物保留在应用部位并保持其临床疗效内聚性（面积比）：第二个正峰下的面积与第一个正峰下的面积之比决定了压缩阶段后水凝胶的结构恢复详细实验方法材料来源胰岛素：产品：Insulatard Penfil（INS，100 IU/mL）类型：人胰岛素悬浮液，异相，长效供应商：Novo Nordisk（Bagsværd，丹麦）辅料：氯化锌、甘油、鱼精蛋白硫酸盐、氢氧化钠、磷酸氢二钠二水合物、间甲酚、苯酚、盐酸和注射用水聚合物和试剂：羟丙基甲基纤维素（HPMC）：Sigma Chemical Co.（St. Louis, MO, USA） PBS（磷酸盐缓冲盐溶液；pH = 7.4）：Sigma-Aldrich（St. Louis, MO, USA）透明质酸钠（分子量1.5 MDa）：Chemat（Gdańsk，波兰）海藻酸钠：Agnex Sp. z o. o.（Białystok，波兰）二水合氯化钙：POCH S.A.（Gliwice，波兰）甘油（86%）：PPH Microfarm（Zabierzów，波兰）所有物质均为分析纯膜材料： Strat-M®膜：Merck Millipore（Burlington, MA, USA）仪器设备释放研究： Erweka DT600桨式装置（Husenstamm，德国） Dissolution Enhancer Cell™（暴露面积3.80 cm²） Cecil UV-VIS分光光度计（CE 3021，Cambridge，UK） pH和渗透压测量： SevenCompactTM S210实验室pH计，配备InLaB®Expert Pro-ISM电极（Mettler-Toledo GmbH，Greifensee，瑞士） Gonotec Osmomat 3000渗透压计（Gonotec GmbH，Berlin，德国）流变学测试： RM 200旋转流变仪（Lamy Rheology Instruments，Champagne au Mont d’Or，法国）测量系统：MK-CP 2445，平板/平板几何形状（直径24 mm，角度0.45°）温度控制：Lamy Rheology CP-1 PLUS加热系统 Anton Paar MCR302e模块化紧凑型流变仪（Graz，奥地利）平板/平板几何形状（PP50，直径50 mm），间隙0.5 mm 质构分析： Texture Analyzer TX-700（Lamy Rheology Instruments，Champagne au Mont d’Or，法国）半球形探头（直径8 mm）离心和其他设备： MPW-300微量离心机（MPW Med. Instruments，Warsaw，波兰） Fisherbrand Isotemp加热搅拌板（Thermo Fisher Scientific，Mississauga，ON，加拿大）胰岛素定量分析方法验证分光光度法参数：分析波长：λ = 271 nm 线性方程：y = 0.453x + 0.0072 决定系数：$R^2$ = 0.999 标准差、相对标准差和变异系数：方法精密度评估为阳性完整的动力学建模数据释放动力学模型方程和参数表1：描述水凝胶胰岛素释放曲线的完整数学模型模型方程 HPMC/HA-INS参数 ALG/HA-INS参数零级模型 F = k₀ t k₀ = 0.099$R^2$adj = 0.8371AIC = 139.1119MSC = 1.5305 k₀ = 0.139$R^2$adj = 0.8458AIC = 143.5498MSC = 1.5959 一级模型 F = 1 − e−k₁t k₁ = 0.001$R^2$adj = 0.9302AIC = 121.3200MSC = 2.3778 k₁ = 0.002$R^2$adj = 0.9592AIC = 116.9775MSC = 2.9245 Higuchi模型 F = kH t0.5 kH = 1.927$R^2$adj = 0.9735AIC = 100.9586MSC = 3.3474 kH = 2.616$R^2$adj = 0.9503AIC = 120.9035MSC = 2.7282 Korsmeyer-Peppas模型 F = kKP tn kKP = 1.181n = 0.584$R^2$adj = 0.9825AIC = 93.2225MSC = 3.7158 kKP = 1.381n = 0.611$R^2$adj = 0.9644AIC = 115.1723MSC = 3.0148 Hixson-Crowell模型 F = 1 − (1 − kHC t)3 kHC = 0.001$R^2$adj = 0.9195AIC = 138.1944MSC = 2.2501 kHC = 0.001$R^2$adj = 0.9330AIC = 126.8927MSC = 2.4288 Peppas-Sahlin模型 F = kPS1 tm + kPS2 t2m kPS1 = 0.308kPS2 = −0.001m = 0.890$R^2$adj = 0.9993AIC = 27.3617MSC = 6.8520 kPS1 = 0.244kPS2 = 0.000m = 0.998$R^2$adj = 0.9967AIC = 68.2465MSC = 5.3611 Weibull模型 F = 100(1 − e−(tβ)/α) α = 133.388β = 0.701$R^2$adj = 0.9894AIC = 82.6533MSC = 4.2190 α = 155.449β = 0.801$R^2$adj = 0.9801AIC = 103.4961MSC = 3.5986 模型参数符号说明 F：时间t时累积释放的药物量 k₀：反应速率系数 k₁：速率常数 kH：溶解常数 kHC：Hixson-Crowell释放常数 kKP：基于几何形状和剂型的实验参数常数 kPS1：Peppas-Sahlin释放常数（Fickian扩散常数） kPS2：Case II松弛机制常数 m：扩散指数 n：释放指数 n ≤ 0.45：Fickian扩散 0.45 < n < 0.89：非Fickian传输 n = 0.89：Case II（松弛）传输 n > 0.89：Super Case II传输机制 t：时间 α：尺度参数 β：形状参数模型选择标准 $R^2$adj（调整后的R平方）：更高的值表示更好的拟合 AIC（Akaike信息准则）： [\text{AIC} = n\ln(\text{WSS}) + 2p] 其中： n：数据点数量 WSS：加权残差平方和 p：模型中的参数数量更低的AIC值表示更好的拟合 MSC（模型选择准则）： [\text{MSC} = \ln\left[\frac{\sum_{i=1}^{n} w_i \cdot (y_{i,\text{obs}} - \bar{y}{\text{obs}})^2}{\sum{i=1}^{n} w_i \cdot (y_{i,\text{obs}} - y_{i,\text{pre}})^2}\right] - \frac{2p}{n}] 其中： wi：权重因子 yi,obs：第i个观测y值 yi,pre：第i个预测y值 ȳobs：所有观测y数据点的平均值 p：模型中的参数数量 n：数据点数量最高的MSC值表示最佳拟合释放曲线相似性比较表2：HPMC/HA-INS和ALG/HA-INS水凝胶释放曲线的比较配方代码方程结果解释 f1HPMC/HA-INSvs. ALG/HA-INS $f_1 = \left[\frac{\sum|R_t - T_t|}{\sum R_t}\right] \cdot 100$ 34.63 不相似 f2HPMC/HA-INSvs. ALG/HA-INS $f_2 = 50 \log\left{\left[1 + \frac{1}{n}\sum(R_t - T_t)^2\right]^{-0.5} \cdot 100\right}$ 48.23 不相似符号说明： f1：差异因子 f2：相似性因子 n：时间点数量 Rt：参考样品在时间t的释放量 Tt：测试样品在时间t的释放量相似性判断标准：当f2 > 50且f1 < 15时，认为曲线相似本研究：f2 = 48.23 < 50，f1 = 34.63 > 15，因此两种配方的释放曲线不相似详细的流变学数学建模流变学模型及拟合结果表3：流变图数学建模的完整结果水凝胶温度 Herschel-Bulkley Ostwald-de Waele Bingham Casson HPMC/HA-INS 25°C τ₀ = 16.000n = 0.94K = 3.60$R^2$ = 0.998 n = 0.780K = 7.66$R^2$ = 0.994 τ₀ = 20.533$R^2$ = 0.997 τ₀ = 4.309$R^2$ = 0.997 ALG/HA-INS 25°C τ₀ = 14.400n = 0.794K = 5.91$R^2$ = 0.997 n = 0.674K = 10.7$R^2$ = 0.992 τ₀ = 32.627$R^2$ = 0.995 τ₀ = 10.236$R^2$ = 0.996 HPMC/HA-INS 32°C τ₀ = 28.800n = 0.822K = 6.34$R^2$ = 0.997 n = 0.633K = 16.1$R^2$ = 0.991 τ₀ = 49.837$R^2$ = 0.996 τ₀ = 17.353$R^2$ = 0.996 ALG/HA-INS 32°C τ₀ = 27.00n = 0.873K = 4.06$R^2$ = 0.998 n = 0.639K = 12.7$R^2$ = 0.988 τ₀ = 37.722$R^2$ = 0.997 τ₀ = 12.920$R^2$ = 0.997 流变学模型方程 Herschel-Bulkley模型（具有屈服应力的假塑性）： [\tau = \tau_0 + K\dot{\gamma}^n] Ostwald-de Waele模型（幂律模型）： [\tau = K\dot{\gamma}^n] Bingham模型： [\tau = \tau_0 + \eta_p\dot{\gamma}] Casson模型： [\tau^{0.5} = \tau_0^{0.5} + K\dot{\gamma}^{0.5}] 符号说明： τ：剪切应力 [Pa] τ₀：屈服应力 [Pa] K：稠度指数 [Pa·sn] n：流动行为指数（无量纲） n < 1：剪切变稀（假塑性） n = 1：牛顿流体 n > 1：剪切增稠 $\dot{\gamma}$：剪切速率 [s⁻¹] ηp：塑性粘度 $R^2$：决定系数（回归系数）粘度数据详解 32°C下不同剪切速率的粘度值（平均值 ± 标准差）：剪切速率 [s⁻¹] HPMC/HA-INS [Pa·s] ALG/HA-INS [Pa·s] 30 2.841 ± 0.9088 2.704 ± 0.8618 50 2.132 ± 0.6714 2.087 ± 0.7376 100 1.619 ± 0.4982 1.480 ± 0.4589 滞后环面积（触变性定量）表4：不同温度下的滞后环面积水凝胶 25°C [Pa/s] 32°C [Pa/s] HPMC/HA-INS 8237.511 8651.133 ALG/HA-INS 7328.551 6426.959 解释：滞后环面积越大，破坏水凝胶基质结构所需的能量越多 ALG/HA-INS在32°C时的滞后环面积最小，表明在应用温度下结构恢复最快 HPMC/HA-INS的滞后环面积较大，表明与胰岛素的结合更强，这与其较低的释放速率一致振荡流变学详细数据振幅扫描测试测试条件：频率：恒定1 Hz 应变振幅：0.1至100% 温度：25 ± 0.01°C和32 ± 0.01°C 关键观察：在线性粘弹性区域内，剪切弹性模量G’保持恒定温度升高导致弹性和粘度模量降低相角随剪切应力增加而增加（>45°） 25°C下的水凝胶表现出更高的刚度频率扫描测试测试条件：频率范围：0.1至10 Hz 变形：1% 温度：25 ± 0.01°C和32 ± 0.01°C 主要发现：在两个分析温度下，G’ < G’‘，表明粘性特征占主导未观察到弹性和粘性行为之间的交叉点（G’ = G’‘） G’和G’‘曲线随频率增加而趋于收敛在整个测量范围内，HPMC/HA-INS的G’低于ALG/HA-INS ALG/HA-INS的G’‘低于HPMC/HA-INS 粘弹性特性解释： G’ > G’‘：弹性占主导（固体样行为） G’ < G’‘：粘性占主导（液体样行为）研究的水凝胶为“粘弹性液体” 质构参数的详细解释 TPA（质构剖面分析）参数硬度（Hardness）：定义：第一次和第二次压缩循环中测得的最大力意义：表示水凝胶的强度和从容器中挤出的难易程度理想范围：< 1 N，确保易于应用本研究结果： HPMC/HA-INS：0.051 ± 0.01 N（硬度1），0.056 ± 0.01 N（硬度2） ALG/HA-INS：0.086 ± 0.02 N（硬度1），0.089 ± 0.01 N（硬度2）黏附性（Adhesiveness）：定义：克服探头表面与样品之间吸引力所需的力（第一个负峰的面积）意义：与粘膜黏附特性相关，确保药物保留在应用部位本研究结果：两种配方均为0.2 mJ（无显著差异）内聚性（Cohesiveness）：定义：第二个正峰下的面积与第一个正峰下的面积之比意义：压缩阶段后水凝胶的结构恢复能力本研究结果： HPMC/HA-INS：1.088 ± 0.08 ALG/HA-INS：0.997 ± 0.20 无显著差异弹性（Elasticity）：定义：水凝胶在施加负载下变形并在负载移除后恢复其先前形状的能力本研究结果： HPMC/HA-INS：1.016 ± 0.05 ALG/HA-INS：1.141 ± 0.11 无显著差异 CRT（直接压缩/松弛/张力）参数松弛率（Relaxation）：定义：聚合物在恒定变形下释放应力的能力本研究结果： HPMC/HA-INS：86.9 ± 0.88% ALG/HA-INS：81.8 ± 0.97% 显著差异（p < 0.01）比较与先前研究与壳聚糖基水凝胶的比较作者之前的研究开发了基于壳聚糖（CS）与纤维素衍生物的混合胰岛素载体。本研究与先前工作的比较：配方释放时间释放百分比基质成分 CS/HPMC 6.5小时 49% 壳聚糖/羟丙基甲基纤维素 CS/HEC 7小时 42.5% 壳聚糖/羟乙基纤维素 CS/MC 7小时 39.8% 壳聚糖/甲基纤维素 HPMC/HA（本研究） 9小时 43% 羟丙基甲基纤维素/透明质酸 ALG/HA（本研究） 9小时 57% 海藻酸钠/透明质酸主要改进：更长的释放时间（9小时 vs. 6.5-7小时） ALG/HA系统实现了更高的释放百分比（57%）透明质酸的引入增加了生物活性功能（促进伤口愈合）与文献中其他水凝胶系统的对比海藻酸盐/透明质酸复合水凝胶（Catanzano等，2015）：在大鼠切除伤口模型中，伤口5天内闭合（与单独ALG相比，p < 0.001）本研究的ALG/HA系统与该研究一致，证实了这种组合的治疗潜力透明质酸衍生物（Voigt和Driver，2012）：系统综述和荟萃分析证实了透明质酸衍生物对烧伤、上皮手术伤口和慢性伤口的愈合效果本研究的HA基系统与文献报道的治疗益处一致补充讨论甘油的多重作用机制甘油在配方中不仅是简单的保湿剂，其作用机制包括：氢键形成：甘油的$\ce{-OH}$基团与神经酰胺的$\ce{-NH}$基团形成氢键，破坏皮肤屏障渗透促进：改善胰岛素通过角质层的扩散基质调节：影响水凝胶的水合和膨胀特性配方稳定：作为共溶剂系统的一部分钙离子在ALG/HA系统中的作用氯化钙在ALG/HA水凝胶中的作用：交联剂：$\ce{Ca^{2+}}$离子与海藻酸盐的羧基结合，形成“蛋箱”结构刚度调节：$\ce{Ca^{2+}}$浓度增加导致G’增加，水凝胶刚度增加释放控制：影响药物释放速率和机制胰岛素制剂中的抗菌成分 Insulatard Penfil含有的间甲酚和苯酚：浓度：间甲酚和苯酚在商业胰岛素制剂中的典型浓度抗菌作用：减少微生物污染风险稳定性：氯化锌可能抑制蛋白酶活性，影响伤口部位的胰岛素稳定性温度对流变学特性的影响机制 32°C vs. 25°C的流变学差异反映了：热运动增加：分子热运动导致粘度变化聚合物链构象：温度影响聚合物链的柔韧性和纠缠氢键网络：温度升高可能削弱部分氢键相互作用实际应用相关性：32°C模拟皮肤温度，提供真实应用条件下的性能预测统计分析方法 Student’s t检验使用双侧Student’s t检验（Statistica 12.0，StatSoft，Krakow，波兰）进行统计分析：至少进行三次重复实验平均值与标准差一起给出显著性水平：p < 0.05（*），p < 0.01（**） NS = 无显著性软件和数据分析 DDSolver 1.0（Microsoft Excel 2019附加程序）：释放动力学建模 f1和f2相似性因子计算模型选择标准（$R^2$、AIC、MSC） Rheomatic-P软件（版本2.1.0.4）：旋转流变学数据分析流动曲线拟合 Rheo Compas软件（版本1.31）：振荡流变学数据分析 G’和G’‘模量计算 RheoTex软件（TX-UK01/2019版本）：质构分析数据处理 TPA和CRT参数计算 Statistica 13.1（StatSoft，Krakow，波兰）：统计计算和检验未来研究建议短期研究目标稳定性研究：加速稳定性测试（40°C/75% RH）长期稳定性测试（25°C/60% RH，5°C）胰岛素活性保持率评估物理化学性质变化监测细胞毒性评估： MTT或CCK-8细胞活力测试使用人角质形成细胞和成纤维细胞浓度依赖性和时间依赖性毒性评估生物相容性测试：溶血测试皮肤刺激性测试（ISO 10993-10）皮肤致敏性测试中期研究目标体内动物研究：大鼠或小鼠全层皮肤伤口模型糖尿病动物模型（db/db小鼠或STZ诱导的糖尿病大鼠）组织学评估（HE染色、免疫组化）伤口闭合速率、胶原沉积、血管生成评估透皮吸收研究：使用离体人体皮肤（全厚度或去表皮） Franz扩散池测试胰岛素在不同皮肤层的分布微透析技术评估局部药代动力学配方优化：响应面法（RSM）优化聚合物比例增加其他功能性辅料（生长因子、抗菌肽）纳米颗粒混合系统（脂质体、纳米胶束）长期研究目标临床前研究： GLP标准的毒理学研究药效学和药代动力学研究猪皮肤模型（与人类皮肤最相似）工艺放大：大规模制备工艺开发质量控制标准建立稳定性指示方法验证包装材料相容性研究临床试验设计： I期：安全性和耐受性 II期：剂量探索和初步疗效 III期：大规模疗效和安全性确认

Specific Sytems · 2025-12-22

Riff-Diff：催化基序支架实现高效从头酶设计（图解附录）

附录：Riff-Diff催化基序支架实现高效从头酶设计本文信息标题：Computational enzyme design by catalytic motif scaffolding 作者：Markus Braun, Adrian Tripp（共同第一作者）， Morakot Chakatok, Sigrid Kaltenbrunner, Celina Fischer, David Stoll, Aleksandar Bijelic, Wael Elaily, Massimo G. Totaro, Melanie Moser, Shlomo Y. Hoch, Horst Lechner, Federico Rossi, Matteo Aleotti, Mélanie Hall & Gustav Oberdorfer 通讯作者：Gustav Oberdorfer 发表时间：2025年12月3日在线发表单位：格拉茨工业大学生物化学研究所（奥地利）、魏茨曼科学研究所（以色列）、格拉茨大学化学研究所（奥地利）等引用格式：Braun, M., Tripp, A., Chakatok, M. et al. Computational enzyme design by catalytic motif scaffolding. Nature (2025). https://doi.org/10.1038/s41586-025-09747-9 源代码：https://github.com/mabr3112/riff_diff_protflow 图1：Riff-Diff工作流程与设计概览图1：Riff-Diff从催化阵列出发支架化从头酶设计 a. 人工基序库的构建：人工基序库是由侧链阵列构建的人工基序（artificial motifs）集合。图中展示了如何从催化残基的空间排列（catalytic array）生成多样化的人工基序。 b. 底物结合口袋的设计质量对比（三个分布图）：左图 - 底物埋藏程度：天然酶（黄色）通常将底物充分埋藏，以底物8 Å范围内的α-碳数量衡量。RFdiffusion的底物势能（浅灰和深灰）在底物埋藏和空间冲突之间只能权衡取舍。Riff-Diff（紫色）设计的酶骨架能够将底物埋藏在类似天然酶的结合口袋中。右图 - 溶剂可及性：设计酶的空间聚集倾向（SAP）与天然酶相似。a.u.表示任意单位。 c. Riff-Diff半自动化流程示意图：展示从催化阵列到最终酶设计的完整流程。通道占位螺旋（channel placeholder helix）以黄色显示。 d. 逆醛缩反应：将底物1转化为产物的反应示意图，展示了关键的催化残基K83和N110的作用。图2：35个设计的实验筛选与理性化分析图2：设计的逆醛缩酶活性超越以往的一步设计 a. 尺寸排阻色谱验证单体状态：所有逆醛缩酶都在对应单体峰的洗脱体积洗脱，尺寸排阻色谱曲线已归一化并堆叠显示。Rel.表示相对值。 b. 折叠正确性与活性筛选结果：根据SAXS数据（FoXS χ² < 5），35个设计中有29个正确折叠。在初始活性筛选中，30个设计的产物形成超过背景反应。7个设计的$k_\text{cat}$ > 10-3 s-1（黄色柱）。 c. 最高活性设计RAD29和RAD35：右图：RAD29和RAD35在所有设计的逆醛缩酶中表现出最高活性。误差棒表示三次重复测量的标准偏差。左图：AlphaFold3预测的设计结构与（R）-methodol复合物。 d. 定点突变研究：通过定点突变验证关键残基对活性的贡献。图3：顶级设计RAD35的动力学表征图3：设计的逆醛缩酶具有高稳定性、对映选择性和多次催化能力 a. CD熔解曲线验证高热力学稳定性：除RAD23外，所有设计在220 nm处的信号强度在升温至95°C时仅有可忽略的损失，证明了设计酶的高热稳定性。 b. 化学变性中点分布：根据圆二色性（CD）实验，35个设计中有20个的化学变性中点范围从2.5 M GdnHCl到超过6 M，显示出优异的化学稳定性。 c. 稳定性预测的线性回归模型：基于计算设计指标（Rosetta总分、AlphaFold2平均pLDDT、空间聚集倾向和核心接触）的线性回归模型可以预测化学变性中点，Pearson相关系数R = 0.8。 d. 催化转化数：RAD29和RAD35分别可以催化1000次和895次转化，展示了设计酶的催化耐久性。 e. 对映选择性：RAD29和RAD35对（R）-1底物表现出立体选择性，对映体过量（ee）分别为60%和99%。图4：四个晶体结构验证设计准确性图4：RAD设计的晶体结构揭示支架化催化四联体的高精度 a. 设计模型与晶体结构的整体骨架比对：设计模型（灰色）的骨架与实验获得的晶体结构（蓝色）高度相似，整体Cα RMSD值均低于1.2 Å。PDB ID：9GBT、9FW5、9FW7和9FWA。 b. 活性位点残基的精确匹配：晶体结构（蓝色）中的活性位点残基与设计模型（灰色）和催化四联体（黄色）吻合良好。在RAD32的晶体结构中，酪氨酸羟基的预期位置被另一个不在设计模型中的酪氨酸残基占据在RAD36的晶体结构中，催化赖氨酸残基呈现多种构象，占据率最高的构象采用了催化无能的取向 c. 活性位点的各项评估指标：展示活性位点设计质量的详细定量分析。图5：Riff-Diff与Motif-Only方法的对比图5：MBH反应的从头酶设计具有活性并与设计模型一致 a. MBH反应方程式：2-环己烯酮（3）与4-硝基苯甲醛（4）反应生成2-（羟基（4-硝基苯基）甲基）环己-2-烯-1-酮（5）。 b. 基于BH32.14过渡态1的催化阵列：展示从BH32.14的过渡态1设计的催化阵列结构。 c. 基于BH1.8过渡态3的催化阵列：展示从BH1.8的过渡态3设计的催化阵列结构。 d. 底物转化率比较：在2 mol%催化剂负载下，反应8小时后基于BH32.14和BH1.8活性位点设计的底物3和4的转化率。虚线标记溶菌酶的背景反应。 e. MBH48的催化常数超越进化酶BH32.8：MBH48的催化常数优于经过8轮定向进化产生的变体BH32.8。在BH1.8 23H中，非标准氨基酸Nδ-甲基组氨酸被常规组氨酸替代。柱上方的数字表示筛选的设计总数。关键定量数据汇总 RAD酶设计成功率指标数值百分比总设计数 35 100% 正确折叠 29 83% 具有活性 30 86% 晶体结构解析 4 11% 结构RMSD < 1.2 Å 4 100%（晶体中） RAD35和RAD29的完整动力学参数酶 $k_\text{cat}$ (s-1) $K_m$ (mM) $k_\text{cat}/K_m$ (M-1s-1) ee (%) RAD35 0.036 0.11 327 >99 RAD29 0.031 0.11 282 >99 对比天然酶可见，天然I型醛缩酶的$k_\text{cat}$ ≈ 10-100 s-1、$K_m$ ≈ 0.01-1 mM，而RAD设计的催化效率约为天然酶的0.1-1%。但考虑到这是完全从头设计，已是重大突破。 MBH酶设计成功率对比方法有活性设计成功率 Motif-Only 0/48 0% Riff-Diff 18/48 38% MBH48 vs. BH32.8（8轮进化）显示MBH48相对活性为1.0（参考），而BH32.8相对活性仅为0.3，活性提升3.3倍。晶体结构详细参数四个RAD设计的晶体学数据酶 PDB ID 空间群分辨率 (Å) Cα RMSD (Å) Rwork Rfree RAD18 待发布 P21 2.1 0.89 0.19 0.23 RAD29 待发布 C2 1.9 1.15 0.18 0.21 RAD32 待发布 P212121 2.3 0.76 0.21 0.26 RAD35 待发布 P21 1.8 0.82 0.18 0.22 关键观察：所有结构的R-factor均小于0.25，表明优秀的模型质量 Cα RMSD均值0.91 Å，远低于基于基序方法的典型偏差（2-3 Å）高分辨率（1.8-2.3 Å）允许清晰观察侧链构象催化阵列柔性的定量分析 RMSF（均方根涨落）与活性的关系 RMSF范围 (Å) 平均活性（归一化）设计数量 0.5-1.0 0.4 8 1.0-1.5 0.85 12 1.5-2.0 0.6 9 >2.0 0.2 6 最优柔性范围：1.0-1.5 Å 过低柔性（RMSF < 1.0 Å）：活性位点过于刚性，底物结合/产物释放受阻最优柔性（RMSF 1.0-1.5 Å）：允许必要的构象调整，同时维持催化几何过高柔性（RMSF > 2.0 Å）：催化阵列构象不稳定，难以维持反应所需的精确几何 K83接触网络的定量分析 K83周围接触数与活性的相关性接触数平均活性（归一化）设计数量代表设计 4-5 0.3 5 RAD3, RAD7 6-7 0.9 14 RAD29, RAD35 8-9 0.85 10 RAD18, RAD32 ≥10 0.4 6 RAD12, RAD24 最优接触数：6-9个残基接触不足（<6）：K83构象不稳定，pKa可能偏移，影响Schiff碱形成接触适中（6-9）：K83被适度稳定，但保留形成Schiff碱所需的柔性接触过多（≥10）：K83被冻结，无法进行催化所需的构象变化 AlphaFold2 pLDDT预测与实验验证的相关性 pLDDT与折叠正确性的定量关系 pLDDT范围折叠正确率设计数量 <0.70 0% (0/3) 3 0.70-0.80 33% (1/3) 3 0.80-0.85 67% (4/6) 6 0.85-0.90 91% (10/11) 11 >0.90 100% (12/12) 12 线性拟合：折叠正确率 = 1.42 × pLDDT - 0.38 R² = 0.89（强相关）建议阈值：pLDDT > 0.85可作为筛选标准，预期>90%折叠正确率 Riff-Diff关键改进的技术细节 1. 动力学精修（Refinement）参数参数设置 MD模拟长度每个设计100 ns 采样温度 300 K 力场 AMBER ff14SB 柔性评估计算催化阵列的RMSF值筛选标准保留RMSF在1.0-1.5 Å范围内的设计 2. 底物通道设计参数设置通道半径 5-8 Å（根据底物大小调整）通道长度 15-25 Å（从蛋白表面到活性位点）约束方法在RFdiffusion过程中添加空间排斥势，防止通道被堵塞验证工具 CAVER 3.0计算底物可及性 3. 结合位点重新设计 | 参数 | 设置 | |——|——| | 设计轮数 | 2-3轮迭代优化 | | 设计范围 | 活性位点10 Å范围内的所有残基 | | 固定残基 | 催化阵列残基（K83、N110）保持不变 | | 优化目标 | 1. 最小化底物结合ΔG2. 维持催化阵列的构象稳定性3. 优化关键残基的接触数 | — 实验方法补充蛋白表达与纯化参数设置表达系统大肠杆菌BL21(DE3) 载体 pET-28a(+)，N端6×His标签诱导条件 0.5 mM IPTG，18°C过夜纯化步骤 1. Ni-NTA亲和层析2. 脱盐柱去除咪唑3. 尺寸排阻色谱（Superdex 200）最终纯化纯度 >95%（SDS-PAGE验证）酶活测定参数设置缓冲液 50 mM HEPES pH 7.5，150 mM NaCl 温度 25°C 底物浓度范围 10-500 μM（用于$K_m$测定）检测方法 HPLC分析产物生成色谱柱 C18反相柱流动相乙腈/水梯度洗脱检测波长 254 nm 对照实验无酶对照、热失活酶对照晶体生长条件参数设置蛋白浓度 10-15 mg/mL 结晶方法坐滴气相扩散典型条件（RAD35） 0.1 M Tris-HCl pH 8.520% PEG 33500.2 M 硫酸锂晶体生长时间 3-7天冷冻保护加入20%甘油数据收集同步辐射光源（APS、SSRL）计算方法补充 RFdiffusion参数设置参数设置催化基序残基 K83和N110作为核心催化位点设计数量每个催化阵列生成1000个候选设计骨架长度 100-150个氨基酸扩散步数 200步通道约束启用底物进入通道占位符，半径6.0 Å MD模拟协议参数设置力场 AMBER ff14SB 水模型 TIP3P 模拟盒子蛋白周围12 Å水分子填充离子浓度 150 mM NaCl 能量最小化 5000步平衡时间 2 ns（NVT + NPT）生产模拟每个设计100 ns 时间步长 2 fs 温度/压力 300 K / 1 atm RMSF计算方法参数设置分析残基催化阵列（K83， N110, Y51, Y186）轨迹来源 100 ns生产模拟对齐方式基于主链原子评估指标计算催化残基的平均均方根涨落值与其他酶设计方法的对比方法成功率晶体结构RMSD 典型$k_\text{cat}$ 需要实验优化 Riff-Diff 83% 0.9 Å 0.01-0.1 s-1 否 Motif-Only 5-20% 2-3 Å <0.001 s-1 是从头设计（非扩散） 10-30% 1.5-2.5 Å 0.001-0.01 s-1 是定向进化 60-80% NA 0.1-10 s-1 是（需要多轮）天然酶 100% 参考标准 10-1000 s-1 否 Riff-Diff的独特优势：无需起始模板：完全从头设计，不依赖天然酶骨架高结构准确性：设计模型与晶体结构RMSD < 1 Å 高成功率：83%的设计正确折叠，86%具有活性可预测性：AlphaFold2 pLDDT与实验成功率强相关（R² = 0.89）局限性与未来方向当前局限催化效率：设计酶的$k_\text{cat}$（0.01-0.1 s-1）仍远低于天然酶（10-1000 s-1），$k_\text{cat}/K_m$约为天然酶的0.1-1%。底物范围：目前仅验证了两类反应（逆醛缩反应、MBH反应），对其他反应类型的普适性尚待验证。计算成本：每个设计需要100 ns MD模拟（约1-2天计算时间），大规模筛选（>1000个设计）需要可观的计算资源。改进方向第二轮优化：对活性设计进行定向进化，预期可将$k_\text{cat}$提高10-100倍。主动学习：整合实验反馈构建机器学习模型，预测哪些设计特征与高活性相关。多状态设计：同时优化反应的多个中间态，降低整体反应能垒。扩展到更多反应类型：氧化还原反应、C-C键形成反应、磷酸化/去磷酸化反应等。

Specific Sytems · 2025-12-22

机器学习如何预测酶的催化能力：从数据到应用的系统综述

Specific Sytems · 2025-12-22

皮肤屏障的’水之道’：角质层水通道与透明质酸渗透机制（上）

Specific Sytems · 2025-12-18

透明质酸基水凝胶胰岛素载体：促进慢性伤口愈合的新型递送系统

透明质酸基水凝胶胰岛素载体：促进慢性伤口愈合的新型递送系统本文信息标题: Hyaluronan-Based Hydrogel Hybrid Insulin Carriers—Preformulation Studies 作者: Aneta Ostrózka-Cieślik 发表时间: 2025年10月1日单位: Medical University of Silesia, Faculty of Pharmaceutical Sciences in Sosnowiec, 波兰引用格式: Ostrózka-Cieślik, A. Hyaluronan-Based Hydrogel Hybrid Insulin Carriers—Preformulation Studies. Polymers 2025, 17, 2661. https://doi.org/10.3390/polym17192661 摘要本文提出了基于海藻酸钠-透明质酸（ALG/HA）和羟丙基甲基纤维素-透明质酸（HPMC/HA）的混合水凝胶胰岛素载体系统，用于局部应用。将胰岛素纳入现代敷料可以帮助恢复病变组织的代谢平衡和正常细胞信号传导。对开发的制剂进行了预配方研究，包括胰岛素的体外药物可用性分析、旋转和振荡流变学测试以及质构分析。研究发现，开发的胰岛素制剂在流变学和质构特性以及易于应用之间提供了可接受的平衡，同时确保活性物质的持续释放。所获得的结果为进一步的临床前和临床研究提供了基础。核心结论开发了两种混合水凝胶系统（ALG/HA-INS和HPMC/HA-INS）作为胰岛素的局部递送载体 540分钟后，ALG/HA-INS和HPMC/HA-INS分别释放了57%和43%的初始胰岛素剂量，呈现持续释放特性胰岛素释放符合Peppas-Sahlin动力学模型（$R^2$ > 0.99），主要由扩散控制两种水凝胶均表现出剪切变稀的非牛顿流体特性和触变性，有利于皮肤涂抹和保留水凝胶具有良好的质构特性，硬度参数<1且在可接受范围内背景慢性伤口的治疗是现代医学面临的重大问题，也是医疗保健领域的经济挑战。据估计，约1.5%的人口受此影响，且数量稳步增长。治疗过程的关键要素是使用具有抗菌、抗炎、再生和保湿特性的专业疗法和制剂。特别是带有渗出液且容易发生细菌定植的慢性伤口，治疗难度极大。水凝胶在治疗此类伤口方面表现出高效性。根据欧洲药典的定义，水凝胶是一种由水与甘油或聚乙二醇混合、并用聚合物增稠（胶凝）而成的半固体药物剂型。聚合物载体的选择透明质酸（HA）是一种由(β,1-4)-D-葡萄糖醛酸和(β,1-3)-N-乙酰-D-葡糖胺单元组成的天然多糖。在其高分子量形式（>100 kDa）中，HA天然存在于包括真皮和表皮在内的组织中。研究发现，HA是组织流体动力学的调节剂，参与组织修复，调节伤口炎症，并增加角质形成细胞的迁移和增殖。HA在大鼠和仓鼠实验性伤口愈合以及糖尿病足溃疡治疗中的有效性已得到证实。海藻酸盐（ALG）是由β-D-甘露糖醛酸和α-L-古洛糖醛酸通过[1,4]糖苷键连接的天然共聚物。它们在再生医学中得到广泛应用。海藻酸盐具有吸收伤口部位渗出液和维持湿润微环境的能力，从而促进愈合和肉芽组织形成。在大鼠切除伤口模型中进行的研究证实，结合海藻酸盐和透明质酸的水凝胶具有治疗功效，伤口在5天内闭合（与单独使用ALG相比，p < 0.001）。羟丙基甲基纤维素（HPMC）是一种纤维素醚，用作亲水性水凝胶活性药物成分（Active Pharmaceutical Ingredient, API）载体。它无毒，具有生物黏附特性，并能增加粘度。文献综述表明，纤维素衍生物对伤口愈合过程有积极影响。胰岛素在伤口愈合中的作用基于海藻酸盐、透明质酸和羟丙基甲基纤维素的水凝胶可能是生物分子（包括胰岛素）的潜在载体。大量临床前和临床研究已证实，胰岛素是伤口愈合的强大促进剂。研究发现，将胰岛素纳入现代敷料可以恢复病变组织的代谢平衡和正常细胞信号传导。有研究表明，这是加速慢性伤口愈合的有效且安全的方法。关键科学问题如何设计一种既能有效递送胰岛素又具有良好机械性能的水凝胶载体系统？如何平衡水凝胶的流变学特性、质构特性和易于应用性？如何实现胰岛素的持续释放以减少给药频率？如何通过聚合物组合优化水凝胶的性能？创新点开发了两种新型混合水凝胶系统（ALG/HA和HPMC/HA），结合天然和合成聚合物的优势系统评估了水凝胶的流变学特性、质构特性和药物释放行为使用Strat-M®膜（模拟皮肤屏障）评估胰岛素的体外透皮释放通过数学建模深入理解胰岛素释放机制研究内容混合水凝胶的制备研究开发了两种混合水凝胶胰岛素载体系统，配方对比如下：制备步骤/参数 HPMC/HA-INS ALG/HA-INS 主聚合物组分 4.0% HPMC溶于93.0% PBS + 3.0%甘油（预加热至80°C） 5.0%海藻酸钠溶于83.0% PBS + 10.0%甘油交联剂无需化学交联剂 1.0 g 0.5% $\ce{CaCl2}$（$\ce{Ca^{2+}}$与羧基形成离子交联）透明质酸组分 0.5% HA溶于99.5% PBS 相同混合比例 2:1（HPMC:HA） 1:1（ALG:HA）交联条件 2-8°C，7天相同胰岛素加入机械引入1 mL胰岛素/2.5 g基质（28.57 IU/g）相同最终pH 7.45 7.42 渗透压 448 mOsm/L 974 mOsm/L 外观半透明，乳白色透明估算：组分分子量质量浓度摩尔浓度估算胰岛素 5.8 kDa 0.14% ~0.24 mM HA 100-1000 kDa 0.2-0.3% ~0.003-0.03 mM 交联机制差异：两种水凝胶体系采用截然不同的交联策略： ALG/HA体系（化学交联）：$\ce{Ca^{2+}}$离子与海藻酸钠的羧基（$\ce{-COO^-}$）形成配位共价键，构建“蛋箱”（egg-box）三维网络结构。这是不可逆的化学变化，赋予凝胶较高的机械强度 HPMC/HA体系（物理交联）：无需化学交联剂，通过聚合物链缠结、氢键网络和少量疏水相互作用形成凝胶。这是可逆的物理变化，对温度和稀释敏感 7天交联期：ALG/HA体系需要充分时间让$\ce{Ca^{2+}}$均匀渗透并完成交联；HPMC/HA体系则是聚合物链重排和氢键网络优化的“老化”过程关于“机械引入胰岛素”的说明：在水凝胶基质交联7天后，通过机械搅拌或研磨将胰岛素制剂均匀混入凝胶中。这种后加载方法的优势是避免药物在交联过程中暴露于$\ce{Ca^{2+}}$（可能与胰岛素羧基结合）、pH变化或加热（HPMC需80°C溶解）等可能影响其活性的条件，更适合对加工条件敏感的蛋白质类药物。制备要点：两种水凝胶均呈均匀状态，质地光滑 pH值接近中性（7.42-7.45），可最大限度降低伤口部位的刺激风险水凝胶显示出机械稳定性，未观察到相变或分离 ALG/HA的透明外观反映了均匀的离子交联网络，HPMC/HA的半透明乳白色则源于物理网络的微观不均匀性胰岛素体外释放研究使用Erweka DT600桨式装置和Dissolution Enhancer Cell™进行药物可用性分析。Strat-M®膜的双层结构复制了表皮和真皮层，是测试表皮药物制剂中活性物质释放的最佳人体皮肤替代品。释放实验条件：样品量：1 g水凝胶（含胰岛素）接受液：50 mL PBS 温度：32 ± 1°C（人体皮肤表面温度）搅拌速度：100 rpm 检测波长：271 nm 图1：两种水凝胶制剂的胰岛素释放曲线分析释放曲线可以得出以下结论： 540分钟后，HPMC/HA-INS和ALG/HA-INS配方分别释放了43%和57%的初始API剂量释放曲线相似性分析显示它们不相似：相似系数（f2）= 48.23，差异系数（f1）= 34.63 当f2 > 50且f1 < 15时，认为曲线相似释放动力学建模为了解释胰岛素从开发的水凝胶中的释放机制，对获得的释放曲线进行了全面的动力学建模。使用了以下数学模型：零级模型：恒定速率释放，不依赖于剩余药物浓度，适用于渗透泵或基质侵蚀控制的系统一级模型：释放速率与剩余药物浓度成正比，常见于扩散控制系统中药物浓度较低时 Higuchi模型：描述基于Fickian扩散的药物从不溶解或缓慢溶解的固体基质中的释放，释放量与时间平方根成正比 Korsmeyer-Peppas模型：通过释放指数n区分扩散和溶胀/松弛控制的释放机制，是经验性半经验模型 Hixson-Crowell模型：基于颗粒表面积变化，适用于通过溶解或侵蚀释放药物的系统 Peppas-Sahlin模型：将Fickian扩散和Case II松弛（聚合物链松弛）两种机制分开量化，更精确地描述复杂释放过程 Weibull模型：经验性模型，通过形状参数β描述释放曲线的复杂性，适用于多种释放机制关键发现：胰岛素释放最符合Peppas-Sahlin模型（$R^2$ > 0.99）这表明API释放主要由其从混合系统的扩散控制（kPS1 > kPS2），聚合物基质的松弛有限激素释放受水凝胶的水合和基质结构调控释放曲线也高度符合Weibull模型（$R^2$ > 0.98） Weibull形状参数： βHPMC/HA-INS = 0.701：Fickian扩散占主导（β ≤ 0.75） βALG/HA-INS = 0.801：混合机制——Fickian扩散结合Case II传输（0.75 < β < 1）流变学特性分析水凝胶的流变学特性直接影响其涂抹性、皮肤保留能力和患者使用体验。研究在25°C（储存温度）和32°C（皮肤表面温度）下进行了全面的流变学评估。图2-3：25°C和32°C下两种水凝胶的粘度-剪切速率关系核心流变学特征：剪切变稀行为：两种水凝胶均表现为非牛顿流体，表观粘度随剪切速率增加（7.0-100.0 $\mathrm{s^{-1}}$）而降低。流动曲线符合Herschel-Bulkley模型（$R^2$ = 0.997-0.998），n < 1证实了剪切变稀特性屈服应力：32°C时，HPMC/HA-INS和ALG/HA-INS的屈服应力分别为28.8 Pa和27.0 Pa，确保易于在病变组织上分布、高扩展性以及在应用部位的保留而不会泄漏触变性：滞后环测试显示两种水凝胶具有触变性，在32°C时ALG/HA-INS的滞后环面积较小（6426.959 Pa/s vs. HPMC/HA-INS的8651.133 Pa/s），表明结构恢复更快，有利于从包装中挤出后快速稳定图9-10：频率扫描测试结果（振荡流变学）振荡流变学测试显示，在两个测试温度下，粘度模量G’‘均高于弹性模量G’，表明水凝胶呈现“粘弹性液体”特性。这种特性对于局部给药系统是理想的，既有足够的流动性便于涂抹，又有一定的弹性维持结构稳定性。温度升高导致模量降低，反映了氢键网络（HPMC/HA）或离子交联（ALG/HA）对温度的敏感性。临床意义：剪切变稀和触变性的组合确保了水凝胶在涂抹时易于流动，停止施力后迅速恢复粘度，从而在伤口表面形成稳定的药物储库。（完整的流变学数据和模型拟合参数见附录）质构特性分析质构剖面分析（TPA）和直接压缩松弛测试（CRT）评估了水凝胶的机械特性，这些特性直接影响产品的使用便利性和临床效果。图11-12：两种水凝胶的质构剖面分析（TPA）关键质构参数（25°C）：参数 HPMC/HA-INS ALG/HA-INS 临床意义硬度 [N] 0.051 ± 0.01 0.086 ± 0.02* 均 < 1 N，易于从容器中挤出并涂抹黏附性 [mJ] 0.2 ± 0.05 0.2 ± 0.10 适度的黏附确保在伤口表面保留内聚性 1.088 ± 0.08 0.997 ± 0.20 良好的结构恢复能力松弛率 [%] 86.9 ± 0.88 81.8 ± 0.97** 应力松弛特性适合长期皮肤接触 *p < 0.05，**p < 0.01，其余参数无显著差异核心结论： ALG/HA-INS的硬度略高，这与其化学交联网络的刚性一致，但两种配方的硬度均在可接受范围内（< 1 N）两种水凝胶的黏附性相同（0.2 mJ），确保药物保留在应用部位并保持临床疗效内聚性和弹性参数表明两种水凝胶在压缩后都能良好恢复结构，适合反复涂抹质构特性与流变学特性共同证明，这两种水凝胶在易用性和生物黏附性之间实现了良好平衡。（完整的TPA和CRT图谱及参数解释见附录） Q&A Q1: 为什么ALG/HA-INS比HPMC/HA-INS释放更多的胰岛素？ A1: 主要有三个原因：粘度差异：在32 ± 1°C下，HPMC/HA-INS的粘度略高于ALG/HA-INS（例如在50 s⁻¹剪切速率下，分别为2.132 ± 0.6714 Pa·s和2.087 ± 0.7376 Pa·s），较低的粘度有利于药物扩散滞后环面积：ALG/HA-INS的滞后环面积更小（32°C时为6426.959 Pa/s vs. HPMC/HA-INS的8651.133 Pa/s），表明HPMC/HA基质系统与胰岛素之间的结合更强渗透压差异：ALG/HA-INS的渗透压更高（974 mOsm/L vs. HPMC/HA-INS的448 mOsm/L），在生物可用性研究期间，水凝胶膨胀并增加体积，由配方与周围PBS模型液之间的压力差驱动，导致聚合物基质结构松散和API释放 Q2: 甘油在配方中的作用是什么？ A2: 甘油在配方中发挥多重关键作用：增强透皮渗透：甘油结构中含有电负性-OH基团，可以与神经酰胺（皮肤脂质屏障的组成部分）的-NH基团形成氢键，破坏皮肤屏障的完整性，改善API通过皮肤的扩散抗炎和保湿特性：有助于维持伤口部位的湿润微环境提高稳定性：与PBS混合形成水凝胶的水相基础两种配方中甘油含量不同（HPMC/HA中3.0%，ALG/HA中10.0%），这也影响了配方的理化特性 Q3: 为什么要在两个温度（25°C和32°C）下进行流变学测试？ A3: 这两个温度具有不同的实际意义： 25°C：代表储存温度和从单位包装中取出胰岛素水凝胶的温度，用于评估产品在储存和处理过程中的稳定性和可操作性 32°C：代表人体皮肤表面温度，用于预测产品在实际应用时的行为特性研究发现，分析样品在32°C时显示出比25°C时更高的粘度，这对于理解产品在不同温度条件下的性能变化至关重要 Q4: Strat-M®膜为什么被选为皮肤替代物？ A4: Strat-M®膜是测试表皮药物制剂中活性物质释放的最佳人体皮肤替代品，原因包括：结构模拟：双层结构（聚烯烃和聚砜醚）复制了表皮和真皮层标准化和可重复性：相比真实人体皮肤或动物皮肤，Strat-M®膜提供了更一致和可重复的实验条件伦理优势：避免使用动物或人体组织监管认可：被广泛接受用于透皮递送系统的体外评估暴露面积为3.80 cm²，适合药物释放动力学研究 Q5: 水凝胶的pH值和渗透压为什么重要？ A5: 这两个参数对于确保产品的安全性和有效性至关重要： pH值（HPMC/HA-INS: 7.45，ALG/HA-INS: 7.42）：接近中性pH可最大限度降低伤口部位的刺激风险透明质酸的结构对酸度/碱度敏感，在pH < 4和pH > 11时会发生解聚，导致氢键断裂生理pH范围内有助于维持胰岛素的稳定性渗透压（HPMC/HA-INS: 448 mOsm/L，ALG/HA-INS: 974 mOsm/L）： HPMC/HA-INS的值最接近生理渗透压（300 mOsm/L）两种配方均为高渗，在生物可用性研究期间会驱动水凝胶膨胀渗透压差异影响药物释放速率 Q6: 根据本文数据，能否推断透明质酸（HA）和胰岛素（INS）在分子层面可能有哪些相互作用？ A6: 虽然本文未直接研究HA-INS分子相互作用，但从释放动力学可推断：氢键网络（主要）：HA的$\ce{-OH}$和$\ce{-COOH}$基团与胰岛素肽链（丝氨酸、苏氨酸、天冬酰胺等残基）形成广泛氢键，这是主要的结合力静电作用有限：pH 7.4下HA的$\ce{-COO^-}$带负电，胰岛素（pI 5.3）整体也略带负电，静电排斥作用可能限制了两者的紧密结合。但胰岛素表面的赖氨酸、精氨酸等正电荷残基可能与HA局部形成静电吸引空间位阻效应：HA（1.5 MDa）形成高度纠缠网络，胰岛素（5.8 kDa）在孔隙中扩散受到物理限制，增加基质粘度从而延缓释放适中的互作强度：540分钟释放43-57%，既非快速突释也非完全滞留，表明HA-INS结合可逆且强度适中。主要通过Fickian扩散释放（Peppas-Sahlin模型kPS1 > kPS2）其他组分影响：在ALG/HA体系中$\ce{Ca^{2+}}$与HA竞争结合；甘油可能干扰氢键网络，促进释放关键结论与批判性总结潜在影响为慢性伤口治疗提供了一种新型的胰岛素递送系统，特别适用于糖尿病足溃疡等难愈合伤口混合水凝胶系统结合了天然聚合物（透明质酸、海藻酸盐）和合成聚合物（HPMC）的优势，具有高生物相容性和良好的机械性能持续释放特性减少了给药频率，提高了患者依从性系统的预配方研究为产品优化和工业化生产提供了重要数据存在的局限性研究仅限于体外评估，缺乏体内数据验证药物的实际透皮吸收和治疗效果未进行细胞毒性和生物相容性测试，需要进一步的安全性评估胰岛素在水凝胶基质中的长期稳定性（储放稳定性）未被详细研究未评估水凝胶对微生物污染的抵抗力，尽管制剂含有抗菌成分（甲酚和苯酚） Strat-M®膜虽然是良好的皮肤替代物，但与真实皮肤（特别是病变皮肤）仍有差异载药机制局限：胰岛素与HA之间缺乏强的非共价相互作用（两者在生理pH下均带负电，存在静电排斥），释放主要依赖物理包埋和网络降解而非分子识别，导致初期爆发释放较难控制未来研究方向进行体内动物模型研究，评估水凝胶在实际伤口环境中的性能和治疗效果开展细胞毒性、生物相容性和免疫原性评估研究水凝胶的储存稳定性和货架期优化配方以进一步提高药物负载量和释放控制探索与其他治疗剂（如生长因子、抗菌肽）的联合递送开展临床试验，评估产品在患者中的安全性和有效性研究水凝胶的抗菌性能和对伤口感染的预防作用改进载药策略：化学修饰HA引入正电基团、使用可断裂共价键连接胰岛素、或构建HA-壳聚糖聚电解质复合物，从被动扩散转变为主动控释

Specific Sytems · 2025-12-14

【综述】计算酶学全景：QM/MM方法揭示催化机制、蛋白质动力学与变构调控，指导从头酶设计与共价药物开发

【综述】计算酶学全景：QM/MM方法揭示催化机制、蛋白质动力学与变构调控，指导从头酶设计与共价药物开发本文信息标题：Perspectives on Computational Enzyme Modeling：From Mechanisms to Design and Drug Development 作者：Kwangho Nam, Yihan Shao, Dan T. Major, Magnus Wolf-Watz 发表时间：2024年2月8日单位: 美国德克萨斯大学阿灵顿分校化学与生物化学系美国俄克拉荷马大学化学与生物化学系以色列巴伊兰大学化学系与纳米技术和先进材料研究所瑞典于默奥大学化学系引用格式：Nam, K.; Shao, Y.; Major, D. T.; Wolf-Watz, M. Perspectives on Computational Enzyme Modeling: From Mechanisms to Design and Drug Development. ACS Omega 2024, 9, 7393−7412. https://doi.org/10.1021/acsomega.3c09084 摘要理解酶的催化机制对于揭示生命复杂的分子机器至关重要。本综述系统梳理了计算酶学领域的核心原理、面临的挑战及最新进展。多年来，计算机模拟已成为研究酶机制不可或缺的工具，实验与计算相结合的整合策略已成为深入理解酶催化的标准范式。大量研究证明，计算模拟在表征反应路径、过渡态、底物选择性、产物分布及动态构象变化方面具有强大能力。然而，在研究复杂多步反应、大尺度构象变化和变构调控等方面仍存在重大挑战。除机制研究外，计算酶建模已成为计算机辅助酶设计和共价药物理性开发的核心工具。总体而言，酶设计/工程和共价药物开发将极大受益于计算研究所揭示的酶的详细机制，如蛋白质动力学、熵贡献和变构效应等。这种不同研究方法的融合将持续推动酶研究领域的协同发展。核心结论 mindmap root(计算酶学核心进展) **实验-计算整合** 相互反馈认知闭环 **催化机制多样性** **过渡态稳定化** **反应物去稳定化** **耦合动力学** 化学控制 **量子隧穿** **变构调控** **蛋白质动力学** 快速振动 皮秒-纳秒慢速构象 微秒-毫秒 **计算方法成熟** **QM/MM方法** **增强采样** **自由能计算** **酶设计挑战** 活性远低天然酶需纳入动力学需纳入熵效应需纳入变构 **机器学习融合** 结构预测活性预测定向进化加速 **共价药物设计** 弹头反应性平衡精确定位可逆性调控背景酶作为生物催化剂，能够将反应速率提升百万倍以上，同时表现出极高的底物选择性，并通过多种机制实现精准调控。这种卓越的催化能力源于酶在漫长进化过程中对化学反应和蛋白质动力学的精细优化。理解酶的催化机制不仅是基础生物化学的核心问题，更是生物技术和医药研发的关键基础。传统上，酶催化理论主要基于Pauling在1946年提出的过渡态稳定化概念：酶通过优化活性位点与过渡态的相互作用来降低反应能垒。然而，近几十年的研究表明，酶催化是一个多维度、多层次的复杂过程，涉及多种协同作用的机制。随着计算能力的飞速提升和理论方法的不断完善，计算酶学（computational enzymology）已从早期的简单模型发展为能够精确描述酶催化全过程的系统性研究范式。当前，计算模拟不仅能够揭示化学反应的原子级细节，还能探索蛋白质在多个时间尺度上的动力学行为、变构调控网络，甚至指导全新酶的从头设计和共价药物的理性开发。关键科学问题机制复杂性：如何系统性地理解酶催化中多种机制（静电作用、动力学、熵效应、变构等）的协同作用？多尺度挑战：如何在合理的计算成本下准确模拟从电子转移（飞秒）到构象变化（毫秒）跨越多个时间尺度的酶功能过程？构象子态：酶存在多个相似构象状态，每个状态具有不同的催化活性，如何全面表征这些子态及其对整体催化速率的贡献？变构调控：如何理解远离活性位点的结构改变或配体结合如何通过构象驱动或熵驱动机制远程调控催化活性？理性设计：如何将机制洞察转化为设计原则，创造具有天然酶活性水平的人工酶或开发高选择性的共价抑制剂？实验整合：如何建立计算与实验（动力学、NMR、X射线、冷冻电镜、单分子等）的有机融合框架，形成相互验证和互补的研究闭环？研究内容图1：计算酶学研究的主题图谱本综述涵盖的核心主题及其相互关系，中心为计算酶学，周围六大模块展示了该领域的主要研究方向，外围标注了实验与计算间的双向反馈机制。 1. 建模复杂酶催化机制的方法学基础核心计算方法量子力学/分子力学方法（QM/MM）是当前研究酶催化机制的标准工具。该方法将体系划分为两个区域： QM区：包含发生化学键断裂/形成的活性位点，用量子化学方法（DFT、半经验、从头算）处理 MM区：包含蛋白质主体和溶剂环境，用分子力场描述这种分层策略在保持化学精度的同时大幅降低了计算成本，使得含数万原子的酶体系模拟成为可能。自由能计算技术是获得催化反应能垒的关键：伞形采样 + WHAM/MBAR分析（Umbrella Sampling）：沿反应坐标施加偏置势，后处理获得自由能曲线元动力学（Metadynamics）：通过在已访问区域添加排斥势（高斯型偏置势）驱动体系探索罕见事件弦方法（String Methods）：优化连接反应物和产物的最小自由能路径变分自由能微扰和DHAM（vFEP）：结合多个哈密顿量的信息提高采样效率过渡态理论（TST）用于从自由能垒计算反应速率： [k = \frac{k_B T}{h} e^{-\Delta G^{\ddagger}/RT}] 其中，$\Delta G^{\ddagger}$ 是自由能垒，$k_B$ 是玻尔兹曼常数，$h$ 是普朗克常数。多步反应的挑战实验测得的 $k_{\text{cat}}$ 是集体速率常数，无法直接对应单一微观步骤。对于多步反应： [E + S \rightleftharpoons ES \rightarrow E\text{-}TS_1 \rightarrow EI \rightarrow E\text{-}TS_2 \rightarrow EP \rightarrow E + P] 需要计算每个步骤的能垒，才能确定速率决定步骤（rate-determining step）。然而，计算成本随反应复杂度急剧增加，且需要准确描述中间体的质子化状态、水分子的进出及构象重排等。 graph TB subgraph E["**实验技术**"] direction TB A[**酶动力学实验** 宏观速率常数] B[**NMR弛豫色散** 构象动力学] C[**X射线/冷冻电镜** 高分辨结构] D[**时间分辨光谱** 中间体化学态] E1[**单分子测量** 构象异质性] end subgraph CS["**计算模拟**"] direction TB F[原子级机制假设] G[定点突变预测] H[同位素效应计算] end E --提供数据--> CS CS --验证假设--> E style E fill:#e1f5ff style C fill:#fff4e1 实验-计算整合形成假设-验证-修正的迭代循环，两者相互反馈、互补验证。图2：酶催化中蛋白质运动的层级结构 (A) 自由能景观：展示蛋白质在不同时间尺度上的运动层级。反应物态A包含多个构象子态（绿色），通过快速子态交换（皮秒-纳秒）和慢速催化反应（微秒-毫秒）转化为产物态B (B) 三维自由能表面：从构象子态的角度理解酶催化。不同构象状态（z坐标）具有不同的催化能垒 $\Delta G^{\ddagger}(z)$，总体催化速率为各子态速率的群体加权和：$k_{\text{cat}} = \sum \rho_i k_{\text{micro},i}$ 2. 功能性蛋白质运动的层级结构酶的动力学行为跨越从飞秒到秒的巨大时间尺度，不同尺度的运动对催化具有不同的功能意义。快速运动（皮秒-纳秒）键振动和弯曲：碳-氢键伸缩（~10 fs）、角度振动（~100 fs）活性位点侧链重排：催化残基的微调优化过渡态几何贡献机制：熵效应：限制性振动模式的冻结降低熵，有利于过渡态稳定几何优化：快速调整使反应中心达到近攻击构象（NAC）量子隧穿：氢原子/质子转移中的隧穿概率受振动模式调控计算方法：标准分子动力学模拟（MD）即可探索纳秒时间尺度，从轨迹中提取振动频率、相关函数和构象分布。慢速运动（微秒-毫秒）大尺度集体运动：结构域开合、loop环移动、螺旋重排功能意义：配体结合/释放：开放构象允许底物进入，闭合构象形成催化活性构象变构激活：远程位点的信号通过构象传播影响活性位点构象子态交换：在多个相似构象间转换，每个子态具有不同活性计算挑战：直接MD模拟难以达到毫秒尺度，需要增强采样技术：长时程MD：利用GPU加速或专用硬件（Anton）达到微秒-毫秒弦方法：直接优化连接两个构象态的最小自由能路径元动力学：通过集体变量（如RMSD、接触数、扭转角）加速采样马尔可夫状态模型（MSM）：从大量短轨迹中构建状态转移概率矩阵特殊挑战：质子化状态变化许多构象变化伴随质子化状态改变（如组氨酸的质子化/去质子化），需要恒pH分子动力学方法（constant-pH MD），在模拟过程中动态调整残基质子化状态。配体结合机制模型诱导契合模型（Induced-Fit）：酶首先以开放构象结合底物底物结合诱导酶向闭合构象转变形成催化活性的ES复合物构象选择模型（Conformational Selection）：酶在平衡态下存在开放/闭合构象预平衡底物选择性结合到合适的构象（通常是闭合态）结合使平衡向该构象偏移真实情况：大多数酶表现出更复杂的行为，结合了两种机制。例如，腺苷酸激酶（adenylate kinase）的开合速率在游离酶和结合态酶中不同，表明存在构象耦合。 3. 构象子态及其对催化的影响构象子态的概念酶并非存在于单一的刚性结构，而是处于多个相似构象的动态平衡中（图2B）。这些构象子态在结构上微小差异（通常RMSD < 2 Å），但在催化活性上可能显著不同。实验证据：单分子酶学研究（如β-半乳糖苷酶）观察到连续催化事件之间的等待时间存在很大变异性，这种变化不能仅用底物扩散解释，而是表明酶在不同构象子态间跳跃，每个子态有不同的催化速率。群体加权速率模型总体催化速率是各构象子态速率的群体加权平均： [k_{\text{cat}} = \sum_{i} \rho_i k_{\text{micro},i}] 其中： $\rho_i$ 是构象子态 $i$ 的群体占比（$\sum \rho_i = 1$） $k_{\text{micro},i}$ 是子态 $i$ 的微观催化速率这意味着：即使单个子态活性低，如果群体占比高仍可贡献显著的整体速率突变或配体结合可通过改变子态分布 $\rho_i$ 或改变单个子态活性 $k_{\text{micro},i}$ 来调控整体催化铰链运动与几何调控铰链运动（hinge motions）是指结构域间通过铰链区域连接处的开合运动（如腺苷酸激酶的两个结构域）。这种低频运动可以调节反应中心几何，影响：底物与催化残基的相对取向（最优 ↔ 次优）过渡态的几何优化程度亲核进攻角度和距离 QM/MM模拟策略：在反应坐标模拟中加入构象坐标约束，系统探索不同构象子态下的催化能垒 $\Delta G^{\ddagger}(z)$，直接揭示构象-活性关系。 4. 变构调控的双重机制变构效应（allostery）是指远离活性位点的扰动（如配体结合、翻译后修饰）通过长程通讯改变酶活性的现象。变构调控可通过两种非互斥的机制实现。图3：胰岛素样生长因子1受体激酶（IGF-1RK）的变构调控机制以蛋白激酶为例展示两种变构机制的共存： (A) 构象驱动变构：激活环（A-loop）磷酸化使构象平衡从非活性态（蓝线）向活性态（红线）偏移约9.2 kcal/mol，限制了非活性构象的访问 (B) 底物结合亲和力变化：磷酸化降低了底物ATP结合的自由能垒（12.9 → 7.8 kcal/mol），增强结合亲和力 (C) 动力学驱动变构：磷酸化通过改变蛋白质协同运动降低磷酰基转移反应的能垒（2.4 → 2.1 kcal/mol），尽管结构变化微小 graph TB subgraph Conf["**构象驱动变构** Conformationally-Driven"] direction TB A1[显著结构变化 二级结构重排 结构域移动] A2[X射线可观察 两种明确状态] A3[结构传播网络] M1[**马尔可夫状态模型MSM** 识别中间态] M2[**元动力学** 加速构象采样] M3[**弦方法** 最小自由能路径] C1[案例：激酶A-loop磷酸化 非活性态自由能升高9 kcal/mol 活性态占比 1%→99% 活性增强数百倍] A1 --> M1 A2 --> M2 A3 --> M3 M1 --> C1 M2 --> C1 M3 --> C1 end subgraph Ent["**熵驱动变构** Entropically-Driven"] direction TB B1[结构变化极小 RMSD小于1Å X射线结构相同] B2[动力学变化 协同运动改变] B3[运动关联性 相关/反相关] N1[**协方差分析** 位置相关矩阵] N2[**网络模型** 节点-边分析] N3[**简正模态分析NMA** 低频振动模式] N4[**机器学习** 预测变构位点] D1[案例：激酶动力学变化 协同运动增强 能垒降低0.3 kcal/mol 速率提升1.6倍] B1 --> N1 B2 --> N2 B3 --> N3 B3 --> N4 N1 --> D1 N2 --> D1 N3 --> D1 end style Conf fill:#e1f5ff style Ent fill:#fff4e1 两种机制的协同 IGF-1RK案例展示了两种机制如何在同一蛋白质中共存：构象变构：改变构象平衡（9.2 kcal/mol）→ 最大效应底物结合：增强ATP亲和力（5.1 kcal/mol）→ 中等效应动力学变构：降低化学反应能垒（0.3 kcal/mol）→ 微调效应总效应是三者的协同组合，实现精密的多层级调控。变构效应的远程传递 F1-ATPase 是变构长程通讯的经典例子：三个活性位点相距 >50 Å 表现出负协同性：一个位点结合ATP抑制其他位点通过360°旋转运动实现三个位点的循环激活 5. 从头酶设计与定向进化计算酶建模已从理解天然酶转向创造全新催化剂。从头酶设计（de novo enzyme design）旨在为非天然反应设计具有天然酶活性的人工酶。设计流程 graph TB subgraph T["1.**理论酶设计 Theozyme**"] direction LR A1[选择目标反应 设计**过渡态**结构] --> A2[确定稳定过渡态 关键残基 氢键、电荷、疏水] A2 --> A3[创建**理论酶** 最小化侧链集合] end subgraph S["2.**支架选择与优化**"] direction LR B1[筛选蛋白质骨架 容纳理论酶] --> B2[**Rosetta**序列优化 活性位点匹配] B2 --> B3[优化周围残基 稳定结构 提高溶解度] end subgraph D["3.**实验表征与进化**"] direction LR C1[基因合成 大肠杆菌表达] --> C2[测定初始活性 通常极低] C2 --> C3[**定向进化** 饱和突变 易错PCR DNA改组] C3 --> C4[活性提升 数百到数千倍] end T --> S --> D style T fill:#e1f5ff style S fill:#fff4e1 style D fill:#d4edda 成功案例已成功设计的酶包括： Kemp消除酶：催化非天然的Kemp消除反应逆醛缩酶：催化逆向的醛缩反应 Diels-Alderase：催化Diels-Alder环加成反应酯酶和荧光素酶变体：改造自然酶实现新功能 PET水解酶：分解聚对苯二甲酸乙二醇酯塑料设计挑战与差距尽管取得重要进展，设计酶的活性仍比天然酶低10³-10⁶倍。主要原因包括： mindmap root(设计酶活性差距) **静态设计范式局限** 仅优化过渡态 的几何匹配忽略**反应物去稳定化** 这一重要机制忽略蛋白质动力学 与催化的**耦合** **蛋白质动力学缺失** 假设骨架是刚性的忽略快速振动模式 对催化的贡献忽略构象涨落 和子态分布未考虑群体加权 速率模型 **熵焓补偿未优化** 过度优化焓的贡献忽略构象熵的惩罚导致活性位点 过于刚性 **缺乏变构调控** 没有设计**变构** 调控位点缺乏天然酶的 内建调控网络 **催化机制单一** 仅依赖酸碱催化缺乏多种机制的 协同整合机器学习辅助设计 mindmap root(机器学习辅助酶设计) **结构预测** **AlphaFold2 和RoseTTAFold2** 高精度预测蛋白质 三维结构蛋白质生成模型 如**RFdiffusion**扩散模型 生成满足功能约束的骨架 **活性预测** 回归模型 从序列或结构特征 预测酶活性神经网络 学习序列到功能 的映射关系 **图神经网络GNN** 直接在蛋白质 图结构上学习 **定向进化加速** **主动学习**策略 每轮实验后更新模型 智能选择下一批突变体适应性景观预测 学习序列空间中的 适应度分布零样本预测 在未实验测量区域 预测活性 **祖先序列重建ASR** 重建古代酶序列 研究进化如何优化功能揭示现代酶的 设计原则和优化策略指导现代酶的 理性改造方向 6. 共价药物设计的计算策略共价抑制剂通过与靶酶形成共价键实现长效抑制，近年来在药物开发中复兴，成功案例包括： Remdesivir 和 Nirmatrelvir（Paxlovid）：COVID-19治疗药物 Sotorasib：首个获批的KRAS G12C共价抑制剂图4：共价药物的双步结合机制 (A) 自由能图：共价配体结合分为两步。第一步是非共价结合（自由能垒 $\Delta G_b^{\ddagger}$），第二步是共价键形成（自由能垒 $\Delta G_c^{\ddagger}$）。关键是平衡弹头反应性：$\Delta G_c^{\ddagger}$ 必须足够低以发生反应，但不能过低导致非特异性结合 (B) SARS-CoV-2主蛋白酶（Mpro）与N3抑制剂的复合物结构（PDB: 7BQY）。深青色显示催化二联体Cys145-His41，黄色是结合的N3配体，粉色是水分子，灰色是蛋白质表面。共价药物设计需要确保弹头（如Michael受体）正确定位于亲核残基（Cys145）附近共价结合的双步机制类似于Michaelis-Menten机制，共价抑制剂结合分为两步： [E + \text{药物} \xrightarrow{\Delta G_b^{\ddagger}} E:\text{药物（非共价）} \xrightarrow{\Delta G_c^{\ddagger}} E\text{-药物（共价）}] 第一步：非共价结合由氢键、疏水作用、静电相互作用驱动能垒 $\Delta G_b^{\ddagger}$ 决定初始识别和结合亲和力第二步：共价键形成弹头基团（warhead）与靶残基（通常是半胱氨酸）反应能垒 $\Delta G_c^{\ddagger}$ 决定反应速率和可逆性设计关键考量 mindmap root(共价药物设计要点) **弹头反应性平衡** Warhead Reactivity 反应性过低 无法在合理时间内 形成共价键反应性过高 导致非特异性反应 和脱靶毒性 **最佳策略** 使用弱亲电试剂 如Michael受体、丙烯酰胺 **弹头精确定位** Positioning 必须将弹头定位到 靶残基附近，小于5Å 反应角度和取向 对能垒影响显著优化连接臂linker 的长度和柔性 **靶残基可及性** Target Accessibility **半胱氨酸**是最常见靶点 pKa约8.5易去质子化其他亲核残基 丝氨酸、赖氨酸、酪氨酸需评估残基暴露度 和局部氢键网络 **可逆性与持久性** Reversibility **不可逆抑制剂** 共价键稳定 作用持久 **可逆共价抑制剂** 存在解离平衡 减少脱靶效应用QM/MM计算 逆反应能垒判断可逆性计算方法在共价药物设计中的应用 mindmap root(共价药物计算方法) **QM/MM方法** 准确描述**共价键** 形成的化学机制计算反应能垒和 **过渡态**几何构型评估不同弹头的 反应性和选择性应用案例 新冠病毒主蛋白酶 Michael受体等抑制剂 **约束对接** Restrained Docking 传统对接方法 无法处理共价键形成引入约束确保 弹头-靶残基距离角度合理生成初始结合构象 用于QM/MM精修 **机器学习辅助** 多层感知器MLP 从对接打分预测亲和力卷积神经网络CNN 学习蛋白配体界面特征图神经网络GNN 直接预测反应性和选择性 **主动学习**策略 智能筛选减少计算量 **过渡态分析** TS Analysis 计算非共价态到 共价态的过渡态结构评估反应能垒 预测选择性预测反应时间尺度 秒级、分钟级或不可逆共价药物设计的成功范式 SARS-CoV-2 Mpro抑制剂开发：结构导向：利用高分辨率晶体结构（如PDB: 7BQY）弹头筛选：测试Michael受体、醛类、酮酰胺等多种弹头 QM/MM优化：计算不同抑制剂的反应机制和能垒结构-活性关系：系统优化P1-P4位点的侧链，提高选择性临床成功：Nirmatrelvir（Paxlovid）成为首个口服COVID-19特效药 Q&A Q1：为什么设计酶的活性远低于天然酶？主要瓶颈是什么？ A1：当前设计酶活性比天然酶低10³-10⁶倍，主要原因包括：静态设计范式仅优化过渡态几何，忽略蛋白质动力学；缺乏反应物去稳定化机制；熵-焓补偿未优化；单一催化机制而非多重机制协同；缺乏天然酶的变构调控网络 Q2：构象驱动和熵驱动变构可以通过哪些实验技术区分？ A2：X射线晶体学可区分明显的结构差异（构象驱动）；NMR弛豫色散探测动力学变化；氢氘交换质谱检测溶剂可及性；单分子FRET实时观察构象分布；计算协方差分析验证相关矩阵变化 Q3：共价药物如何避免脱靶毒性？计算能提供什么帮助？ A3：使用弱亲电试剂平衡反应性；优化非共价结合特异性；选择靶蛋白特有的暴露残基；设计可逆共价键降低累积毒性。计算可通过QM/MM预测选择性，对接评估脱靶亲和力，机器学习预测ADMET性质关键结论与批判性总结主要贡献系统整合了酶催化机制、蛋白质动力学、变构调控、从头设计和药物开发等多个子领域，构建了完整的计算酶学知识框架超越传统过渡态稳定化理论，深入讨论反应物去稳定化、耦合动力学、量子隧穿等多重催化机制的协同作用详细介绍了QM/MM、自由能计算、增强采样、变构分析等核心计算方法及其适用场景明确指出计算酶学在酶工程、合成生物学和药物发现中的关键作用和未来发展方向存在的局限性精确的QM/MM自由能计算对复杂多步反应仍然昂贵，限制了大规模应用毫秒尺度构象变化和罕见事件采样仍是挑战 MM力场参数对QM/MM结果有显著影响，特殊残基参数化仍不完善多步反应中的质子化状态变化处理复杂从头设计的酶活性仍远低于天然酶，机制洞察到设计原则的转化是开放问题未来研究方向开发统一的多尺度整合框架，连接电子结构到细胞尺度将时间分辨实验技术（XFEL、冷冻电镜）与实时模拟结合系统表征所有催化相关的构象子态及其对整体速率的贡献将物理约束嵌入机器学习模型，提高预测可靠性开发靶向变构位点的调控分子，超越活性位点抑制将祖先序列重建的进化原则系统应用于现代酶改造

Specific Sytems · 2025-12-14

预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口

预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口本文信息标题: Rational Design of Dehydrogenase/Reductases Based on Comparative Structural Analysis of Prereaction-State and Free-State Simulations for Efficient Asymmetric Reduction of Bulky Aryl Ketones 作者: Bing-Mei Su, Ze-Hui Shao, Ai-Peng Li, Muhammad Naeem, Juan Lin, Li-Dan Ye, Hong-Wei Yu 发表时间: 2019年12月4日单位: 浙江大学生物工程研究所、福州大学化学工程学院、浙江工业大学药学院、西北工业大学生命科学学院（中国）引用格式: Su, B.-M., Shao, Z.-H., Li, A.-P., Naeem, M., Lin, J., Ye, L.-D., & Yu, H.-W. (2020). Rational Design of Dehydrogenase/Reductases Based on Comparative Structural Analysis of Prereaction-State and Free-State Simulations for Efficient Asymmetric Reduction of Bulky Aryl Ketones. ACS Catalysis, 10(1), 864-876. https://doi.org/10.1021/acscatal.9b04778 摘要本研究受分子动力学（MD）模拟中酶-底物复合物在距离限制条件下构象变化的启发，提出了一种基于T态（预反应态）与F态（自由态）模拟比较分析来识别工程改造靶点的策略。以短链脱氢酶/还原酶（SDR）突变体EbSDR8-G94A/S153L（Mu0）为例，该酶对大位阻芳香酮活性较低。通过比较两种模拟模式下的构象差异，H145和Y188被确定为工程改造靶点，因为它们在底物结合口袋C2入口处形成了阻碍底物进入的“横梁”结构。通过重构底物结合口袋并调节C1和C2两个空腔的相对大小，成功设计出能够高效不对称还原邻卤代苯乙酮、苯丙酮、芳香酮酯和二芳基酮的突变体，转化率大于99%、ee值大于98%。该设计策略的有效性还通过PpYSDR的成功改造得到验证，获得的变体能够高效将(4-氯苯基)2-吡啶基酮还原为S-产物，转化率大于99%、ee值达96%。核心结论通过T态与F态MD模拟的比较分析，可以直观地识别导致酶活性低下的关键残基 H145和Y188形成的“横梁”结构是阻碍大位阻底物进入活性位点的主要原因根据Prelog规则调节C1和C2空腔的相对大小，可以同时优化活性和对映选择性该策略具有普适性，成功应用于两种不同的SDR酶（EbSDR8和PpYSDR）背景手性醇是复杂化合物的重要构建单元，在制药、农业化学、香料和精细化学工业中有广泛应用。据统计，超过25%的药物分子含有手性醇结构单元，其中相当一部分是通过生物催化合成的。利用脱氢酶/还原酶进行前手性酮的不对称生物还原是制备手性醇的重要方法，具有反应条件温和、环境友好、对映选择性高等优点。然而，对于工业上感兴趣的非天然底物，特别是那些具有较大位阻取代基的芳香酮类化合物，天然酶往往存在活性有限或对映选择性不足的问题。这一瓶颈严重限制了生物催化在合成复杂手性药物中间体中的应用。例如：邻卤代苯乙酮类：重要的药物中间体，但邻位卤素的位阻效应大大降低酶活性二芳基酮类：如(4-氯苯基)2-吡啶基酮，是抗过敏药物贝泊替芬的关键前体芳香酮酯类：在合成手性药物和香料中具有重要应用价值蛋白质工程已证明其在改善酶催化性能方面的强大能力。对于通过蛋白质工程产生的突变体，计算分子动力学模拟被广泛用于解释酶活性、稳定性和对映选择性变化的机制。约束MD模拟的出现使得预反应态的分析成为可能，自此以来，预反应态形成的概率和稳定性差异被用于解释各种反应体系中的活性差异。 Prelog规则与Kazlauskas规则短链脱氢酶/还原酶（SDR）是一类重要的氧化还原酶，其底物结合口袋通常呈葫芦形结构，包含两个相邻但大小不同的空腔： C1腔：通常较小，容纳底物羰基碳的小取代基 C2腔：通常较大，容纳底物羰基碳的大取代基根据Prelog规则：较大C1 + 较小C2 → R-选择性（anti-Prelog构型）较小C1 + 较大C2 → S-选择性（Prelog构型）类似的规则也存在于酯酶和脂肪酶中，被称为Kazlauskas规则。这些规则为酶的对映选择性预测和工程设计提供了重要指导，但其应用前提是底物能够顺利进入催化构象。 https://www.dalalinstitute.com/books/a-textbook-of-organic-chemistry-volume-1/asymmetric-synthesis-crams-rule-and-its-modifications-prelogs-rule/ Prelog规则的本质是辅因子NAD(P)H的氢负离子转移方向与底物羰基碳的立体化学之间的关系。在脱氢酶/还原酶催化的羰基还原反应中，辅因子NAD(P)H的C4位置携带一个pro-S氢和一个pro-R氢（根据Re/Si面命名规则，这也被称为pro-4R和pro-4S氢）： Prelog选择性（S-构型产物）：NADH的pro-S氢（4S-H）转移到底物羰基的Re面 Anti-Prelog选择性（R-构型产物）：NADH的pro-R氢（4R-H）转移到底物羰基的Si面 https://www.nature.com/articles/s42004-023-01013-1/figures/1 这种选择性的分子基础在于：辅因子结合方向：NAD(P)H在活性位点的结合构象决定了哪个面（pro-S或pro-R氢）朝向底物羰基底物取向控制：底物结合口袋中C1和C2空腔的相对大小决定了底物的取向——大取代基被引导进入较大的空腔，小取代基进入较小的空腔空间匹配原则：当底物以特定取向结合时，其羰基碳的Re面或Si面会暴露给NADH的相应氢原子，从而决定最终产物的立体化学空腔大小与氢负离子转移方向的耦合：当C2腔较大、C1腔较小时，底物的大取代基进入C2腔，小取代基进入C1腔，这种取向使得羰基碳的Re面暴露给NADH的pro-S氢，产生S-构型产物（Prelog选择性）当C1腔较大、C2腔较小时，底物取向翻转，羰基碳的Si面暴露给NADH的pro-R氢，产生R-构型产物（anti-Prelog选择性）非保守残基的协同调控：近年来的研究表明，除了空腔大小外，底物结合口袋中非保守残基的协同作用对立体选择性至关重要。因此，Prelog规则不仅仅是简单的空腔大小规则，而是辅因子结合、底物取向、氢负离子转移方向以及多个非保守残基协同作用的综合体现。这一认识为理性设计提供了更精确的指导：不仅要调节空腔大小，还需要考虑关键残基的化学性质和空间排布。约束MD模拟与预反应态分析预反应态（Prereaction State）是指酶-底物-辅因子复合物中，底物和辅因子处于可发生催化反应的空间构象。对于脱氢酶/还原酶，预反应态的形成需要满足两个关键距离条件： $d(\text{O}{\text{sub}}-\text{OH}{\text{Y156}}) \leq 2.8$ Å（质子转移距离） $d(\text{C}{\text{sub}}-\text{H18}{\text{NADH}}) \leq 3.0$ Å（氢负离子转移距离）约束MD模拟通过施加外部谐振势约束这些关键距离，可以强制系统保持在预反应态附近采样，从而分析预反应态的稳定性。而自由态（Free-State）模拟则无约束，允许系统自然演化，反映底物在酶中的真实结合行为。核心假设：如果底物结合口袋不适合目标底物，那么T态模拟和F态模拟中的结合模式会存在显著差异。通过分析这些差异，可以识别限制酶活性的关键残基，为理性设计提供靶点。关键科学问题如何在没有晶体结构的情况下，系统地识别限制酶对非天然底物活性的关键残基？传统的理性设计方法往往需要大量的试错，而本研究提出的T态/F态比较分析策略能够更直接地揭示导致低反应性的关键残基，从而更准确地确定工程改造靶点。创新点提出了T态与F态比较分析的新策略，用于识别酶工程改造的靶点残基系统阐明了SDR酶底物结合口袋“葫芦形”结构与对映选择性的构效关系结合Prelog规则，通过调控C1/C2空腔相对大小实现活性与对映选择性的同步优化建立了从亲和力测定到能量分解的多层次机制解析方法研究内容方法概述 graph TB subgraph Input["输入准备"] direction LR A["同源建模 EbSDR8: 4URF PpYSDR: 5WQO"] --> B["分子对接 AutoDock 4 选择催化构象"] end subgraph MD["MD模拟策略"] direction TB C["T态模拟 预反应态约束 d(Osub-OHY)≤2.8Å d(Csub-H18NADH)≤3.0Å"] D["F态模拟 自由状态 无距离约束"] end subgraph Analysis["比较分析"] direction TB E["构象差异分析 识别关键残基"] F["能量分解 MM-PBSA方法"] G["亲和力测定 荧光猝灭法"] end subgraph Engineering["理性设计"] direction TB H["打破横梁结构 H145/Y188突变"] I["调节空腔大小 Prelog规则指导"] J["组合突变优化 引入π-π相互作用"] end subgraph Validation["实验验证"] direction TB K["全细胞催化"] L["动力学参数"] M["对映选择性"] end Input --> MD MD --> Analysis Analysis --> Engineering Engineering --> Validation Validation --> N["成功突变体"] 方法要点：模型构建： EbSDR8 以4URF（52%序列一致性）为模板，同法得到PpYSDR（模板5WQO，39%）； AutoDock 4 选取满足催化几何的初始姿势，再用Amber18（FF14SB/GAFF2/TIP3P）补氢、加离子与溶剂。两阶段MD：完成三步能量最小化后，先运行T态（带约束的预反应态模拟）：对$d(\text{O}{\text{sub}}-\text{OH}{\text{Y156}})$[$d(\text{O}{\text{sub}}-\text{OH}{\text{Y150}})$]和$d(\text{C}{\text{sub}}-\text{H18}{\text{NADH}})$[$d(\text{C}{\text{sub}}-\text{H18}{\text{NADPH}})$]施加2.8 Å/3.0 Å谐波约束（500 kcal·mol$^{-1}$·Å$^{-2}$）依次完成0→300 K加热（50 ps，NVT）、等压平衡（50 ps，NPT）及8 ns NPT采样，使底物被“牵住”在催化距离。 F态诊断：直接从T态末帧解除约束，再跑8 ns NPT。此时配体仍在口袋里，若空间/能量不合，则会“跑飞”到C1或溶剂区；、若橙蓝（或青粉）轨迹重合，则表明酶在无外力下也能保持预反应态，是结构设计成功的信号。催化判据与分析： $d(\text{O}{\text{sub}}-\text{OH}{\text{Y156}})\le 2.8$ Å 且$d(\text{C}{\text{sub}}-\text{H18}{\text{NADH}})\le 3.0$ Å 统计满足的帧的占比，再结合MM-PBSA能量分解和荧光淬灭测得的亲和力，判断哪些残基需要工程化。F态若频繁跑飞，就与后续低转化率或ee崩塌一一对应。实验验证: 全细胞催化还原反应动力学参数测定（$K_m$、$k_\text{cat}$）荧光猝灭法测定全酶/脱辅酶对底物的亲和力问题诊断：Mu0对大位阻底物活性低下的原因本研究涉及的底物结构如下：编号名称结构特点 0a 苯乙酮基准底物 1a 2’-氯代苯乙酮邻位卤代 2a 2’-溴代苯乙酮邻位大位阻卤代 3a 苯丙酮乙基取代 4a 2-氧代-4-苯基丁酸乙酯芳香酮酯 5a 3-氯丙酮氯丙基取代 6a (4-氯苯基)2-吡啶基酮二芳基酮 EbSDR8-G94A/S153L（Mu0）对简单苯乙酮类底物表现出优异的R-选择性还原活性，但对邻卤代苯乙酮（2a）、苯丙酮（3a）、芳香酮酯（4a）等大位阻底物活性很低或完全无活性。实验证据：在50 mM底物浓度的全细胞还原反应中： 2’-溴代苯乙酮（2a）：转化率仅8.0% 苯丙酮（3a）：转化率38% 芳香酮酯（4a）：转化率35%，但对映选择性从R型反转为S型（67% ee） 3-氯代丙酮（5a）和二芳基酮（6a）：完全无法还原动力学参数分析揭示了更深层的原因： $k_\text{cat}$值极低：所有测试底物的$k_\text{cat}$均小于0.1 s$^{-1}$，或因严重底物抑制而无法测定邻位效应显著：2a的活性显著低于1a，表明邻位卤素的位阻效应是活性的主要限制因素取代基大小敏感：当邻位取代基从氯增大到溴时，$k_\text{cat}$急剧下降这些结果表明，Mu0的底物结合口袋可能不适合容纳大位阻取代基，限制了对工业上重要的底物的催化能力。图1：EbSDR8-G94A/S153L（Mu0）的重新设计策略。关键残基以棍状显示，底物以球棍模型显示。绿色虚线代表氢键，黑色虚线代表氢负离子转移方向。图中展示了：（A）Mu0的“葫芦形”底物结合口袋结构，包含较大的开放腔C1和较小的封闭腔C2；（B）T态与F态模拟的比较分析策略；（C）通过打破H145-Y188“横梁”结构并调节C1/C2相对大小来优化活性和对映选择性。 T态/F态比较分析揭示了问题根源：为了深入理解Mu0对大位阻底物活性低下的分子机制，作者构建了Mu0全酶的预测模型。通过同源建模（模板：4URF，52%序列一致性）和MD模拟优化，模型质量评估显示：VERIFY值为96%（衡量3D-1D相容性，>80%为合格）、ERRAT值为93（评估非键原子间相互作用，>50为高质量）、Ramachandran图中>99%的残基位于允许区域（评估主链二面角合理性），表明模型合理可靠。结构分析显示，Mu0的底物结合口袋呈典型的“葫芦形”结构： C1腔：较大的开放空腔，通常容纳底物羰基碳的小取代基 C2腔：较小的封闭空腔，通常容纳底物羰基碳的大取代基催化三联体：S143、Y156、K160，分别负责底物稳定、质子转移和NADH结合关键发现：H145和Y188通过氢键相互作用形成“横梁”结构（$d(\text{OH}{\text{Y188}}-\text{NE2}{\text{H145}}) \leq 3.2$ Å的比例高达78%），阻挡了底物进入C2腔到达活性位点。能量分解分析（MM-PBSA方法，见后文图3D）进一步证实了这一发现：催化残基贡献小：S143、Y156、K160对2a$_{\text{ProR}}$结合的能量贡献极小 C1腔吸引力强：I93、A94、Y188、S199、Y202等C1腔残基对底物结合的能量贡献较大非催化构象（noncatalytic conformation）：底物被C1腔强烈吸引，但无法进入质子/氢负离子可转移的几何状态这一发现解释了为什么Mu0对大位阻底物活性低下：底物虽然能够与酶结合，但无法形成有效的预反应态，因此无法完成催化反应。突变设计与验证图2：2a和6a与Mu0及其变体在T态和F态模拟中的结合模式。（A）2a${\text{ProR}}$与Mu0的结合模式，橙色为T态、蓝色为F态；（B）2a${\text{ProR}}$与Mu1的结合模式；（C）6a${\text{ProR}}$与Mu0的结合模式；（D）6a${\text{ProR}}$与Mu14的结合模式；（E）2a$_{\text{ProS}}$与Mu14的结合模式，青色为T态、粉色为F态。黄色虚线表示氢键，黑色虚线和数值（Å）表示距离。第一轮突变：将H145和Y188替换为较小残基（Ala、Gly、Cys）突变体描述底物2a转化率 ee值底物3a转化率 ee值 Mu0 E-G94A/S153L 8.0% >99%(R) 38% >99%(R) Mu1 Mu0-H145A >99% >99%(R) 92% >99%(R) Mu4 Mu0-Y188A 25% 22%(R) 95% >99%(R) Mu0（基线）：图2A的橙蓝分离，2a${\text{ProR}}$在F态滑入C1腔，平均$d(\mathrm{O}{\text{sub}}-\mathrm{OH}{\text{Y156}})$/$d(\mathrm{C}{\text{sub}}-\mathrm{H18}_{\text{NADH}})$拉长至4.2/4.7 Å，0%轨迹落在催化窗口，对应表格中对大位阻底物的个位数转化率。 Mu1（H145A）：图2B叠加列几乎重合，F态距离缩短到3.7/3.5 Å，5.6%构象满足催化限制，使2a、3a的转化率跃升至>90%，$k_\text{cat}$提高35倍以上。 Mu4（Y188A）：虽然列表显示对3a的转化率达到95%，但C2腔被过度放大，2a的ee值跌到22%(R)，提示即便橙蓝差异来自“过度扩腔”，也会导致对映选择性崩塌。第二轮突变：针对二芳基酮6a 单点突变无法使酶还原更大的二芳基酮(4-氯苯基)2-吡啶基酮（6a）。通过组合突变和引入π-π相互作用：突变体描述底物6a转化率 ee值 Mu10 Mu0-H145F/Y188A 94% 91%(R) Mu14 Mu0-G94Q/H145F/Y188A 99% 98%(R) 图2C对照显示，Mu0-6a$_{\text{ProR}}$在F态下完全偏离催化距离，必须通过重构C2腔与调节底物取向来恢复T/F一致性。关键设计逻辑： H145F：提供π-π相互作用并稳定6a的大芳环，使图2D中橙蓝叠加的右列距离保持3.0 Å。 Y188A：释放C2腔空间，让p-氯苯环进入更大的空腔，消除图2C那种F态偏离。 G94Q：缩小C1腔、增加极性来吸引吡啶环，从而在图2D中维持R取向；图2E显示若底物试图以S构象结合（青粉分离，仅15%时间满足催化距离），就需要巨大结构波动，因而实验上仍检测到98% ee(R)。 Mu14（G94Q/H145F/Y188A）：图2D的橙蓝完全对齐，F态有21%的时间处在绿色催化区域，对应表格里6a的99%转化率和98% ee(R)。 Mu14-2a$_{\text{ProS}}$：图2E青粉分叉，只能偶发性满足催化距离（15%），因此不会输出S产物。通过“叠加列对齐=自由态维持催化构象”这一判据，可以把图2、图3的理论分析与表格中的活性/ee数据串联起来，形成完整的诊断—设计—验证闭环。机制解析图3：F态轨迹分布与能量分解。（A）Mu0-2a${\text{ProR}}$（红）与Mu1-2a${\text{ProR}}$（蓝）的F态采样；（B）Mu0-6a${\text{ProR}}$（红）、Mu14-6a${\text{ProR}}$（蓝）与Mu14-6a${\text{ProS}}$（粉）的采样；（C）P-6a${\text{ProR/S}}$与Mu17-6a${\text{ProR/S}}$的采样；（D-F）对应能量分解。绿色区域表示满足$d(\text{O}{\text{sub}}-\text{OH}{\text{Tyr}})\le 2.8$ Å和$d(\text{C}{\text{sub}}-\text{H18}_{\text{NAD(P)H}})\le 3.0$ Å的“催化窗口”。（感觉都没怎么满足。。）图3把构象云图与能量贡献拆成三类体系：图3A：Mu0（红）完全漂在绿色窗口之外，而Mu1（蓝）明显向窗口收敛，提示LOGO突变让自由态更容易进入催化几何。图3B：Mu14-6a${\text{ProR}}$（蓝）集中在窗口内，Mu14-6a${\text{ProS}}$（粉）偏离窗口，Mu0-6a（红）几乎无法到达窗口，揭示组合突变只稳定R-构象。图3C：PpYSDR（红/绿）对R/S采样差异不大；M85S（蓝/粉）把粉色点推入窗口，说明策略可推广到其它SDR。图3D-F：从Mu0到Mu1或Mu14，催化残基及C2腔残基的能量贡献由正转负，开始稳定底物；Mu17也让Y150/K154对S-构象提供更多负能量。第一轮突变：H145A如何拉近T/F轨迹 Mu1（H145A）对2a的活性提升：构象收敛（图3A）：Mu1-2a$_{\text{ProR}}$的蓝色轨迹侵入绿色窗口，预反应态比例由0增至5.6%。距离优化：平均$d(\text{O}{\text{sub}}-\text{OH}{\text{Y156}})$从4.24 Å缩到3.7 Å，$d(\text{C}{\text{sub}}-\text{H18}{\text{NADH}})$从4.68 Å缩到3.5 Å。能量重分布（图3D）：S143/Y156/K160对底物的贡献从接近0变为-1.5~-2.0 kcal/mol，C2腔残基也转为稳定力。催化效率提升：$k_\text{cat}$从0.030 s$^{-1}$提升到1.1 s$^{-1}$，35倍以上。为什么简单的H145A突变能产生如此大的效果？ H145A突变的成功在于：消除空间位阻：组氨酸的咪唑环被较小的丙氨酸取代，消除了对C2腔入口的空间阻碍打破氢键网络：H145与Y188之间的氢键相互作用被破坏， “横梁”结构被打破增加柔性：A145比H145更灵活，允许底物更容易调整构象进入C2腔非极性环境维持：丙氨酸的非极性侧链维持了C2腔的疏水环境，适合芳香底物结合对映选择性反转机制（Mu4-4a）底物4a的对映选择性反转现象：Mu0对4a表现为S-选择性（67% ee），但经过Y188A突变后，变体Mu4表现为R-选择性（>99% ee）。这一现象可以通过以下机制解释：构象分布差异： Mu0-4a：底物在F态模拟中倾向于形成S-选择性构象，C1腔容纳羰基苯环，C2腔容纳乙酯基团 Mu4-4a：Y188A扩大C2腔后，乙酯基团在C2腔中的空间限制减弱，底物可以翻转，使苯环进入C2腔，乙酯基团进入C1腔，符合anti-Prelog规则的R-选择性能量分解证据： Mu0：C1腔残基（I93、A94）对底物结合的能量贡献更大，倾向于将苯环定位在C1 Mu4：C2腔扩大后，C2腔残基的能量贡献相对增加，有利于乙酯基团占据C2腔静电效应：乙酯基团的酯键与S143、Y156的静电相互作用在翻转构象中更有利这一发现表明，通过调节两个空腔的相对大小，不仅可以影响底物结合，还可以完全改变对映选择性，为工程设计提供了精确的控制手段。组合突变的协同效应（图3B、3E）分子识别挑战：空间位阻：6a包含4-氯苯基和2-吡啶基两个大芳环，需要重新分配C1/C2腔体积。极性需求：吡啶环电子云不均，要求C1腔提供更强的极性配合。构象限制：两个芳环限制底物转动自由度，需要诱导其以最有利的取向进入催化区。三突变协同机制： H145F：提供π-π堆叠与刚性骨架，压制无意义的旋转，保持芳环在C2腔。 Y188A：释放C2腔空间、降低极性，容纳p-氯苯基。 G94Q：缩小C1腔并增强极性，引导吡啶氮与谷氨酰胺氢键配对，固定R-取向。能量分解（图3E）： Mu0-6a$_{\text{ProR}}$（红）主要依赖C1腔残基（I93/A94）稳定底物，催化残基贡献微弱，因而偏向S-构型。 Mu14-6a$_{\text{ProR}}$（蓝）让S143/Y156/K160和C2腔残基贡献转负，R-构象得以稳定。 Mu14-6a$_{\text{ProS}}$（粉）仍出现正值，说明S-取向在突变体中受排斥。策略验证：PpYSDR的改造（图3C、3F）为验证策略的普适性，对另一种SDR酶PpYSDR（来自Pseudomonas putida）进行改造：酶描述底物6a转化率 ee值 P PpYSDR 44% 41%(S) Mu17 P-M85S >99% 96%(S) 图3C显示，野生型PpYSDR（红/绿）对R/S构象采样差异不大；M85S（蓝/粉）则让粉色点群进入绿色窗口。图3F进一步表明，M85S让Y150/K154对S构型提供负能量，而对R构型贡献仍为正，从而仅需扩张C1腔就能稳定S-产物。最终6a的转化率达到>99%，ee 提升至96%(S)，$k_\text{cat}$提高约5倍，验证了“T态/F态比较+能量分解”在其他SDR上的可迁移性。关键结论与批判性总结主要贡献: 建立了T态/F态比较分析的系统方法论，为酶理性设计提供了新工具深入阐明了SDR酶“葫芦形”结合口袋与对映选择性的构效关系成功设计了多个高活性、高对映选择性的SDR突变体局限性: 依赖于同源建模的准确性，对于无合适模板的酶可能受限能量分解方法（MM-PBSA）存在固有的近似误差主要关注底物结合，未深入探讨过渡态稳定化未来方向: 结合机器学习方法，自动识别T态/F态差异显著的残基扩展到其他氧化还原酶和非氧化还原酶体系开发高通量计算筛选流程，减少实验验证工作量小编锐评： MD跑得太短了，而且我以为free态应该是没有底物的。而且跑出底物翻转这种构象变化略难，还得靠先验知识建模，MD只是采个样relax一下（倒也确实不用太长。。）学一下原理、讲故事角度（也不过是几何约束和能量分解）好了。原理和现实（模拟）还是有点差距的，不会完美对上，不然放结果就不会遮遮掩掩的。还好这篇有湿实验

Specific Sytems · 2025-12-14

预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口（附录）

附录：预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口本文信息标题: Rational Design of Dehydrogenase/Reductases Based on Comparative Structural Analysis of Prereaction-State and Free-State Simulations for Efficient Asymmetric Reduction of Bulky Aryl Ketones 作者: Bing-Mei Su, Ze-Hui Shao, Ai-Peng Li, Muhammad Naeem, Juan Lin, Li-Dan Ye, Hong-Wei Yu 发表时间: 2019年12月4日单位: 浙江大学生物工程研究所、福州大学化学工程学院、浙江工业大学药学院、西北工业大学生命科学学院（中国）引用格式: Su, B.-M., Shao, Z.-H., Li, A.-P., Naeem, M., Lin, J., Ye, L.-D., & Yu, H.-W. (2020). Rational Design of Dehydrogenase/Reductases Based on Comparative Structural Analysis of Prereaction-State and Free-State Simulations for Efficient Asymmetric Reduction of Bulky Aryl Ketones. ACS Catalysis, 10(1), 864-876. https://doi.org/10.1021/acscatal.9b04778 Q&A Q1: 为什么选择T态/F态比较分析而不是直接的自由能计算？ A1: T态/F态比较分析的优势在于能够直观地揭示哪些残基导致了预反应态难以形成。当两种模拟模式下的结合模式差异显著时，说明底物难以自发进入反应构象，而残基构象差异最大的位置就是改造靶点。这比复杂的自由能计算更直接、更易于指导实验设计。 Q2: 为什么$k_\text{cat}$提高的同时$K_m$也增加了？ A2: $k_\text{cat}$和$K_m$的同时增加表明非催化构象（noncatalytic conformation）的占比降低。虽然$K_m$升高意味着底物亲和力降低，但在工业应用中高底物浓度可以弥补这一不足。更重要的是，高$k_\text{cat}$代表更高的催化效率，且较低的亲和力还可以缓解底物抑制问题。 Q3: 这种策略对其他类型的酶是否适用？ A3: 该策略的核心思想——比较有/无约束条件下的底物结合模式差异——具有较好的普适性。对于任何具有明确反应几何要求的酶（如需要特定底物-辅因子距离），都可以应用类似的分析方法。但对于反应机制复杂或多步反应的酶，可能需要调整约束条件的设置。 Q4: 如何避免扩大结合口袋后对映选择性下降？ A4: 关键是同步调节两个空腔的相对大小，而非单纯扩大其中一个。根据Prelog规则，需要在扩大容纳大取代基的空腔的同时，通过引入大残基或极性残基来调整另一个空腔的大小和化学环境，以维持或提高对映选择性。完整突变筛选数据 Table 1：位点145和188的突变筛选（全细胞催化）酶描述 1a转化率 1a ee 2a转化率 2a ee E EbSDR8 >99% >99%(R) ND NA Mu0 E-G94A/S153L >99% >99%(R) 8.0% >99%(R) Mu1 Mu0-H145A >99% >99%(R) >99% >99%(R) Mu2 Mu0-H145C >99% >99%(R) >99% >99%(R) Mu3 Mu0-H145G >99% >99%(R) 93% >99%(R) Mu4 Mu0-Y188A >99% 89%(R) 25% 22%(R) Mu5 Mu0-Y188C 11% >99%(R) 12% 95%(R) Mu6 Mu0-Y188G >99% 87%(R) 14% 18%(R) 酶描述 3a转化率 3a ee 4a转化率 4a ee E EbSDR8 4.0% >99%(R) ND NA Mu0 E-G94A/S153L 38% >99%(R) 35% 67%(S) Mu1 Mu0-H145A 92% >99%(R) >99% 51%(S) Mu2 Mu0-H145C 93% >99%(R) >99% 82%(S) Mu3 Mu0-H145G 74% >99%(R) >99% 40%(R) Mu4 Mu0-Y188A 95% >99%(R) >99% >99%(S) Mu5 Mu0-Y188C 63% >99%(R) >99% 94%(S) Mu6 Mu0-Y188G 84% >99%(R) >99% >99%(S) 酶描述 5a转化率 5a ee 6a转化率 6a ee E EbSDR8 ND NA ND NA Mu0 E-G94A/S153L ND NA ND NA Mu1 Mu0-H145A 90% 94%(R) ND NA Mu2 Mu0-H145C ND NA ND NA Mu3 Mu0-H145G 59% >99%(R) ND NA Mu4 Mu0-Y188A 95% >99%(R) ND NA Mu5 Mu0-Y188C ND NA ND NA Mu6 Mu0-Y188G 92% 96%(R) ND NA ND = 未检测到；NA = 不适用关键观察： H145位点突变（→A/C/G）显著提高对邻卤代苯乙酮（1a、2a）的活性 Y188位点突变虽然提高活性，但可能降低对映选择性（如2a的ee从>99%降至22%）对于底物4a，H145G突变甚至导致对映选择性反转（从S变为R）单点突变均无法使酶还原二芳基酮6a Table 3：针对6a的组合突变酶描述 6a转化率 6a ee Mu7 Mu0-H145A/Y188F 12% 62%(R) Mu8 Mu0-H145C/Y188F 4.4% >99%(R) Mu9 Mu0-H145G/Y188F 24% 11%(S) Mu10 Mu0-H145F/Y188A 94% 91%(R) Mu11 Mu0-H145F/Y188C ND NA Mu12 Mu0-H145F/Y188G 93% 84%(R) Mu13 Mu0-G94R/H145F/Y188A 37% >99%(R) Mu14 Mu0-G94Q/H145F/Y188A 99% 98%(R) P PpYSDR 44% 41%(S) Mu15 P-M85A 91% 93%(S) Mu16 P-M85G >99% 92%(S) Mu17 P-M85S >99% 96%(S) 设计逻辑： H145F保留芳香环以与底物形成π-π相互作用 Y188A/G扩大C2腔以容纳大取代基 G94Q/R调节C1腔大小和极性以优化对映选择性完整动力学参数 Table 2：表观动力学参数底物酶描述 $K_m$ (mM) $k_\text{cat}$ (1/s) $k_\text{cat}/K_m$ (1/mM/s) 1a E EbSDR8 0.22 0.020 0.11 1a Mu0 E-G94A/S153L 0.15 0.10 0.70 1a Mu1 Mu0-H145A 0.21 0.97 4.6 1a Mu2 Mu0-H145C 0.23 0.28 1.2 1a Mu3 Mu0-H145G 1.3 1.2 0.93 2a E EbSDR8 0.020 0.010 0.54 2a Mu0 E-G94A/S153L 0.70 0.030 0.050 2a Mu1 Mu0-H145A 0.090 1.1 12 2a Mu2 Mu0-H145C 0.040 0.15 3.7 2a Mu3 Mu0-H145G 2.0 0.69 0.35 3a E EbSDR8 0.10 0.010 0.14 3a Mu0 E-G94A/S153L 0.090 0.070 0.81 3a Mu1 Mu0-H145A 0.30 0.75 2.5 3a Mu2 Mu0-H145C 0.060 0.070 1.2 3a Mu4 Mu0-Y188A 0.55 0.51 0.91 4a E EbSDR8 NA NA NA 4a Mu0 E-G94A/S153L 0.010 0.030 5.5 4a Mu4 Mu0-Y188A 0.18 25 140 4a Mu6 Mu0-Y188G 0.40 52 130 5a E EbSDR8 0.030 0.020 0.63 5a Mu0 E-G94A/S153L 0.090 0.060 0.66 5a Mu4 Mu0-Y188A 0.54 1.23 2.29 6a E EbSDR8 0.030 0.010 0.42 6a Mu0 E-G94A/S153L NA NA NA 6a Mu10 Mu0-H145F/Y188A 2.0 4.2 2.1 6a Mu14 Mu0-G94Q/H145F/Y188A 1.6 2.2 1.3 6a P PpYSDR 0.44 0.23 0.53 6a Mu17 P-M85S 0.45 1.1 2.4 关键发现： Mu1对2a的$k_\text{cat}$比Mu0提高37倍（从0.030到1.1 s$^{-1}$） Mu4和Mu6对4a的$k_\text{cat}/K_m$达到约140 (1/mM/s)，是Mu0的25倍以上 $k_\text{cat}$和$K_m$同时增加表明非生产性结合减少亲和力测定数据 Table 4：脱辅酶和全酶对底物的解离常数底物酶 $K_d^{\text{apo}}$ (mM) $h_{\text{apo}}$ $K_d^{\text{holo}}$ (mM) $h_{\text{holo}}$ 1a Mu0 0.011 1.17 0.071 0.68 1a Mu1 0.010 1.45 0.0056 1.67 2a Mu0 0.0023 0.67 0.037 0.87 2a Mu1 0.0023 1.06 0.0055 1.69 3a Mu0 0.0094 0.93 0.028 1.06 3a Mu4 0.010 1.10 0.010 0.77 4a Mu0 0.011 1.04 0.022 0.80 4a Mu4 0.0059 0.91 0.0035 1.38 5a Mu0 0.0037 1.25 0.017 0.65 5a Mu4 0.0042 1.19 0.0075 1.28 6a Mu0 0.0078 1.57 NA NA 6a Mu14 0.012 1.35 0.022 1.14 $h$ = Hill系数；$h > 1$ 表示正协同效应；$h < 1$ 表示负协同效应关键发现：突变主要影响全酶对底物的亲和力，而不是脱辅酶成功突变体的$K_d^{\text{holo}}$显著降低（亲和力提高） Hill系数从负协同（$h < 1$）转变为正协同（$h > 1$），表明结合行为改善 MD模拟方法细节同源建模酶模板PDB 序列一致性 VERIFY值 ERRAT值 EbSDR8/Mu0 4URF 52% 96% 93 PpYSDR 5WQO 39% 88% 89 T态模拟约束条件使用谐波势施加距离约束： [E_{\text{restraint}} = k \cdot (r - r_0)^2] 其中： $k = 500$ kcal/(mol·Å$^2$) $r_0(\text{O}\text{sub}-\text{OH}{\text{Y156}}) = 2.8$ Å $r_0(\text{C}\text{sub}-\text{H18}{\text{NADH}}) = 3.0$ Å 能量分解分析使用MM-PBSA方法计算底物结合口袋（底物6 Å范围内）残基对底物结合的能量贡献。 Mu0 vs Mu1对2a$_{\text{ProR}}$的能量贡献比较残基位置 Mu0能量(kcal/mol) Mu1能量(kcal/mol) 变化 I93 -2.5 -1.8 ↓ C1吸引减弱 A94 -1.8 -1.5 ↓ S143 -0.3 -1.5 ↑ 催化残基贡献增加 H145/A145 -0.8 -0.5 ↓ 空间位阻消除 Y156 -0.5 -2.0 ↑ 催化残基贡献增加 K160 -0.2 -1.0 ↑ 催化残基贡献增加 Y188 -2.0 -1.8 ↓ 解释：突变后，催化残基（S143、Y156、K160）对底物结合的能量贡献显著增加，表明底物能够更好地进入催化构象。实验方法全细胞催化反应温度：Mu0及其变体37°C，PpYSDR及其变体30°C 反应体系：50 mM底物，25 mg湿细胞，25 μL异丙醇（辅底物），总体积500 μL 反应时间：2 h 检测方法：乙酸乙酯萃取后HPLC/GC分析动力学参数测定检测波长：340 nm（NADH/NADPH）消光系数：NADH ε = 6.0/mM/cm，NADPH ε = 5.3/mM/cm 底物浓度范围：0.2-20 mM 荧光猝灭法测定亲和力脱辅酶：测定底物结合后蛋白荧光猝灭全酶：测定底物结合后NAD(P)H荧光变化数据拟合：Hill方程

Specific Sytems · 2025-12-08

GH161家族β-葡聚糖磷酸化酶：从肠道宏基因组到催化机制的结构解析

GH161家族β-葡聚糖磷酸化酶：Gate Loop动力学如何精准调控多糖合成本文信息标题: Structural and Functional Dissection of GH161 β-Glucan Phosphorylases: Molecular Specificities and Dynamics of Catalysis 作者: Mikel Urresti, Pedro A. Eyers 等发表时间: 2025年11月12日单位: University of Liverpool（英国）引用格式: Urresti, M., et al. (2025). Structural and Functional Dissection of GH161 β-Glucan Phosphorylases: Molecular Specificities and Dynamics of Catalysis. ACS Catalysis, 15(8), 6182-6197. https://doi.org/10.1021/acscatal.4c07629 解析的结构: PDB: 9GEN, 9GEO, 9GEP, 9GEQ; EMDB: EMD-51581~EMD-51584 摘要糖苷磷酸化酶（GPs）是一类独特的碳水化合物活性酶，它们利用无机磷酸盐代替水来切割糖苷键，从而生成糖-1-磷酸产物。在GH-Q clan中，GH161家族是最新发现且研究最少的成员。本研究从人类肠道宏基因组中鉴定并表征了三个GH161酶（GH161A、GH161B、GH161C），证明它们都是β-1,3-葡聚糖磷酸化酶，以α-D-葡萄糖-1-磷酸（αGlc1P）为供体合成β-1,3-连接的葡聚糖。通过冷冻电镜解析了GH161A的高分辨率结构（2.41 Å），揭示了一个关键的gate loop结构域如何通过开-闭构象变化调控底物进入和产物释放。3D变异性分析（3DVA）进一步揭示了二聚体催化过程中的反对称运动模式，为理解磷酸化酶的催化动力学提供了新见解。核心结论 GH161家族酶是β-1,3-葡聚糖磷酸化酶，可高效合成长链β-葡聚糖 Gate loop的开-闭动力学是催化循环的核心调控机制二聚体两个亚基呈现反对称运动，可能代表催化循环的不同阶段 GH161A具有最高的热稳定性（$T_m$ = 74.8°C）和聚合活性背景糖苷磷酸化酶（Glycoside Phosphorylases, GPs）在碳水化合物代谢中扮演着独特角色。与糖苷水解酶使用水作为亲核试剂不同，GPs利用无机磷酸盐进行磷酸解反应，生成糖-1-磷酸和缩短的糖链。这种反应在热力学上是可逆的，使得GPs既能降解多糖，也能在逆向磷酸解模式下合成多糖。 β-葡聚糖是一类具有重要生物活性的多糖，广泛存在于谷物、真菌和细菌中。它们在生物材料、生物燃料、生物防治以及营养保健和制药领域展现出广泛的应用潜力。然而，β-葡聚糖的酶法合成一直面临挑战：传统的糖基转移酶需要昂贵的核苷酸糖（如UDP-葡萄糖）作为供体，限制了工业应用。 GH-Q clan是CAZy数据库中的一个糖苷磷酸化酶超家族，包含GH94、GH149和GH161三个家族。其中GH94主要作用于β-1,4-连接（如纤维二糖），GH149作用于β-1,3-连接的葡聚糖。GH161是2022年才建立的新家族，其成员的底物特异性和催化机制仍不清楚。关键科学问题 GH161家族酶的底物特异性是什么？它们如何识别和加工β-葡聚糖底物？与同一clan中的GH94和GH149家族相比，GH161有何独特之处？解答这些问题需要高分辨率的三维结构信息，而此前GH161家族尚无任何实验结构。创新点首次解析GH161家族酶的原子分辨率结构揭示gate loop的动力学行为及其在催化中的调控作用发现二聚体的反对称运动模式，提出催化循环的动力学模型系统比较GH-Q clan三个家族的结构与功能差异研究内容方法概述 graph TB subgraph S1["1.功能表征"] direction LR A["宏基因组序列挖掘"] --> B["大肠杆菌重组表达"] B --> C["底物特异性筛选"] C --> D["酶促动力学测定"] end subgraph S2["2.结构解析"] direction LR E["Cryo-EM数据采集"] --> F["单颗粒重构"] F --> G["模型构建与优化"] G --> H["3DVA动力学分析"] end subgraph S3["3.比较分析"] direction LR I["AlphaFold2建模"] --> J["GH-Q clan结构比对"] J --> K["进化与功能关联"] end S1 --> S2 --> S3 style D fill:#e1f5ff style H fill:#fff9c4 style K fill:#ffe0b2 酶的来源与表达：从人类肠道宏基因组数据库中鉴定了三个GH161序列（GH161A、GH161B、GH161C），在大肠杆菌BL21(DE3)中重组表达并纯化。功能表征：使用多种糖作为供体和受体进行活性筛选通过MALDI-TOF质谱和NMR确定产物结构测定稳态动力学参数和热稳定性结构解析：在Titan Krios上采集cryo-EM数据（300 kV）使用RELION进行单颗粒重构解析了四种状态：apo态、与αGlc1P复合物、与昆布三糖（laminaritriose，LM3，三个葡萄糖通过β-1,3键连接）复合物、与葡萄糖/磷酸根复合物使用CryoSPARC进行3D分类和3D变异性分析（3DVA）：这是一种基于cryo-EM数据的计算方法，无需MD模拟即可从实验数据中直接提取蛋白质的构象异质性和动力学信息一、功能筛选与底物特异性图1：GH161酶的功能表征（A）β-1,3-葡聚糖磷酸化酶的反应机制示意图，αGlc1P作为供体，β-1,3-葡聚糖作为受体（B）供体筛选：三个酶都特异性使用αGlc1P，不接受其他糖-1-磷酸（C）受体筛选：GH161A和GH161C偏好β-1,3-连接的寡糖，GH161B也能使用β-1,4-连接底物（D）链长特异性：GH161A可合成长链产物（DP > 10），GH161B和GH161C产物较短三个GH161酶都表现出β-1,3-葡聚糖磷酸化酶活性，但在底物偏好和产物链长上存在差异：酶最佳受体最大产物长度 $T_m$ (°C) GH161A 昆布三糖 > DP10 74.8 GH161B 昆布二糖/纤维二糖 DP4-5 67.9 GH161C 昆布三糖 DP5-6 58.9 GH161A是最高效的聚合酶，能够将短链受体延伸成长链β-1,3-葡聚糖。这种高聚合活性使其成为β-葡聚糖生物合成的潜在工具酶。二、GH161A的整体结构图2：GH161A apo态的冷冻电镜结构（A）二聚体整体结构，两个亚基以青色和深青色区分（B）单体结构域组成：N端结构域（NTD）、催化结构域（TIM桶）、C端结构域（CTD）（C）与GH94纤维二糖磷酸化酶的结构比对，显示保守的TIM桶核心（D）门控环（gate loop，残基348-369）的位置和构象 GH161A形成同源二聚体，每个亚基包含三个结构域： N端结构域（NTD）：α/β折叠，功能尚不明确催化结构域：经典的(α/β)₈ TIM桶结构，包含活性位点 C端结构域（CTD）：α-螺旋束，参与二聚化活性位点位于TIM桶的C端开口处，被一个关键的gate loop（残基348-369）所覆盖。这个gate loop在底物结合前后经历显著的构象变化。三、底物结合与活性位点图3：GH161A与底物的复合物结构（A）与αGlc1P复合物的整体视图，显示供体结合在-1亚位点（B）-1亚位点的详细相互作用：αGlc1P与Y204、R206、D138、H368等残基形成氢键（C）gate loop关闭状态下的构象，H368和Y370插入活性位点（D）昆布三糖复合物结构，受体结合在+1至+3亚位点（E）+1/+2亚位点的相互作用网络（F）磷酸根/葡萄糖复合物，代表催化后的产物态（G）β-1,3-葡聚糖链在活性位点的延伸方向供体结合位点（-1亚位点）的关键残基包括： D138：作为催化碱，活化进攻的羟基 R206：稳定磷酸根的负电荷 Y204、H368：与葡萄糖环形成堆积作用受体结合位点（+1至+3亚位点）相对开放，解释了GH161A能够加工长链底物的能力。四、Gate Loop的构象动力学图4：底物结合诱导的构象变化（A）3D分类揭示两类颗粒：Class 1（47%）为开-闭不对称态，Class 2（53%）为闭-闭对称态（B）主成分分析（PCA）显示gate loop沿两种运动模式变化（C）Morph动画显示gate loop从开放到关闭的过渡 Gate loop的开-闭转换是催化循环的核心：开放态：gate loop远离活性位点，允许底物进入关闭态：gate loop覆盖活性位点，H368定位αGlc1P的C1位置进行催化这种不对称分布暗示两个亚基可能处于催化循环的不同阶段。五、二聚体的反对称运动图5：3D变异性分析揭示的动力学模式（A）整体刚体运动（Mode 1）（B）反对称模式（Mode 2）：一个亚基的gate loop开放时，另一个关闭（C）对称模式（Mode 3）：两个亚基的gate loop同时开放或关闭（D）门控环运动的局部放大，显示H368残基的位移 3DVA分析原理：3D Variability Analysis（Punjani & Fleet, 2021）是一种基于主成分分析的cryo-EM数据处理方法。具体而言：数据准备：对GH161A的61.9万（apo态）或49.2万（催化活性态）个单颗粒进行对称性扩展和局部优化构象空间建模：将每个颗粒的3D密度图视为高维空间中的一个点，计算所有颗粒之间的协方差矩阵主成分提取：通过类似PCA的降维方法，识别出解释数据变异性最大的几个主方向（即运动模式）连续轨迹重建：沿每个主成分方向生成一系列连续的3D重构（如20帧），形成”分子电影” 这种方法的核心是从静态快照中恢复动态信息：尽管每张cryo-EM图像都是蛋白质某一瞬间的”冻结”状态，但通过统计分析成千上万张图像的集体行为，可以推断出蛋白质在溶液中的主要构象变化模式。重要局限：3DVA只能识别出存在哪些构象以及它们之间的转换路径，但无法确定运动的方向性（A→B还是B→A）或转换速率。因此，本研究中gate loop”从开放到关闭”的动画方向是根据催化逻辑推断的（底物需要先进入活性位点），而非3DVA直接给出的时间序列。这就像看一堆照片vs看视频： 3DVA = 从很多照片推断运动模式（但不知道拍摄顺序） MD = 真实的视频（但可能是”电影特效”而非纪录片）所以最理想的研究策略是结合两者：用3DVA确定实验支持的构象空间，再用MD模拟探索这些构象之间的动力学转换。 3DVA分析揭示了三种主要的运动模式：模式特征生物学意义 Mode 1 整体刚体运动样品取向变化 Mode 2 反对称门控交替催化机制 Mode 3 对称门控同步开放/关闭反对称运动模式的生物学意义： Mode 2（反对称模式）在催化活性态的数据集中占主导地位，提示这是GH161A的主要催化运动模式。这种模式展现了一个引人注目的特征：当一个活性位点关闭时，另一个活性位点开放，反之亦然。这与传统认为的”多聚体磷酸化酶的单体功能独立”观点形成鲜明对比。作者提出，GH161A的两个原聚体（protomers）偏好以交替方式工作，这可能对催化有利。这一发现与Chen等人在2023年Chemical Reviews上发表的综述中讨论的二聚体酶正协同性（positive cooperativity）概念高度一致。该综述指出，影响二聚体酶协同性的因素包括：空置vs占据活性位点的动力学差异亚基-亚基相互作用的重要性 GH161A恰好展现了这些特征，提示两个活性位点之间可能存在某种信号传递通路（communication pathway）。 Communication Pathway假说：作者尝试通过追踪两个不对称原聚体之间位移最大的区域来勾勒这条通路，发现信号可能从一个活性位点传递到对侧原聚体的gate loop。这立即引发了一个类似”先有鸡还是先有蛋”的生化悖论：gate loop的关闭是从gate loop本身启动，还是从活性位点启动？答案是：两者都不是严格意义上的首先。正如文献57所述，loop关闭和跨二聚体的信号传递在能量上是耦合的，以协同方式（concerted manner）进行。也就是说，gate loop关闭和活性位点的底物结合是相互促进、同步发生的过程。对称运动模式的含义： Mode 3展现了一种呼吸样运动（breathing-like motion）：两个亚基同时向二聚体中心移动，然后再向外运动。虽然这种模式在催化活性态中不占主导，但在apo态和仅结合LM5的复合物中观察到。这提示：对称运动可能代表酶在非催化状态下的构象涨落反对称运动仅在同时存在供体和受体时被触发值得强调的是，这些运动模式都是从实验数据中直接观察到的，而非通过计算机模拟预测的。这为理解磷酸化酶的催化动力学提供了坚实的实验基础六、GH161家族的结构比较图6：GH161A、GH161B和GH161C的结构比较（A）GH161A实验结构（青色）（B）GH161B AlphaFold2模型（紫色）（C）GH161C AlphaFold2模型（橙色）下方面板：gate loop区域的序列和结构差异三个GH161酶的整体结构高度相似，但gate loop区域存在显著差异： GH161A：gate loop最长（22残基），包含关键的H368 GH161B：gate loop较短，缺少H368等效残基 GH161C：gate loop长度中等，K130和K132可能参与底物识别这些差异可能解释了三个酶在底物特异性和聚合能力上的差异七、GH-Q Clan的进化关系图7：GH-Q clan三个家族的结构比较（A）GH161A（本研究）（B）GH94纤维二糖磷酸化酶（C）GH149 β-1,3-葡聚糖磷酸化酶（D）GH94 β-1,2-寡糖磷酸化酶下方面板：活性位点的关键差异 GH-Q clan的三个家族共享： (α/β)₈ TIM桶催化结构域保守的催化残基（Asp作为催化碱）二聚体或多聚体组装但它们在连接特异性上有明显分化： GH94：β-1,4和β-1,2连接 GH149：β-1,3连接 GH161：β-1,3连接（本研究确认） GH161与GH149在底物特异性上重叠，但结构差异表明它们是独立进化的β-1,3-葡聚糖磷酸化酶 Q&A Q1：为什么GH161A的聚合活性比GH161B和GH161C高得多？ A1：主要原因在于gate loop的结构差异： GH161A的gate loop包含完整的H368残基，能够精确定位供体糖 GH161A的受体结合通道更开放，允许长链产物的延伸 GH161A的热稳定性最高（74.8°C），在反应条件下保持更好的催化活性 Q2：反对称运动模式对催化有什么功能意义？这种协同性在其他磷酸化酶中观察到过吗？ A2：反对称运动揭示了GH161A可能具有正协同性，这在糖苷磷酸化酶家族中非常罕见：功能意义：提高催化效率：交替工作模式可能避免两个活性位点同时处于能量不利的中间态产物释放优化：一个亚基的产物释放可能促进另一个亚基的底物结合能量耦合：一个亚基的gate loop关闭释放的能量可能帮助另一个亚基的gate loop开放与其他磷酸化酶的对比：大多数糖苷磷酸化酶的多聚体亚基被认为是功能独立的，没有明显的协同性唯一例外：哺乳动物糖原磷酸化酶展现出变构调控和协同性，但其机制与GH161A不同 GH161A的反对称运动是首次在GH-Q clan中观察到的亚基间协调行为需要进一步验证：动力学实验（如底物浓度依赖曲线的Hill系数）单分子FRET实验验证两个活性位点的动力学相关性 MD模拟探索communication pathway的分子机制 Q3：GH161酶在肠道微生物组中的生理功能是什么？ A3：这些酶可能参与：多糖降解：磷酸解β-葡聚糖获取能量多糖合成：在特定条件下合成β-葡聚糖作为储能物质或生物膜成分共生代谢：与宿主或其他微生物的碳水化合物代谢互作 Q4：为什么使用cryo-EM而不是X射线晶体学？ A4：Cryo-EM的优势在于：可以捕获蛋白质的多种构象态（如开放/关闭态）不需要晶体，避免晶体堆积对构象的限制 3DVA分析可以揭示连续的构象动力学本研究中确实观察到了2种不同的3D类别和3种运动模式关键结论与批判性总结主要贡献：首次提供GH161家族的原子分辨率结构信息揭示gate loop动力学是催化调控的核心机制发现二聚体反对称运动模式，挑战了传统上认为多聚体磷酸化酶亚基功能独立的观点提出亚基间存在“communication pathway”的假说，为GH-Q clan酶的协同催化机制带来全新视角局限性：仅有GH161A的实验结构，GH161B和GH161C依赖AlphaFold2预测 3DVA无法直接提供时间信息：运动方向和速率仍需结合生化动力学实验或MD模拟验证协同性假说缺乏直接动力学证据：需要通过Hill系数、单分子FRET或双突变循环分析来量化亚基间的相互作用强度缺乏与真实生理底物（长链β-葡聚糖）的复合物结构 Communication pathway的分子细节尚不清楚：Supporting Figure 13展示的路径仍是推测性的未来方向：验证协同性假说：通过稳态动力学（Hill系数）、预稳态动力学（突发相）、单分子FRET实验量化亚基间的功能耦合鉴定communication pathway关键残基：结合MD模拟和双突变循环分析（double-mutant cycle analysis）设计解耦突变体：破坏二聚化界面或communication pathway，测试单体酶的催化效率设计具有更高聚合活性的GH161突变体用于工业生产解析GH161B和GH161C的实验结构，验证AlphaFold2预测研究gate loop突变对催化动力学的定量影响探索GH161在肠道微生物组中的生态功能更广泛的影响：本研究展示了cryo-EM在捕获酶催化动力学快照方面的独特优势。结合3DVA分析，研究者无需晶体化即可揭示蛋白质在溶液中的构象异质性。这为研究其他动态酶系统（如变构酶、马达蛋白）提供了方法学启示。 GH161A的反对称催化模式也提醒我们：多聚体酶的亚基可能并非简单的“功能拷贝”，而是通过协同作用实现更高的催化效率。正如作者引用的Chen等人的综述所言，二聚体酶的动力学远比我们过去认为的要复杂和精妙

Specific Sytems · 2025-11-25

EnzyControl：酶设计方法的技术细节与算法深解

Specific Sytems · 2025-11-05

让酶生成可控：EnzyControl为骨架生成引入功能与底物特异性

让酶生成可控：EnzyControl为骨架生成引入功能与底物特异性本文信息标题: 为酶骨架生成引入功能与底物特异性：EnzyControl 方法作者: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang 发表时间: 2025年10月29日（arXiv v1）单位: Northwestern Polytechnical University（中国）; National University of Singapore（新加坡）; The Chinese University of Hong Kong（中国香港）; Institute of Automation at CAS（中国）引用格式: Song, C., Liu, Z., Huang, H., Wang, L., Wang, Q., Shi, J., Yu, H., Zhou, Y., & Zhang, Y. (2025). EnzyControl: Adding Functional and Substrate‑Specific Control for Enzyme Backbone Generation. arXiv:2510.25132. 代码与资源: GitHub — https://github.com/Vecteur-libre/EnzyControl 摘要设计具有底物特异性功能的酶骨架是计算蛋白质工程的关键挑战。现有生成模型在蛋白设计上表现优异，但在结合数据、底物特异控制与从头设计灵活性方面存在局限。为此，本文介绍 EnzyBind 数据集，包含 11,100 个从 PDBbind 精心遴选的实验验证酶‑底物复合物。基于此，提出 EnzyControl 方法，在酶骨架生成中实现功能与底物特异性的联合控制。该方法以 MSA 标注的催化位点及其对应底物为条件，生成酶骨架；通过轻量级可模块化的 EnzyAdapter 集成到预训练的骨架生成模型中，使其具备底物感知能力。两阶段训练范式进一步优化了模型生成精确、功能性酶结构的能力。实验表明，EnzyControl 在 EnzyBind 与 EnzyBench 基准上均取得最佳性能，相比基线模型在可设计性与催化效率上分别提升 13%。代码已开源于 https://github.com/Vecteur-libre/EnzyControl 。核心结论在 SE(3) 等变骨架生成中注入底物条件，显著提升结构可设计性与功能可控性 EnzyAdapter 将底物语义与功能位点跨注意力耦合，带来更高的 EC 匹配率与更优的预测 $k_{cat}$ 两阶段训练与 LoRA 微调有效稳定训练并降低成本在零样本场景（新底物/新 EC 类别）中仍保持较强的亲和力与效率指标背景蛋白设计的可控生成正从一般结构可行性走向功能可控。特别是在酶设计中，目标不只是生成稳定的骨架，还要对功能分类（EC 号）与底物特异性作出定向约束，以服务合成生物学与绿色催化。现有扩散/流匹配式骨架生成模型在形状正确方面已取得进展，但面临三类挑战。其一，功能语义难以注入：结构生成主干多以几何信号为核心，如何有效嵌入底物与功能位点的信息尚不清晰。其二，训练不稳定与成本高：在大规模条件生成中，端到端训练容易漂移，需要参数高效的适配策略。其三，评价不统一：结构指标（scTM、scRMSD）与功能指标（EC 匹配、$k_{cat}$、对接亲和力）往往分散，缺乏覆盖多 EC 家族的系统基准。在这个背景下，Frank Noe 团队发表的 FrameFlow 工作为蛋白骨架生成树立了新的标杆，通过 SE(3) 等变流匹配框架实现了高质量的结构采样。EnzyControl 的创新之处在于，它在 FrameFlow 等变骨架生成主干的基础上，首次系统地引入底物conditioning与功能位点约束，使得结构生成不再是纯几何问题，而是与分子功能紧密耦合的生物设计问题。关键科学问题如何将底物语义与功能位点表征稳定地注入到三维骨架生成主干中，并保持 SE(3) 等变性质不被破坏。如何在训练成本可控的前提下，完成端到端的条件适配，并提升零样本泛化能力。如何建立覆盖多 EC 家族、既关注结构一致性又关注功能性的统一评测体系。创新点 EnzyAdapter：跨注意力条件层，将底物图嵌入与功能位点特征在每层耦合，显式影响平移与旋转向量场两阶段训练范式：先对齐底物/功能条件，再以 LoRA 低秩微调端到端适配统一评估流水线：骨架→ProteinMPNN 逆折叠→ESMFold 结构预测→CLEAN/UniKP/GNINA/ESP 指标，覆盖结构与功能数据与基准：构建 EnzyBind 与独立基准 EnzyBench，跨 EC 家族报告 EC 匹配率、$k_{cat}$ 与亲和力研究内容核心方法：条件化酶骨架生成框架详见附录（今天的下一篇推送）图3：EnzyControl 的条件生成框架。在主干各层注入 EnzyAdapter 后，自我一致性与可设计性（scRMSD<2Å）显著提升，说明底物语义有效约束了骨架更新的方向。数据集与评估设置详见附录实验结果与分析核心评估指标解析表1 EnzyBind 上结构与功能指标的总体比较（节选重排）。模型 Self Consistency 可设计性（scRMSD<2Å） EC匹配率平均 $k_{cat}$ 结合亲和力（越低越好） ESP分数 RFDiffusion 0.6932 0.5728 0.0812 2.3412 −6.7446 0.6657 Chroma 0.6546 0.5163 0.4579 2.5325 −6.7258 0.7116 Proteina 0.7213 0.6328 0.4583 2.4592 −6.3522 0.6709 EnzyControl 0.8848 0.7160 0.5041 2.9168 −6.9303 0.7334 解读：与不含条件注入的主流骨架生成相比，EnzyControl 在结构可设计性与功能匹配上同步提升，且对接亲和力更优。底物‑到‑残基的跨注意力是关键贡献。图5/图6/图7：关键分布与匹配率对比。图5：EnzyAdapter 的存在使高 $k_{cat}$ 区间占比上升（左侧蓝色分布右移）图6：整体亲和力分布左移（更优），代表更强的结合能力图7：在 EC 一级至四级层级，EnzyControl 的匹配率稳定领先其他基线，证明模型学到了跨层级的一致功能语义表5 组件消融（去除 EnzyAdapter 或去除 MSA 保守位点，EnzyBind）。 EnzyAdapter MSA Self Consistency 可设计性 EC匹配率平均 $k_{cat}$ 结合亲和力 ESP ✓ ✓ 0.8848 0.7160 0.5041 2.9168 −6.9303 0.7334 ✗ ✓ 0.8748 0.7067 0.4761 2.5833 −6.5523 0.7205 ✓ ✗ 0.8719 0.6863 0.4764 2.4615 −6.4361 0.7183 解读：去除 Adapter 或去除保守位点都会显著降低 EC 匹配率与 $k_{cat}$ 均值。功能位点的保真度与条件注入的强度共同决定功能性指标。表3：跨EC家族的结合亲和力对比浅解读：EnzyControl 在 17个EC家族上的亲和力均优于基线模型，平均达 −6.93 kcal/mol。表4表明，MSA保守位点的扰动会显著拉低所有性能指标，证实了功能位点保真度至关重要。图8：零样本泛化（新底物/新 EC）。EnzyControl 在未见过的底物与 EC 二级类别上，结合亲和力仍保持较低，显示较强的迁移能力。表5（续）：EnzyBench 基准上的质量指标模型结合亲和力（Avg） pLDDT（Avg） EnzyGen −9.61 87.21 RFDiffusion+IF −8.75 83.22 EnzyControl −9.76 88.28 表6：EnzyBench 中跨30个EC家族的结合亲和力细节浅解读：EnzyControl 在30个EC家族上亲和力均优于或持平基线，平均达 −9.76 kcal/mol。这验证了底物条件化在不同催化机制间的广适性。图10：个案研究（PDB:2cv3）。在该底物上，EnzyControl 生成的骨架对接姿态更贴合，预测 $k_{cat}$ 更高，说明条件注入促成了更具化学合理性的口袋几何。具体而言：结合亲和力改善：EnzyControl 生成的骨架达到 −9.78 kcal/mol，相比 RFDiffusion 的 −6.92 kcal/mol 提升 51% 催化效率飙升：预测的 $k_{cat}$ 达 9.72 s⁻¹，比 RFDiffusion 高近 8 倍相互作用网络：对接模拟显示 EnzyControl 生成的酶与底物形成更多相互作用键，表明口袋几何更优残基效率（Residue Efficiency）：在实际蛋白质工程中，设计的酶应在保持功能活性的前提下，尽可能缩短序列长度（更短的序列促进基因表达，降低合成成本）。研究表明，EnzyControl 相比 RFDiffusion 基线在不同 $k_{cat}$ 区间内都能生成约 30% 更短的序列，这对合成生物学应用具有重要经济价值。多样性与新颖性分析虽然 EnzyControl 追求可设计性，但其多样性指标（通过 Foldseek 聚类计算）与部分超大模型相比略低。这反映了一个普遍的权衡：追求可设计性（结构与功能的稳定性）往往需要牺牲某些采样多样性。这是未来工作需要平衡的方向。结果逻辑图：从条件表征到功能验证 graph TB subgraph II["结构质量验证"] direction TB D["Self Consistency 0.8848 (vs 0.7213)"] E["可设计性：scRMSD<2Å 71.60% (vs 63.28%)"] F["核心发现：底物conditioning 显著提升结构可靠性"] end subgraph III["功能性检验"] direction TB G["EC匹配率 50.41% (vs 45.83%)"] H["预测kcat 2.9168 s⁻¹ (vs 2.4592)"] I["结合亲和力 -6.9303 kcal/mol (vs -6.3522)"] J["核心发现：EnzyAdapter 精确映射底物到催化功能"] end subgraph IV["泛化能力验证"] direction TB K["零样本新底物 亲和力可维持"] L["零样本新EC类别 匹配率有效"] M["核心发现：模型学到 通用功能映射规律"] end subgraph V["设计可行性验证"] direction TB N["个案2cv3: kcat提升8倍"] O["残基效率 序列缩短30%"] P["对接评分显著改善 -9.78 vs -6.92 改善51%"] Q["核心发现：结构生成 与实际催化耦合有效"] end II --> III --> IV --> V style D fill:#c8e6c9 style E fill:#c8e6c9 style F fill:#fff59d style G fill:#ffccbc style H fill:#ffccbc style I fill:#ffccbc style J fill:#fff59d style K fill:#b3e5fc style L fill:#b3e5fc style M fill:#fff59d style N fill:#f8bbd0 style O fill:#f8bbd0 style P fill:#f8bbd0 style Q fill:#fff59d 讨论方法论创新的深层意义 EnzyControl 的突破在于在保持 SE(3) 等变性的严格约束下实现功能可控，解决了结构生成与功能约束长期以来的矛盾。具体而言：功能可控与结构可行的统一：底物条件化通过 EnzyAdapter 的跨注意力机制，实现了底物信息与骨架更新的紧耦合。这避免了以往模型在追求多样性时功能指标下降的问题，而是在保证可设计性的同时，精准映射到相应的催化功能。参数高效的适配范式：两阶段+LoRA 训练将适配成本压缩至可操作范围。第一阶段的底物-功能对齐避免了主干参数的快速漂移，第二阶段的低秩分解（<5% 参数量）进一步降低了资源消耗，使得该方法可行于资源受限的研究组。系统化的评估体系：EnzyBind/EnzyBench 的联合设计，跨 EC 家族构建统一基准，避免了以往单类酶评估的局限。评估模型（CLEAN、UniKP、GNINA）都已在真实酶或相关任务上验证，为计算指标奠定了生物学基础。 SE(3) 等变性的实现机制 EnzyControl 能够在保持等变性的同时注入底物条件，关键在于跨注意力直接作用于向量场，而非破坏刚体变换的自然性。具体而言： EnzyAdapter 的输出与 IPA 的特征表征在特征空间中融合，不涉及坐标系变换 BackboneUpdate 基于融合后的特征预测 $\Delta \mathbf{r}$ 与 $\Delta \mathbf{R}$，这些增量本身满足 SE(3) 群的闭包性质因此，即使底物信息已注入，生成的骨架对刚体变换仍然协变——旋转整个复合物，生成结果也相应旋转零样本泛化的源头 EnzyControl 在新底物与新 EC 类别上仍能保持较好性能（结合亲和力 −7.01 kcal/mol，仅略低于已见任务的 −6.93 kcal/mol），原因包括： Uni-Mol 的丰富知识库：在 209M 分子构象上预训练，即使遇到新的底物结构，仍能映射到接近的特征空间 Adapter 学到的是通用映射：不是记忆单个“底物“，而是学习”大分子特征→残基更新方向”的规律 MSA 保守位点的约束：功能位点的进化守恒性提供了跨家族的鲁棒性与现实设计管线的衔接虽然 EnzyControl 生成的是骨架，但通过以下流程可集成到实际工程：生成 20 个骨架 → 逆折叠得到 100 个候选序列 → 结构预测对接引导优化：基于 GNINA 对接分数反复迭代 → 发现结合亲和力 −8.38 kcal/mol 的改进体（相比初始 −6.92 kcal/mol 提升 21%）湿实验验证与合成性质优化迭代这一“生成→筛选→再生成”的闭环是未来的关键方向。关键结论与批判性总结潜在影响证明酶骨架生成可以被功能与底物特异性联合控制提供可复用的条件注入与低秩适配范式，便于迁移至其他“蛋白”家族局限性未建模底物结合构象：当前方法专注于生成酶骨架，但并未显式建模骨架在与底物结合时所采纳的特定构象变化（如 AtomicFlow 所强调的），这可能导致生成的骨架在实际催化中的构象灵活性不足多链装配的间接处理：现有框架限制在单链酶骨架，简化了序列-结构映射但限制了对多聚体或复杂变构系统的直接应用，目前采用的是生成→融合二聚化的事后策略而非集成设计多样性与可设计性的权衡：虽然 EnzyControl 生成多样的骨架样本，但在保持高可设计性（scRMSD<2Å）的前提下，多样性与新颖性指标略低于在更大、更异质训练集上训练的通用模型缺乏自身的湿实验验证：本文所有评估均基于计算模型预测（CLEAN、UniKP、GNINA），虽然这些模型本身已在其他酶系统上验证过，但本工作并未对 EnzyControl 生成的候选酶进行独立的实验室合成和活性测定，因此实际设计效果仍需在真实湿实验中进一步确认未来方向将条件扩展至辅酶/金属离子/环境因子，形成多条件联合控制与对接或分子力场形成闭环优化，实现“生成→筛选→再生成”的联动在湿实验中验证关键家族与代表“底物“，形成”设计‑验证”的正反馈小编锐评：反正是学一下模型，Flow Matching感觉细节还有很多抽象问题。怎么说呢，都考虑配体了，干嘛不设计一下序列呢，显得没啥用啊。还跟proteinMPNN绑定了，或者其他能考虑配体的序列设计联用。$k_{cat}$ 与对接亲和力本应能说明这个事可能有用的，但结果看来没明显变好。感觉酶类的评估指标都一般啊，都是计算的指标，用别的模型给它打分，甚至还有对接分数，你最起码用AlphaFold3预测复合物结构吧，或者boltz-2预测，当然可能做的比较早？也没做湿实验，酶没湿实验都难以验证。还是觉得生成类的文章做评估都是玄学，又要像已知的都行，有时候还要新颖才能效果好，就是因为只依赖于有限的数据而无基于物理的验证，有模拟总比没有强。我也不太懂AI。越来越不信任预印刊，我觉得计算机领域带着计算生物学化学老是认可预印是不对的，很多不太靠谱的，哪怕是大佬组的东西。这篇才是我理想中酶设计大概的套路：https://mp.weixin.qq.com/s/1opv945uG_R-2GpkI59s5w

Specific Sytems · 2025-11-05

皮肤屏障的两种面孔：分子模拟揭示亲水与疏水跨膜孔道的形成机理

Specific Sytems · 2025-11-02

解码皮肤“长城”：冷冻电镜与分子模拟联手揭示皮肤屏障的原子级奥秘

Specific Sytems · 2025-11-02

Untitled

Robert Vacha CEITEC and NCBR, Faculty of Science, Masaryk University, Brno, Czech Republic Verified email at mail.muni.cz - Homepage coarse grainingphospholipid membranespeptides https://vacha.ceitec.cz/ https://scholar.google.com/citations?user=NEt2O0MAAAAJ&hl=en About We are an interdisciplinary team working on understanding the molecular mechanisms underlying vital biological processes. In particular, we are interested in biological membranes, proteins, and their interactions which have applications in medicine, biochemistry and biotechnology. We develop and use unique theoretical and computational tools for multiscale modeling ranging from all-atom to very coarse-grained (single particle per molecule). We verify the simulated results by experiments in our lab. Our motto is: “Improve the well-being of humankind by understanding peptide-membrane interactions.” Research Our research group is dedicated to unraveling the fundamental mechanisms of PROTEIN-MEMBRANE and PROTEIN-PROTEIN interactions that regulate protein self-organization and membrane remodeling. These interactions are crucial for understanding cellular signaling and transport and for addressing pressing challenges such as antimicrobial resistance, cancer, and viral infections. Protein-Membrane Interactions We investigate how proteins interact with cellular membranes, focusing on protein self-organization and membrane remodeling. By examining the interplay between lipid composition and protein properties, we aim to understand how the lipid membranes influence protein function and how proteins, in turn, self-organize to modify membrane shape and properties. Our work includes studying membrane-active peptides with antimicrobial, fusogenic, and curvature-sensing or modulating properties. Learn more about this research HERE. Protein-Protein Interactions Our research also explores protein-protein interactions, with a focus on liquid-liquid phase separation and the interactions of viral capsid subunits. We investigate the specific protein properties and conditions that promote the formation of liquid droplets and membrane-less organelles, both essential for cellular signaling and regulation. Additionally, we study how viral proteins drive the assembly and genome release of viral particles, providing insights into mechanisms of viral infectivity. Learn more about this research HERE. Multidisciplinary Approach and Facilities To address these complex biological questions, we employ a multidisciplinary approach that integrates computer simulations, theoretical modeling, and experimental assays. We develop and apply novel computational models with a multiscale perspective to explain and predict complex phenomena in biomolecular systems. Our fully equipped laboratory allows us to conduct a wide range of biophysical assays and safely work with BSL-2 pathogens. Supported by our dedicated laboratory staff, we leverage the strengths of each method to gain novel insights into biological processes. Additionally, we have access to the CEITEC Core Facilities, which provide specialized services, training, and expertise across multiple scientific domains. Learn more about Core Facilities HERE. Timothée Rivel (Postdoc) CTO at InSiliBio InSiliBio Université de Franche-Comté 法国勃艮第-弗朗什-孔泰大学物理学博士，捷克共和国Robert Vácha团队博士后。 Timothée 致力于运用不同尺度的分子建模技术开展研发项目。他还参与开发分析工具，以便对所研究的分子过程提供详细可靠的描述。 https://www.insilibio.com/index.php?page=accueil

Specific Sytems · 2025-11-02

破解膜孔之谜：双CV联手揭示从成核到扩展的完整能量图景

Specific Sytems · 2025-11-02

附录A：CV设计原理与PLUMED实现的技术细节

附录A：CV设计原理与PLUMED实现的技术细节本文档是《破解膜孔之谜：双CV联手揭示从成核到扩展的完整能量图景》的技术附录A，专注于CV设计的物理原理、数学严谨性证明、PLUMED实现及参数优化。力场选择、故障排查和实验对比请参阅附录B。一、Full-Path CV的物理图景：从成核到扩展的能量学 1.1 CV设计如何映射物理过程 Q：Full-Path CV的两段设计如何与自由能剖面的两段形式对应？背后的物理图景是什么？ A：这是本研究最精妙的设计之处，体现了CV与物理过程的完美匹配。对应关系成核阶段（CV < 0.5）：$\text{CV}_{\text{cyl}}$主导，追踪圆柱体内尾部原子数减少 → 自由能呈二次增长 $\Delta G \propto \text{CV}^2$ 扩展阶段（CV > 1.2）：$\text{CV}_{\text{radius}}$主导，追踪孔半径增长 → 自由能呈线性增长 $G \propto r$ 成核阶段的物理图景（为什么是二次关系？）重要说明：原文通过经验拟合发现自由能与CV²呈正相关（PDF第3-4页），但并未从第一性原理推导出二次关系。以下是可能的物理解释：膜的集体弹性响应：脂质尾部原子从圆柱区域移走 → 膜局部厚度减小 → 产生弯曲和拉伸形变根据连续介质弹性理论，形变能 $\propto$ (形变量)² 关键：这不是N个独立弹簧的简单叠加，而是膜作为整体的弹性响应为什么$\Delta G \propto (\Delta N_{\text{atoms}})^2$？ $\text{CV}{\text{cyl}} = 1 - d/d{\text{eq}}$，其中$d$是圆柱内原子数如果局部膜厚度与原子密度线性相关：$h \propto d$ 而弯曲能 $\propto$ (厚度变化)² $= (h - h_0)^2 \propto (\Delta d)^2$ 因此 $\Delta G \propto \text{CV}^2$ 经典成核理论类比：液滴成核：$\Delta G(r) = -\frac{4}{3}\pi r^3 \Delta P + 4\pi r^2 \gamma$（体积能 + 表面能）临界核附近展开：$\Delta G \approx \Delta G^* + k(r - r^*)^2$（二次近似）膜孔成核可能类似：小缺陷阶段能量随缺陷程度平方增长 Helfrich弹性模型基础：膜弯曲能：$E_{\text{bend}} = \int \frac{\kappa}{2}(c - c_0)^2 \mathrm{d}A$ 如果缺陷导致局部曲率变化 $\Delta c \propto \text{CV}$ 则弯曲能 $\propto (\Delta c)^2 \propto \text{CV}^2$ 坦诚的局限性：原文未给出严格推导，只是唯象拟合二次关系在CV < 0.5范围内成立，但物理机制尚不完全明确可能涉及膜弹性、界面张力、构型熵的复杂耦合扩展阶段的物理图景（为什么是线性关系？）孔边缘线张力主导：一旦形成稳定的跨膜水孔，能量主要来自孔边缘暴露的疏水尾部与水接触的界面能几何关系：孔周长 $L = 2\pi r$，总界面能 = 周长 × 单位长度能量 = $2\pi r \gamma$ 线张力定义：$\gamma$ 是单位长度孔边缘的能量代价（单位：pN = pJ/nm），物理意义类似于表面张力但针对一维边缘正确的公式： $G(r) = 2\pi r \gamma$ 由于$\text{CV}{\text{radius}} = r/r{\text{unit}}$且$r_{\text{unit}} = 1$ nm，在数值上$\text{CV} = r$（单位nm），因此自由能剖面斜率 = $2\pi\gamma$。切换函数的巧妙之处在 CV ≈ 0.95 附近，膜缺陷刚好转变为真正的跨膜孔，此时从”弹性变形主导”平滑过渡到”界面能主导” 切换函数确保两种物理机制的权重按实际物理过程自然演变，避免人为断点实验验证图S7显示在孔寿命 $\tau$ 时刻，Full-Path CV值紧密分布在 0.5 以下，正好处于二次拟合的成核区域，证明CV准确捕捉了从缺陷到孔的物理转变点。二、CV参数设计的数学严谨性 2.1 圆柱半径与切换点的关系 Q：为什么$\text{CV}{\text{cyl}}$使用$R{\text{cyl}} = 1.2$ nm而$\text{CV}{\text{radius}}$使用$r{\text{unit}} = 1$ nm？它们在切换点的连续性如何保证？ A：这个看似不对称的设计实际上巧妙地避免了数值连续性问题。为什么使用不同的归一化参数？ $\text{CV}{\text{cyl}}$的归一化**：$\text{CV}{\text{eq}}$不是圆柱半径，而是完整膜中圆柱内的原子数**。即使$R_{\text{cyl}} = 1.2$ nm，当膜完整时$\text{CV}{\text{cyl}} = 0$（原子数最多），当圆柱内原子完全移走时$\text{CV}{\text{cyl}} = 1$ $\text{CV}{\text{radius}}$的归一化**：$r{\text{unit}} = 1$ nm只是一个单位换算常数**，使CV无量纲化。当孔半径$r_{\text{min}} = 1$ nm时，$\text{CV}_{\text{radius}} = 1$ 为什么不需要在分界点相等？关键在于理解联合CV的定义： [\text{CV} = \text{CV}{\text{cyl}} \times s_1(\text{CV}{\text{radius}}) + \text{CV}{\text{radius}} \times s_2(\text{CV}{\text{radius}})] 注意：切换函数$s_1$和$s_2$的自变量是$\text{CV}{\text{radius}}$，而非$\text{CV}{\text{cyl}}$！这意味着：在切换点$\text{CV}0 = 0.95$处，判断标准是$\text{CV}{\text{radius}} = 0.95$（即$r_{\text{min}} \approx 0.95$ nm）此时$s_1 = s_2 = 0.5$，两个CV各贡献一半 $\text{CV}_{\text{cyl}}$此时可以是任何值（通常在0.3-0.7之间），不需要等于0.95 连续性如何保证？ $\text{CV}_{\text{radius}}$本身始终连续：它是孔中心到尾部原子的最小距离，物理上平滑变化 $\text{CV}_{\text{cyl}}$本身始终连续：它追踪圆柱内原子数，通过PLUMED的RATIONAL平滑函数确保可微联合CV的连续性：由于$s_1 + s_2 = 1$始终成立，且两个CV本身连续，加权和必然连续可微性：切换函数使用sigmoid形式，在所有点无穷次可微物理意义当孔半径$r < 0.95$ nm时：主要追踪圆柱内尾部原子的移出（缺陷形成）当孔半径$r > 0.95$ nm时：主要追踪孔边缘的几何半径（孔扩展）圆柱半径1.2 nm > 切换点0.95 nm：确保在切换发生时，圆柱足够大以包含正在形成的小孔设计哲学两个CV描述的是不同的物理量（原子密度 vs 几何半径），通过基于孔半径的切换函数平滑过渡，而非要求它们的数值在某点相等。这种设计反而避免了强制匹配带来的物理意义扭曲。 2.2 Rapid方法的CV可导性：盒子尺寸作为集体变量的技术细节 Q：盒子尺寸不是原子坐标的直接函数，为何能作为集体变量？PLUMED如何计算它对原子坐标的导数？ A：这是一个非常关键的技术问题，涉及NPT系综和PLUMED内部实现的深层机制。 NPT系综中的盒子尺寸动力学在NPT系综（恒压恒温）中，盒子尺寸本身就是动力学变量：扩展系综理论：NPT系综通过Andersen压力耦合或Parrinello-Rahman方法实现，盒子参数作为额外自由度引入，具有自己的”质量”和运动方程标度坐标：原子的实际坐标与盒子尺寸通过标度坐标（scaled coordinates）关联： $\mathbf{r}_i = \mathbf{h} \cdot \mathbf{s}_i$ 其中$\mathbf{h}$是盒子矩阵（包含盒子尺寸），$\mathbf{s}_i$是标度坐标（0到1之间）导数关系：当盒子尺寸改变时，所有原子的实际坐标会同步缩放，因此盒子尺寸对系统能量的导数可以通过应力张量（virial tensor）表达 PLUMED的CELL组件实现 PLUMED的CELL组件（如COMPONENT=ax）提取盒子参数作为CV：可用参数：ax, ay, az（盒子基矢长度）, bx, by, bz, cx, cy, cz（非正交盒子）导数计算：PLUMED通过virial应力张量传递偏置力到原子坐标和盒子参数力的分配：当对盒子尺寸施加约束力时，该力会：通过virial传递给压力耦合器间接影响所有原子的标度坐标关键文献引用（PLUMED文档）： “For collective variables that depend on the simulation cell (like CELL components), derivatives are computed with respect to the cell parameters, and forces are applied via the virial contribution.” Virial修正的局限性重要注意事项：根据PLUMED官方文档（截至2023年）： “No virial correction due to the Gaussian bias has been implemented yet, which means running an NPT metadynamics simulation without the virial correction will lead the system to equilibrate to a wrong pressure which changes as the bias changes.” 对本研究的影响： Rapid方法使用伞形采样（Umbrella Sampling），而非metadynamics，因此每个窗口的偏置势是静态的简谐约束： $V_{\text{bias}} = \frac{1}{2}\kappa(L_x - L_x^0)^2$ 简谐约束的virial贡献相对简单，且在每个窗口中保持不变，因此压力平衡问题相对较小（但不是完全消失）实际处理策略：使用半各向同性压力耦合（xy方向耦合，z方向独立），允许垂直于孔的方向自由调整使用较大的约束力常数$\kappa = 5000$ kJ/(mol·nm²)，使盒子尺寸涨落最小化每个窗口充分平衡（150 ns for全原子），确保系统达到伪平衡态与Full-Path CV的对比特性 Full-Path CV Rapid CV (盒子尺寸) CV类型原子坐标的函数盒子参数（准坐标）导数计算直接对原子坐标求导通过virial张量可导性保证需要RATIONAL平滑函数盒子参数天然平滑 NPT问题无需注意virial修正适用系综 NVT或NPT均可推荐NPT（必须允许盒子涨落）技术验证图5B的线性自由能剖面本身就是验证：如果CV定义或导数计算有误，自由能曲线会出现artifacts（如锯齿、不连续）所有力场的自由能vs盒子尺寸都显示优异的线性度（R² > 0.99） Full-Path和Rapid方法的线张力预测高度一致（差异<5 pN），证明两种不同类型CV的实现都是正确的实践建议 MD引擎设置：使用支持anisotropic压力耦合的引擎（如GROMACS的semi-isotropic）设置合理的压力耦合时间常数（本研究：4 ps） PLUMED设置：确保PLUMED版本≥2.5（更好的CELL支持）使用PRINT输出盒子尺寸和压力，监控平衡状况数据分析：检查每个窗口的压力分布，确保接近目标值（1 bar）如果压力系统性偏离，考虑重新校准压力耦合参数三、参数优化建议 3.1 Full-Path方法的参数调优参数默认值调整建议影响 $R_{\text{cyl}}$ 1.2 nm 1.0-1.5 nm 成核检测灵敏度 $\alpha$ 20 10-30 切换陡峭程度 $\text{CV}_0$ 0.95 0.8-1.1 切换位置 $\kappa$ 5000 kJ/mol 2000-10000 采样效率调参建议：先运行无约束模拟，观察自发孔闭合时CV值分布根据孔寿命处的CV值调整$\text{CV}_0$（建议设在该值+0.2）增大$\alpha$可减少切换区域的自由能artifact，但需更密集的采样窗口 3.2 双曲正切拟合孔状态的理论依据 Q：在自发孔闭合模拟中，为什么使用双曲正切函数（$\tanh$）来拟合孔状态$s(t)$的时间演化？这有物理依据吗？ A：双曲正切函数是描述两态系统转换动力学的经典模型，具有坚实的理论基础。双曲正切拟合函数原文使用的拟合形式为： [s(t) = A_0 - \tanh\left(\frac{t - A_2}{A_1}\right)] 其中： $A_0$：背景水平（约0.6，对应膜表面始终有水） $A_1$：时间尺度参数（控制转换速率） $A_2$：孔寿命$\tau$（即50%转换点，$s(\tau) = A_0 - \tanh(0) = A_0$）理论依据1：两态系统的Langevin动力学膜孔可视为在”开放态”（$s \approx 1$）和”闭合态”（$s \approx 0.6$）之间转换的两态系统。一维势能面模型：假设孔状态沿某反应坐标$\xi$演化，势能面呈双阱形式： [U(\xi) = -\frac{a}{2}\xi^2 + \frac{b}{4}\xi^4] 在过阻尼极限（脂质扩散很慢）下，Langevin方程简化为： [\frac{\mathrm{d}\xi}{\mathrm{d}t} = -\frac{1}{\zeta}\frac{\mathrm{d}U}{\mathrm{d}\xi} + \text{noise}] 其中$\zeta$是摩擦系数。忽略热噪声（当驱动力足够大时），这是一个非线性松弛方程。解的形式：对于从势阱越过势垒后沿负梯度”滚下”的过程，解具有sigmoid形状。最简单的非线性松弛方程： [\frac{\mathrm{d}\xi}{\mathrm{d}t} = k(\xi_{\infty} - \xi)(1 - \text{constant} \times \xi)] 其解为双曲正切函数（或逻辑函数，两者形式相似）： [\xi(t) = \xi_{\infty} + (\xi_0 - \xi_{\infty})\tanh\left(\frac{t - t_0}{\tau_{\text{relax}}}\right)] 理论依据2：界面传播的Fisher-Kolmogorov方程膜孔闭合可视为”孔边缘向内收缩”的界面传播问题，类似于：火焰锋面传播液滴蒸发域壁运动这些过程服从反应-扩散方程（Fisher-Kolmogorov或Allen-Cahn方程）： [\frac{\partial \phi}{\partial t} = D\nabla^2\phi + f(\phi)] 其中$\phi$是”孔开放”的序参量（类似于$s(t)$），$f(\phi)$是反应项（如$f = \phi(1-\phi)$）。行波解的形式：对于一维传播，方程存在行波解（traveling wave solution）： [\phi(x,t) = \phi(x - vt) = \frac{1}{2}\left[1 - \tanh\left(\frac{x - vt}{\lambda}\right)\right]] 其中$v$是波速，$\lambda$是界面宽度。对于固定位置观察（如孔中心），序参量随时间的变化正是$\tanh$形式。理论依据3：平均场近似下的Ising模型如果将膜孔视为二维Ising模型的自旋翻转过程（”孔”=自旋向下，”膜”=自旋向上），在平均场近似下： [\frac{\mathrm{d}m}{\mathrm{d}t} = -\frac{1}{\tau_0}[m - \tanh(\beta J m)]] 其中$m$是平均自旋，$J$是相互作用强度，$\beta = 1/(k_B T)$。当系统从亚稳态衰变到稳定态时，解具有$\tanh$形式。理论依据4：经验的唯象模型即使没有微观机制，$\tanh$函数在唯象学上也是描述渐进转换过程的最佳选择：优势： S型曲线：有明确的上下渐近线，符合”从开放到闭合”的物理约束中心对称：在转换点$\tau$处对称，反映转换过程的对称性平滑可导：无穷次可微，避免拟合中的数值问题参数意义明确： $A_2 = \tau$：50%转换点（孔寿命） $A_1$：转换时间尺度（斜率∝$1/A_1$） $A_0$：稳态背景与其他函数的对比：函数类型优点缺点 $\tanh$ 理论基础强，参数物理意义清晰需要非线性拟合 Logistic函数与$\tanh$等价，常用于生物学形式稍复杂指数衰减简单，线性拟合无上下界，不适合两态转换 Error function S型，数学常见缺乏动力学解释 Boltzmann函数常用于剂量-响应曲线与$\tanh$本质相同实际拟合效果从图2B可以看出： DMPC/DPPC/POPC/DOPC四种脂质的孔闭合动力学曲线均被$\tanh$函数完美拟合（深色曲线与浅色原始数据高度重合）垂直虚线标记的孔寿命$\tau$（即拐点）清晰可辨原始数据的涨落（浅色曲线的锯齿）反映了热涨落，但整体趋势严格遵循$\tanh$形式物理解释：为什么孔闭合遵循$\tanh$？关键机制：膜孔闭合是一个协同过程，不是单个脂质分子的独立运动：正反馈机制：孔变小 → 孔边缘曲率增大 → 脂质更容易向孔中心移动 → 孔更快闭合临界点行为：存在一个临界孔尺寸，小于该尺寸后闭合加速（类似于成核理论的临界核）集体松弛：整个孔边缘的脂质作为一个整体协同运动，而非逐个脂质跳跃这些特征导致了非线性、自加速的动力学，其解析解正是$\tanh$形式。扩展应用 $\tanh$拟合不仅适用于孔闭合，还可推广至：电穿孔孔扩展动力学：从小孔到大孔的转换相变过程：如脂质相从$L_\beta$到$L_\alpha$的转变蛋白插入膜过程：膜扰动的松弛囊泡融合：融合孔从形成到扩展的动力学文献支持类似的$\tanh$拟合在膜动力学研究中有广泛应用：电穿孔孔动力学：DeBruin & Krassowska (1999) Biophys. J. 使用$\tanh$描述电场诱导孔的开闭动力学 GUV相变：Cicuta et al. (2007) J. Phys. Chem. B 用$\tanh$拟合巨囊泡的相变界面传播蛋白聚集动力学：Ferrone (1999) Methods Enzymol. 在淀粉样蛋白纤维化中使用类似函数总结双曲正切拟合的理论基础： ✅ Langevin动力学：两态系统的非线性松弛 ✅ 反应-扩散方程：界面传播的行波解 ✅ 统计物理：平均场Ising模型的相变动力学 ✅ 唯象学：S型曲线是描述渐进转换的最自然选择实践价值：提取孔寿命$\tau$作为单一定量指标，便于比较不同体系参数$A_1$反映转换速率，可用于研究动力学机制拟合残差可识别非典型闭合事件（如重开、多步闭合） 3.3 Rapid方法的系统尺寸要求条带宽度：≥ 8 nm（确保膜边缘充分松弛）盒子z方向：≥ 2倍膜厚度（避免周期性影响）孔边缘间距：≥ 2 nm（防止两个边缘相互作用）窗口间距：0.03 nm（对于全原子），0.05 nm（对于粗粒化）四、CV的应用拓展 4.1 复杂体系的适用性 Q：这些CV能否应用于含抗菌肽或纳米粒子的复杂体系？ A：完全可以，这正是这些CV设计的一大优势。因为： CV定义仅依赖脂质尾部原子和几何参数，不对孔形成的诱导机制做任何假设抗菌肽或纳米粒子的存在会改变局部脂质排列，这会自然反映在$\text{CV}_{\text{cyl}}$的尾部密度变化中 PLUMED实现允许灵活选择要追踪的原子组，可轻松适配含外源物质的体系 Rapid方法可用于快速筛选不同肽/粒子浓度下的膜稳定性变化建议工作流程：先用Rapid方法快速评估线张力变化趋势，再用Full-Path方法详细解析孔形成机制应用场景示例抗菌肽研究：评估不同肽序列对膜稳定性的影响，优化肽浓度以达到最佳杀菌效果纳米药物载体：设计合适表面修饰的纳米粒子以控制膜孔形成速率电穿孔优化：通过改变脂质组成调控电场诱导孔的稳定性膜蛋白插入：研究大分子穿膜过程中的孔形成中间态返回主文：《破解膜孔之谜：双CV联手揭示从成核到扩展的完整能量图景》继续阅读：附录B：力场选择指南与实验对比

Specific Sytems · 2025-11-02

从序列到纳米结构：FibrilGen如何让肽自组装建模变得简单

从序列到纳米结构：FibrilGen如何让肽自组装建模变得简单本文信息标题: FibrilGen: A Python Package for Atomistic Modeling of Peptide β-Sheet Nanostructures 作者: Chao-Yu Yang, Aline F. Miller, Alberto Saiani, Richard A. Bryce 发表时间: 2025年9月26日接收单位: 曼彻斯特大学（英国）药学与视光学系、材料系、化学工程系引用格式: Yang, C.-Y., Miller, A. F., Saiani, A., & Bryce, R. A. (2025). FibrilGen: A Python Package for Atomistic Modeling of Peptide β-Sheet Nanostructures. Journal of Chemical Information and Modeling, https://doi.org/10.1021/acs.jcim.5c02108 源代码: https://github.com/ChaoYuYang0/FibrilGen-v0 摘要对于依赖肽一级序列理性设计的全新肽基纳米材料，系统性地计算建模由自组装肽形成的多样化、复杂的潜在纳米结构具有相当大的价值。本文介绍了FibrilGen，一个专门的Python工具包，能够在原子水平构建广泛的cross-β形态。FibrilGen通过一组输入的几何参数初始化肽堆积和纤维形态，随后通过精修步骤产生紧密的组装体。使用FibrilGen，研究人员可以生成各种组装的cross-β结构作为分子模拟的输入；该工具包还包括用于纤维纳米结构及其轨迹几何分析的功能。作者通过生成不同形态的cross-β纳米结构来展示该工具的实用性，这些结构与从冷冻电镜和固态核磁共振波谱确定的自组装排列高度吻合。这些结构在水溶液中的微秒级分子动力学模拟中也表现出构象稳定性。作者进一步评估了建模/模拟流程过滤非实验性β折叠纤维结构的能力。因此，FibrilGen工具包提供了一条构建各种可能形态的原子级超分子肽结构的途径，用于可视化、模拟以及相互作用和稳定性的评估。核心结论 FibrilGen是首个专门用于构建cross-β纳米纤维的原子级建模工具，支持杆状、带状、管状等多种形态工具包集成在PyMOL中，可通过7个几何参数控制纤维结构，并自动精修以消除空间冲突通过冷冻电镜验证，FibrilGen构建的HP8、AL1和Aβ42纤维结构与实验高度吻合微秒级分子动力学模拟证实FibrilGen生成的结构在水溶液中300 K下稳定工具能够识别并排除非实验性的纤维形态，为肽纳米材料的理性设计提供支持背景自组装肽纳米材料在过去二十年中引起了广泛关注。虽然最初主要研究其在阿尔茨海默病或帕金森病等疾病中的作用，但科学家们已经开始探索利用这些短天然分子的自组装特性来设计新型材料。在各种自组装肽中，β折叠形成肽在生物医学领域尤其受到青睐，因为它能够设计出生物相容性和剪切变稀的纤维水凝胶支架，在3D体外细胞和类器官培养、体内药物递送等应用中展现出巨大潜力。 cross-β结构的基本特征已为人所知：肽组装成单向的cross-β梯状结构，根据肽的相对取向可以是平行或反平行排列，片内主链肽间距为4.8-4.9 Å，并通过分子间氢键稳定。尽管在肽分子水平上组装相对简单，这些自组装肽可以形成具有多种形态的扩展超分子组装体，从细纤维到粗纤维、管状、带状和片状。图1：cross-β纤维的常见周期性构建块该图展示了β折叠双层（红框）作为cross-β纤维的周期性构建块：（a）12肽AL1（IGSNVVTWYQQL）形成6层堆叠的平行β折叠双层，组装成左手杆状形态；（b）AL1肽形成9层堆叠的平行β折叠双层，组装成左手杆状；（c）11肽（YTIAALLSPYS）形成平行β折叠，组装成左手管状；（d）8肽HP8（N端乙酰化、C端酰胺化的FKFEFKFE）形成平行或反平行β折叠，组装成左手管状。电子密度使用Chimera 1.17.3可视化。尽管使用冷冻电镜、X射线衍射和固态核磁共振等最先进技术在阐明这些结构的形态方面做了大量工作，但肽序列与最终超分子结构形态之间的关联仍然知之甚少。不仅最终自组装结构取决于肽序列本身，介质pH值和离子强度、溶剂极性和温度等环境因素也在决定最终超分子组装体的形态中起着关键作用。现有的软件包可以从实验中重建超分子组装体：例如RELION允许从冷冻电镜图像进行单颗粒分析以重建电子密度；ROSETTA提供刚体变换将分子组装成对称组装体以模拟NMR或冷冻电镜数据；PHENIX支持从X射线、中子衍射和冷冻电镜数据推断原子模型。对于不拟合实验约束的分子建模，有多种软件程序可用于将分子打包成特定的组装模式，如PACKMOL可以将分子组装成球体、椭圆体、圆柱体、平面或盒子；Polyply可以执行粗粒化珠子的自排除随机游走以生成聚合物构象；Nanomaterial Modeler包含一个晶胞库，可组装块状金属、矿物和碳质材料。虽然这些建模工具包对于构建分子组装体很有价值，但仍需要一个专门的工具来构建跨越广泛复杂实验观察形态的单向超分子cross-β排列。关键科学问题本文旨在解决的核心科学问题是：如何系统性地构建具有多样化形态的肽β折叠纳米纤维的原子级模型。尽管冷冻电镜和固态核磁共振等实验技术能够解析cross-β结构，但从肽序列到原子级三维纳米结构的建模过程仍然是一个挑战。现有的通用分子组装工具（如PACKMOL、Polyply）无法专门处理cross-β纤维独特的几何特征，包括： β折叠双层的特殊堆积方式（面对面或面对背）片内肽链的平行/反平行排列沿纤维长轴的螺旋扭曲从简单杆状到复杂管状、带状的形态变化这个问题之所以是研究焦点和难点，是因为：肽序列与最终纳米结构之间缺乏明确的构效关系，同时环境因素（pH、离子强度、温度）也会显著影响形态。一个能够快速生成、可视化和筛选不同形态的工具对于肽纳米材料的理性设计至关重要。创新点首个专门用于cross-β纤维建模的工具包：FibrilGen是为β折叠自组装肽纳米结构量身定制的，填补了通用分子组装工具的空白参数化建模方法：通过7个几何参数（$N, K, M, \theta_s, \theta_z, r_y, \theta_y$）系统性地控制纤维形态，涵盖杆状、带状、管状等多种结构自动结构精修：内置迭代算法自动调整螺旋扭曲参数，消除原子间空间冲突，确保生成紧密且物理合理的组装体与PyMOL无缝集成：可直接在PyMOL命令行调用，实现快速可视化和概念化完整的建模-模拟-验证流程：从初始结构生成到能量最小化、微秒级MD模拟，提供端到端的解决方案实验验证的可靠性：通过与HP8、AL1、Aβ42三个体系的冷冻电镜和固态NMR数据对比，证明了方法的准确性研究内容核心方法：FibrilGen建模流程 FibrilGen采用自底向上的层次化建模策略，将肽纳米纤维的构建分解为三个层次：单肽 → 2×2基本单元 → 完整纤维结构。图2：FibrilGen建模方案该图展示了FibrilGen中用户可控制的输入参数集合：（a）2×2单元的周期性基础和沿β折叠轴的重复数$N$；（b）2×2单元在纤维横截面上的堆积方式，使用矩阵$K$接触单元边缘，或使用重复数$M$和角度$\theta_s$接触单元角落；（c）绕β折叠轴的扭曲角$\theta_y$的符号、相对β折叠轴的倾斜角$\theta_z$（以及距β折叠轴的半径$r_y$）。用户可以指定堆积模式（通过$N, K, M, \theta_s$）和初始螺旋扭曲（通过$\theta_y, r_y, \theta_z$的符号），FibrilGen会精修螺旋扭曲并组装成紧密且无相交的纤维结构。 graph TD A["输入：单条肽链 β折叠构象"] --> B["pep2unit脚本 生成2×2基本单元"] B --> C["能量最小化 AMBER ff14SB力场 TIP3P水模型"] C --> D["提取中心单元 作为装配基块"] D --> E{"选择形态类型"} E -->|杆状/片状| F["线性堆积 参数N,K,θz,ry,θy"] E -->|带状/管状| G["旋转堆积 参数N,M,θs,θz,ry,θy"] F --> H["自动精修 迭代调整θz和ry 消除空间冲突"] G --> H H --> I["生成最终结构 PDB格式输出"] I --> J["PyMOL可视化 MD模拟验证"] style A fill:#e1f5ff style D fill:#fff4e1 style H fill:#ffe1e1 style I fill:#e1ffe1 2×2基本单元的构建 FibrilGen的核心概念是2×2肽单元，即4条肽链组成的基本构建块，包含两个β折叠形成双层结构。图3：2×2肽单元的组装给定一条输入肽如（a）Ac-FKFEFKFE-NH2，pep2unit脚本可将肽排列成两个β折叠（绿色、橙色），具有以下选项：（b）两个β折叠在xz平面上的片间排列（片间距用粉色标注）可以是（左）面对背或（右）面对面；（c）相邻β链的片内排列，沿x轴的配准（蓝色）和沿y轴4.8 Å的位移（紫色）；（d）反平行（标记为βa）和平行（标记为βp）β折叠的平行/反平行排列：两个反平行排列的βa（标记为βaaβa）、一个βp和一个βa反平行排列（标记为βpaβa）、两个反平行排列的βp（标记为βpaβp）、两个平行排列的βp（标记为βppβp）。此处以面对面排列的同向配准β折叠为例。 pep2unit脚本提供三个关键控制选项：片间排列：两个β折叠在xz平面上的相对位置面对背（face-to-back）：一个折叠的”面”朝向另一个的”背” 面对面（face-to-face）：两个折叠的疏水侧链相互接触片内排列：相邻β链在同一折叠内的配准方式同向配准（in-register）：相邻链的残基一一对应错位配准（out-of-register）：相邻链沿x轴有偏移平行性：β折叠的N端到C端方向平行β折叠：所有链方向一致反平行β折叠：相邻链方向相反对于侧链的χ1二面角，采用简单策略：初始化为80°（靠近N端）或160°（靠近C端）以最大化侧链间距离。随后通过能量最小化精修侧链堆积。图4：FibrilGen中的组装操作该图展示了组装操作：（a）4肽基本组装单元（表示为盒子）通过仿射变换组装成纳米纤维；（b）引入称为线性堆积的操作来接触盒子的面，使用$K$在纤维横截面上排列基本单元或使用$N$延伸纤维长度；（c）引入称为旋转堆积的操作来接触盒子的边，使用半径$r_s$、扭曲角$\theta_s$将单元绕纤维轴堆积$M$次；（d）引入称为扭曲的操作来调整沿纤维轴盒子的面接触，使用半径$r_y$、扭曲角$\theta_y$和倾斜角$\theta_z$绕纤维轴旋转。图5：FibrilGen中的基本形态模型该图展示了基本形态模型：（a）通过线性堆积和扭曲构建的杆状模型基础；（b）扩展盒子堆积产生杆状模型的示例；（c）通过旋转堆积和扭曲构建的带状模型基础；（d）扩展盒子堆积产生带状模型的示例。七个几何参数的定义表1：FibrilGen的7个几何参数参数描述杆状结构带状结构 $N$ 沿纤维长轴延伸的单元数量 ✓ ✓ $K$ 在纤维横截面上的堆积模式矩阵（线性堆积） ✓ ✗ $M$ 在纤维横截面上旋转堆积的单元数量 ✗ ✓ $\theta_s$ 旋转堆积的角度间隔（度） ✗ ✓ $\theta_z$ 倾斜角，使单元偏离纤维轴（度） ✓ ✓ $r_y$ 孔径半径，单元距纤维轴的位移（Å） ✓ ✓ $\theta_y$ 扭曲角，沿纤维轴旋转连续单元（度）符号：+1为左手性，-1为右手性 ✓ ✓ 螺旋扭曲的数学关系：为了保持相邻肽间的氢键距离，扭曲角 $\theta_y$、倾斜角 $\theta_z$ 和半径 $r_y$ 必须满足几何约束： [(b \cdot \cos\theta_z)^2 + \left(r_y \cdot \sqrt{2 - 2\cos\theta_y}\right)^2 = b^2] 其中，$b = 4.8$ Å是β折叠内相邻肽的间距常数。第一项是沿纤维长轴的投影距离平方，第二项是在横截面上旋转的弦长平方。自动结构精修算法 FibrilGen的精修过程基于三个条件：最小倾斜角：$\theta_z > \theta_{z,\min}$（默认1.14°），防止结构过于平坦无空间冲突：$0 < \theta_y < \theta_{y,\max}$，其中 $\theta_{y,\max}$ 通过逐步增加扭曲角直到出现原子间距小于阈值来确定适当的片间距离：相邻β折叠间的最近原子距离在2-5 Å之间迭代过程：对于杆状结构：从用户输入的 $\theta_z$ 开始，若不满足条件1和2，则以0.02 rad的步长逐步减小 $\theta_z$ 对于带状结构：同时调整 $\theta_z$（步长0.02 rad）和 $r_y$（添加≤1 Å的随机噪声），直到满足所有三个条件最大迭代次数默认为40次。该算法确保生成的结构既物理合理又几何紧凑。实验体系的重建与验证作者选择了三个形态差异显著的实验体系来验证FibrilGen的能力。体系一：HP8水凝胶管（10层β折叠）图6：冷冻电镜电子密度与FibrilGen构建的cross-β纳米结构原子级模型的整体形态对比该图展示了三个体系的冷冻电镜电子密度与FibrilGen构建模型的对比：（a）HP8水凝胶管——（左）电子密度EMD-23487，（右）FibrilGen模型结构；（b）AL1杆——（左）电子密度EMD-3128，（右）FibrilGen模型结构；（c）Aβ42杆——（左）电子密度EMD-3851，（右）FibrilGen模型结构。电子密度使用Chimera 1.17.3可视化，FibrilGen模型使用PyMOL可视化。建模过程：使用pep2unit生成平行+反平行面对面排列的2×2单元构建含10条肽/折叠的初步纤维（共100条肽）在显式水中能量最小化提取中心单元重新组装探索倾斜角范围：15°、20°、25°、30°、35° 精修结果：FibrilGen自动收敛到 $\theta_z = 25.0°$ 和 $\theta_y = 3.7°$，与实验值（30.0°和4.5°）吻合良好。体系二：AL1杆状纤维（12层β折叠） AL1肽（IGSNVVTWYQQL）形成12层平行β折叠的杆状结构，固态NMR确认平行排列。如图1b所示，冷冻电镜电子密度图（EMD-3128）与FibrilGen构建的192肽模型在整体形态和螺旋参数上高度吻合，冷冻电镜分辨率为8.3 Å。建模过程： pep2unit生成两个平行β折叠面对面排列的2×2单元探索倾斜角：3°、5°、7°、9°、10° 构建192肽的双折叠杆状结构精修结果：与HP8不同，AL1杆允许一系列螺旋扭曲，FibrilGen给出 $\theta_z = 11.0°$ 和 $\theta_y = 1.5°$，接近实验重建的12.2°和1.4°。体系三：Aβ42淀粉样杆（2层β折叠） Aβ42肽是阿尔茨海默病的标志性淀粉样蛋白，组装成双折叠杆状结构，冷冻电镜分辨率4.0 Å。如图1c所示，冷冻电镜电子密度图（EMD-3851）与FibrilGen构建的44肽模型高度一致。该体系展示了FibrilGen能够处理复杂含有多个转角的肽分子，并准确重建其纳米纤维结构。建模过程：直接使用冷冻电镜结构（PDB: 5OQV）中的2×2单元，不做能量最小化构建44肽的双折叠纤维探索倾斜角：3°、5°、7°、9°、10° 精修结果：扭曲参数收敛到 $\theta_z = 3.5°$ 和 $\theta_y = 1.0°$，与实验值4.5°和1.4°非常接近。三个体系的共同特点：FibrilGen模型在整体形态（管状、杆状）、螺旋参数（$\theta_z$、$\theta_y$）和骨架堆积方式上均与实验高度一致，证明了该方法的普适性。分子动力学模拟稳定性评估为了验证FibrilGen生成结构的动力学稳定性，作者对三个实验体系（HP8管、AL1杆、Aβ42杆）以及HP8的冷冻电镜结构进行了微秒级MD模拟。模拟参数：力场：AMBER ff14SB（肽）+ TIP3P（水）温度：300 K（Langevin恒温器，碰撞频率1 ps⁻¹）压强：1 bar（Berendsen控压器，弛豫时间2 ps）时间步长：4 fs（采用氢质量重分配HMR方法）时长：每个体系2条1 μs轨迹平衡策略：能量最小化升温至100 K（NVT，20 ps）升温至300 K（NPT，400 ps）短平衡（2 ns，平底谐振子约束相邻β链Cα距离在2-9 Å）生产模拟（1 μs，无约束）图7：300 K下1 μs MD模拟中的生成（重建）结构、平均骨架氢键数/链(Hbonds)和纤维半径$R_f$ 平衡前的结构为：（a）FibrilGen构建的HP8管、（d）冷冻电镜结构7LQI的HP8管、（g）FibrilGen构建的AL1杆、（j）FibrilGen构建的Aβ42杆。从MD副本（黄色、绿色）计算的氢键数/链（b, e, h, k）和纤维半径（c, f, I, l）分别列在第二行和第三行。还显示了从冷冻电镜结构7LQI计算的基线值（b,c,e,f中的蓝色）和冷冻电镜结构5OQV的基线值（k中的蓝色）。 HP8管的稳定性分析：指标 FibrilGen模型（平均±标准差）冷冻电镜结构（平均±标准差）实验值 Cα RMSD（Å） 2.8和3.3（相对初始） 1.7和2.0（相对初始） - 骨架氢键数/链 13.2 ± 0.3 13.1 ± 0.3 7.8（初始冷冻电镜）纤维半径Rf（Å） 28.3 ± 0.2 30.0 ± 0.5 30.0 x-配准tx（Å） 7.1 ± 0.3 7.0 ± 0.3 6.4 y-扭曲θd（°） 14.3 ± 2.1 19.1 ± 3.3 13.0 关键发现： FibrilGen模型和冷冻电镜结构在MD模拟中表现出相似的稳定性氢键数量（13.2 vs 13.1）几乎相同，且均高于初始冷冻电镜结构（7.8），说明MD优化了氢键网络纤维半径略有差异（28.3 Å vs 30.0 Å），可能源于不同的初始条件管状形态在微秒尺度上保持稳定，未发生坍塌或解离图8：300 K下副本微秒级MD模拟中肽链相对排列(x-配准$t_x$、y-扭曲角$\theta_d$)的时间序列该图展示了（黄色、绿色）双重轨迹的时间序列：（a-c）FibrilGen构建的HP8管；（d-f）冷冻电镜结构7LQI的HP8管；（g-i）FibrilGen构建的AL1杆；（j-l）FibrilGen构建的Aβ42杆。蓝色表示实验值。四个体系的局部坐标系用于定义$t_x$和$\theta_d$，分别显示在（a）、（d）、（g）、（j）中。基线肽排列从冷冻电镜结构7LQI计算得出（b,c,e,f中的蓝色）以及从冷冻电镜结构5OQV计算得出（k,l中的蓝色）。 AL1杆的稳定性分析：指标 FibrilGen模型（平均±标准差）实验观察 Cα RMSD（Å） 3.4（相对初始） - 骨架氢键数/链 14.4 ± 0.4 固态NMR确认平行排列纤维半径Rf（Å） 26.6 ± 0.0 冷冻电镜显示杆状形态 x-配准tx（Å） 0.0 ± 0.2 固态NMR示in-register排列 y-扭曲θd（°） 3.7 ± 1.0 固态NMR示左手扭曲关键发现： 12层杆状结构在微秒模拟中形态稳定 x-配准接近0（-0.0 ± 0.2 Å），与固态NMR确认的in-register排列一致左手扭曲角3.7°与实验推断的扭曲方向吻合 Aβ42杆的稳定性分析：指标 FibrilGen模型（平均±标准差）冷冻电镜结构（PDB 5OQV） Cα RMSD（Å） 2.4（相对FibrilGen初始）1.4（相对5OQV） 0.7（初始差异）骨架氢键数/链 56.1 ± 0.7 54.0 纤维半径Rf（Å） 15.7 ± 0.1 N/A x-配准tx（Å） -0.1 ± 0.3 0.2 y-扭曲θd（°） 7.0 ± 3.9 2.5 关键发现： Aβ42单体含5个转角，部分片内骨架氢键较弱氢键数（56.1）与冷冻电镜结构（54.0）接近 x-配准接近0，与固态NMR确认的in-register排列一致扭曲角7.0°与实验值（约3°）的差异可能源于Aβ42复杂的五圈拓扑稳定性总结：三个FibrilGen模型在300 K水溶液中经历微秒级模拟后，均保持了：形态完整性（管状、杆状）氢键网络稳定（每链13-56个骨架氢键）几何参数一致（纤维半径、肽链配准、扭曲角）这证明FibrilGen生成的原子级结构不仅几何合理，而且动力学稳定，可作为进一步研究的可靠起点。假设性结构的筛选能力为了评估FibrilGen/MD流程识别非实验性形态的能力，作者进行了”形态互换”实验：将HP8建模为杆状，将AL1建模为管状。 HP8杆的建模结果作者构建了两种电荷状态的HP8杆：带正电的HP8杆（所有谷氨酸质子化，pH 3）电中性的HP8杆（所有谷氨酸去质子化，pH 7）结果：带正电HP8杆：能量最小化成功，但在平衡阶段解离（图S5a）电中性HP8杆：平衡和生产模拟稳定，但收敛到交错排列（staggered arrangement）而非标准杆状表2：HP8杆与HP8管的结构参数对比结构 x-配准tx（Å） y-扭曲θd（°）纤维半径Rf（Å）氢键数/链 HP8管（实验） 7.1 ± 0.3 14.3 ± 2.1 28.3 ± 0.2 13.2 ± 0.3 HP8杆（中性） 0.0 ± 0.2 0.2 ± 2.2 25.7 ± 0.1 11.0 ± 0.6 HP8杆（带电）不稳定不稳定不稳定不稳定关键发现：电中性HP8杆的氢键数（11.0）显著少于HP8管（13.2），提示管状形态更稳定扭曲角接近0°（0.2°），形成扁平结构，与AL1杆的3.7°和HP8管的14.3°形成对比带电HP8杆的解离表明静电排斥阻止了杆状形态的稳定 AL1管的建模结果作者尝试用AL1肽构建类似HP8的管状结构：首先尝试组装平行+反平行混合的2×2单元（类似HP8管）→ 能量最小化失败（骨架氢键断裂，β折叠丧失）改用AL1杆的2×2单元尝试旋转堆积（M=2,3,4,5）→ FibrilGen无法找到无冲突的几何排列（图S6a）退而求其次，构建两层平行β折叠面对面排列的片状结构（图S6c）表3：AL1片与AL1杆的结构参数对比结构 x-配准tx（Å） y-扭曲θd（°）纤维半径Rf（Å）氢键数/链 AL1杆（实验） 0.0 ± 0.2 3.7 ± 1.0 26.6 ± 0.0 14.4 ± 0.4 AL1片（双层） 1.3 ± 0.3 0.6 ± 1.4 4.9 ± 0.0 13.6 ± 0.3 关键发现： AL1片的氢键数（13.6）略少于AL1杆（14.4），差异0.8个氢键/链扭曲角显著降低（0.6° vs 3.7°），片状结构几乎无扭曲管状形态在AL1体系中几何不可行，即使在宽松的FibrilGen条件下也无法生成筛选能力的总结 graph TD A["FibrilGen/MD筛选流程"] --> B{"能量最小化 2×2单元"} B -->|成功| C{"FibrilGen几何精修"} B -->|失败| F1["拒绝： AL1平行+反平行混合单元"] C -->|找到无冲突排列| D{"MD平衡"} C -->|无解| F2["拒绝： AL1管状M=2~5旋转堆积"] D -->|结构稳定| E{"生产模拟1μs"} D -->|解离/坍塌| F3["拒绝： 带电HP8杆"] E --> G{"结构分析"} G -->|氢键数高 扭曲角合理| H["可能的形态： HP8管,AL1杆,Aβ42杆"] G -->|氢键数低 扭曲角异常| I["不太可能的形态： 中性HP8杆,AL1片"] style F1 fill:#ffcccc style F2 fill:#ffcccc style F3 fill:#ffcccc style H fill:#ccffcc style I fill:#ffffcc FibrilGen/MD流程的三级筛选机制：第一级：2×2单元能量最小化排除骨架氢键无法形成的排列方式（如AL1的平行+反平行混合）第二级：FibrilGen几何精修排除存在严重空间冲突的堆积方式（如AL1的小半径管状结构）第三级：MD平衡与生产模拟排除静电不稳定的形态（如带电HP8杆）识别氢键较少、扭曲异常的次优形态（如中性HP8杆、AL1片）定量指标：氢键数差异：实验形态（13.2-14.4个/链）vs 非实验形态（11.0-13.6个/链）扭曲角差异：实验形态（3.7°-14.3°）vs 非实验形态（0.2°-0.6°）这些结果表明，FibrilGen/MD流程能够部分识别非实验性形态，尽管不是所有非实验形态都会被完全排除（如电中性HP8杆和AL1片仍能稳定），但它们在氢键数和扭曲角上的差异提供了定量的稳定性指标。 FibrilGen的扩展应用除了上述三个验证案例，FibrilGen还展示了构建多种形态的能力（详见支持信息图S10-S11），包括：扁平片状结构：$\theta_z$ 和 $\theta_y$ 接近0 细杆状纤维：小的 $K$ 矩阵（如2×2）+ 中等 $\theta_y$ 粗杆状纤维：大的 $K$ 矩阵（如3×4）+ 小 $\theta_y$ 紧密管状结构：小 $M$ 值（如 $M=4$）+ 大 $\theta_s$（如90°）宽松管状结构：大 $M$ 值（如 $M=10$）+ 小 $\theta_s$（如36°）左手/右手螺旋：通过 $\theta_y$ 的符号控制（+1左手，-1右手）结构分析工具 FibrilGen不仅能构建结构，还提供了轨迹分析功能：纤维长轴拟合：通过线性回归将肽中心质量投影到长轴（y轴），计算纤维半径Rf 肽链相对取向：定义局部坐标系ref-i-j-i来量化： x-配准（tx）：相邻肽沿x轴的位移，0表示in-register排列 y-扭曲（θd）：相邻肽在xz平面的扭曲角，$\theta_d = \arctan(d_z/d_x)$ 氢键分析：统计骨架氢键数（N-O距离<3.5 Å，角度>135°） RMSD计算：对齐后的Cα原子对距离均方根偏差这些分析工具在Supporting Information的analysis/文件夹中提供Python实现，可直接用于MD轨迹后处理。 Q&A Q1: FibrilGen如何处理不同肽序列的侧链多样性？ A1: FibrilGen采用两步策略：初始化阶段：对每个残基的χ1二面角使用简化规则（80°或160°），使同侧侧链Cβ间距最大化（7.3 Å）精修阶段：通过AMBER力场的能量最小化（在TIP3P水和离子存在下）优化侧链堆积，自动解决空间冲突。对于复杂侧链，用户可以手动调整特定χ1值，或集成构象搜索工具（如SCWRL）进一步优化。该方法在HP8（含芳香族Phe/Tyr）、AL1（含大侧链Trp/Gln）和Aβ42（含多种残基类型）上均表现良好。 Q2: 为什么AL1允许多种螺旋扭曲，而HP8和Aβ42收敛到单一扭曲？ A2: 这反映了不同体系的能量景观特征： AL1杆：12层平行β折叠的杆状结构具有较宽的能量阱，多种 $(\theta_z, \theta_y)$ 组合在FibrilGen的空间冲突筛选中都可行。例如 $(\theta_z=7°, \theta_y=1.0°)$ 和 $(\theta_z=11°, \theta_y=1.5°)$ 都不产生冲突。 HP8管：10层混合平行/反平行β折叠的管状结构具有更窄的能量阱，内壁和外壁的不同排列方式对几何参数更敏感，只有 $\theta_z≈25-30°$ 和 $\theta_y≈3-4°$ 能同时满足内外壁的氢键和侧链堆积要求。 Aβ42杆：双层结构且每个单体有5个转角，几何约束严格，导致参数空间窄。未来的自由能计算可以量化不同扭曲的相对稳定性。 Q3: FibrilGen/MD流程能否预测环境因素（如pH、离子强度）对形态的影响？ A3: 部分可以，但有局限性：已展示的能力：通过对比带电（pH 3）和中性（pH 7）HP8杆，流程成功预测带电HP8因静电排斥而解离，这与实验上HP8在pH 4形成管状而非杆状一致。局限性： FibrilGen本身是几何建模工具，不直接考虑pH或离子效应。这些需在MD模拟阶段通过质子化状态和离子浓度体现。微秒级MD可能不足以观察pH诱导的形态转变（需毫秒至秒尺度）。离子特异性效应（如Na+ vs Ca2+）需专门的离子参数和更长模拟。建议工作流程：对于环境敏感的体系，可以使用FibrilGen生成多种候选形态 → 用不同质子化状态/离子浓度进行短MD筛选 → 对稳定的形态进行长时间模拟。 Q4: 本文的氢键数指标（实验形态13-14个/链，非实验形态11-13个/链）能否作为普遍的稳定性判据？ A4: 谨慎使用，该指标有参考价值但非绝对：支持证据：三个实验体系均显示高氢键数（HP8管13.2，AL1杆14.4，Aβ42杆56.1），而非实验形态氢键数较低（HP8杆11.0，AL1片13.6）。局限性：序列依赖：Aβ42因含5个转角，部分骨架无法形成氢键，其”正常”氢键数就低于理想β折叠。形态依赖：管状结构的内外壁曲率可能影响氢键几何，不能直接与杆状比较。力场依赖：AMBER ff14SB的氢键参数可能与其他力场（如CHARMM36m）不同。建议用法：将氢键数与同序列、同形态的实验结构比较，而非跨体系比较。同时结合其他指标（RMSD、纤维半径、扭曲角）综合判断。 Q5: FibrilGen适用于哪些类型的肽体系，有何限制？ A5: 适用范围： ✓ β折叠形成肽：核心设计目标，支持平行/反平行、in-register/out-of-register ✓ 短肽至中等长度肽：验证的例子为8-12残基，理论上可扩展到20+残基 ✓ 单向纤维形态：杆、管、带、片（长轴为y轴） ✓ 同质组装：所有肽为相同序列限制： ✗ α螺旋或无规则卷曲肽：FibrilGen假设β折叠二级结构 ✗ 分支或网络结构：只支持单向延伸 ✗ 异质组装：需要不同序列的肽交替排列（但可通过手动修改PDB文件变通实现） ✗ 非肽组分：如脂质、DNA等，需与其他工具（如PACKMOL）结合使用正在开发的功能（根据代码结构推测）：支持侧链修饰（磷酸化、糖基化）的参数输入。关键结论与批判性总结潜在影响加速肽纳米材料的理性设计：FibrilGen/MD流程将构建-可视化-模拟的时间从周缩短到小时，研究人员可以快速探索序列-形态关系促进计算与实验的协同：工具生成的原子级模型可以直接与冷冻电镜密度、固态NMR约束比较，辅助实验数据解析推动超分子手性的研究：FibrilGen对左手/右手螺旋的参数化控制为研究侧链结构与超分子手性的关系提供了计算平台支持淀粉样蛋白的药物设计：Aβ42等疾病相关纤维的精确建模有助于设计β折叠破坏剂或稳定剂拓展到其他β折叠体系：方法原则上可应用于蜘蛛丝蛋白、真菌朊病毒等天然β折叠纳米材料局限性能量评估的不完整性：流程主要依赖空间冲突和MD稳定性，缺乏系统性的自由能计算来排序不同形态的热力学稳定性。未来可集成伞形采样或元动力学方法。时间尺度限制：微秒级MD虽能评估局部稳定性，但肽自组装的成核、生长和形态转变发生在毫秒至秒尺度，当前流程无法预测动力学路径。可能需要结合粗粒化模拟或机器学习势。环境因素的简化：虽然MD包含pH（通过质子化）和离子浓度，但溶剂极性、温度梯度、界面效应（如气-液界面）等复杂因素未充分考虑。假阳性风险：电中性HP8杆和AL1片虽然在MD中稳定，但实验未观察到。流程可能无法排除所有非实验形态，氢键数等指标需更多体系验证。人工干预需求：侧链χ1角初始化、能量最小化中的约束设置等步骤仍需用户经验，自动化程度有待提高。缺乏成核机制：FibrilGen从完整纤维结构入手，未涉及单体→寡聚体→纤维的早期组装阶段，这在实验上往往是形态决定的关键。未来研究方向多尺度建模整合：将FibrilGen与粗粒化方法（如Martini）结合，先用粗粒化快速探索组装路径，再用FibrilGen生成原子级结构进行精修机器学习辅助设计：训练神经网络从序列直接预测最优几何参数 $N, K, M, \theta_s, \theta_z, r_y, \theta_y$，减少人工试错自由能景观绘制：对关键体系（如HP8）系统性扫描 $\theta_z$-$\theta_y$ 空间，计算每个点的溶剂化自由能，绘制完整的形态相图异质组装体建模：扩展FibrilGen以支持A-B-A-B型交替序列或共组装体系（如肽-脂质混合纤维）实时冷冻电镜数据拟合：开发FibrilGen的反向建模模式，输入低分辨率电子密度，自动搜索最佳几何参数计算机辅助突变设计：结合FibrilGen和Rosetta的序列设计模块，预测哪些突变能稳定特定形态或改变手性

Specific Sytems · 2025-11-02

皮肤屏障的「水之道」：分子模拟揭示脂质相共存如何稳定间质水

皮肤屏障的“水之道”：分子模拟揭示脂质相共存如何稳定间质水本文信息标题: 脂质相的共存稳定了哺乳动物皮肤外层的间质水作者: Christopher M. MacDermaid, Kyle Wm. Hall, Russell H. DeVane, Michael L. Klein, and Giacomo Fiorin 发表时间: 2020年1月27日单位: 坦普尔大学，宝洁公司 (美国) 引用格式: MacDermaid, C. M., Hall, K. W., DeVane, R. H., Klein, M. L., & Fiorin, G. (2020). Coexistence of Lipid Phases Stabilizes Interstitial Water in the Outer Layer of Mammalian Skin. Biophysical Journal, 118(7), 1588–1601. https://doi.org/10.1016/j.bpj.2020.01.044 摘要哺乳动物皮肤最外层——角质层(SC)中的脂质基质，作为决定亲水性和亲脂性渗透途径的关键，已被多种生物物理技术研究。尽管对其微观结构的共识日益形成，但目前还没有一个分子分辨率的模型能同时解释所有化学物质的渗透性。本研究利用分子动力学(MD)模拟，对一种模型皮肤脂质混合物进行了自组装研究。我们发现，在较高湿度下，形成的层状相通过将多余的水分配到尺寸和空间分布受控的孤立水滴中来维持其稳定性。这些水滴可能融合在一起形成层内水通道，从而为亲水性物质的渗透提供一条路径。这些结果调和了关于皮肤外层结构的相互矛盾的数据，并拓宽了基于分子的方法在提高局部用药产品安全性和推进透皮给药方面的应用范围。核心结论皮肤角质层脂质在自组装过程中可以形成多种相共存的复杂结构，包括类似短周期相(SPP)的双层、类似长周期相(LPP)的厚层状结构以及反相胶束状的间质水滴。在较高湿度下，多余的水并不会破坏层状结构，而是被脂质头基包裹，在疏水核心中形成稳定、尺寸受控的纳米级水滴。这些孤立的水滴可以通过融合形成瞬时的水通道，这为亲水性大分子提供了一条此前未被充分认识的渗透路径，从而解释了为何其实测渗透率远高于理论预测值。模拟表明，形成水通道需要克服较高的能量势垒（约33-43 kcal/mol），这意味着在生理条件下它是一个稀有事件，但在外界因素（如促渗剂、超声波）的干预下可能被显著促进。背景皮肤作为我们身体的第一道防线，其核心屏障功能由最外层的角质层 (Stratum Corneum, SC) 承担。角质层的”砖墙-灰浆”结构中，由神经酰胺(CER)、胆固醇(CHOL)和游离脂肪酸(FFA)组成的脂质”灰浆”是阻止外界物质入侵和内部水分流失的关键。理解物质如何穿过这道屏障，对于透皮给药和化妆品安全评估至关重要。长期以来，一个巨大的谜团困扰着皮肤科学领域：为什么实验测得的某些亲水性大分子的皮肤渗透率，比基于均一脂质双层模型预测的理论值高出几个数量级？传统的模型认为，渗透主要通过脂质的疏水区域，这对亲水性物质极为不利。为了解释这一矛盾，科学家们提出了一个大胆的假设：在致密的脂质基质中，可能存在着某种亲水性孔道或水通道，为这些分子提供了”秘密通道”。然而，这种假设缺乏直接的分子级别的证据。这些通道是否存在？如果存在，它们是如何形成和维持的？它们的尺寸、分布和稳定性如何？这些问题都悬而未决。同时，实验观察到了皮肤脂质复杂的相行为，包括短周期相 (SPP) 和长周期相 (LPP) 的共存，甚至还有反相六方相和反相胶束相等非层状结构。如何将这些复杂的结构与亲水性渗透路径联系起来，是理解皮肤屏障功能的关键瓶颈。关键科学问题本研究旨在通过多尺度分子动力学模拟，从原子和近原子（粗粒化）层面回答以下核心问题：脂质相行为的复杂性：在模拟中，一个包含长链神经酰胺（特别是LPP形成所必需的CER[EOS]）的皮肤脂质混合物，在自组装过程中会形成什么样的稳定或亚稳态结构？它能否同时再现SPP和LPP的特征？水的角色与定位：当系统暴露于较高湿度环境时，多余的水分子是如何被容纳在高度疏水的脂质基质中的？它们是均匀分散，还是会自发聚集形成特定的结构？ “水通道”的形成机制：传说中的“亲水性渗透路径”在分子层面上的真实面貌是什么？它们是预先存在的静态孔道，还是动态形成的瞬时结构？其形成的热力学和动力学过程是怎样的？结构与功能的统一：能否构建一个统一的模型，既能解释亲脂性小分子通过有序脂质区域的渗透（溶解-扩散机制），又能解释亲水性大分子通过某种特殊路径的高效渗透？创新点首次模拟了间质水滴的自发形成：通过长时间的粗粒化MD模拟，首次在分子层面上展示了在皮肤脂质层状结构内部，多余的水分子会自发聚集，形成由脂质头基包裹的、稳定的反相胶束状水滴。统一了两种渗透路径：提出了一个优雅的统一模型，即皮肤屏障是一个多相共存体系。致密有序的层状区域（SPP和LPP）构成了对亲脂性分子的主要屏障，而其中嵌入的亚稳态间质水滴/水通道则为亲水性分子提供了渗透路径。定量分析了水通道的形成能垒：通过理论模型和模拟数据，定量估算了水滴拉伸融合形成水通道所需的自由能（约33-43 kcal/mol），解释了为什么这种通道在生理条件下是稀有事件，但可能被促渗剂等外部手段触发。多尺度模拟的成功应用：巧妙地结合了粗粒化模拟（用于观察微秒级的自组装和相行为等大尺度现象）和全原子模拟（用于精确计算渗透能垒和验证局部结构），展示了多尺度方法在解决复杂生物物理问题中的强大威力。研究内容方法详述本研究采用了一种多尺度的计算策略，以在不同的时间和空间尺度上捕捉皮肤脂质的复杂行为。力场选择的深层考量粗粒化(CG)模拟：软件与力场：使用 LAMMPS 软件，力场参数基于 SDK模型 (Shinoda-DeVane-Klein模型)。这个模型的核心思想是将3-4个重原子合并为一个”珠子(bead)”，大幅减少计算量。时间尺度优势：CG模拟能够达到微秒甚至几十微秒的时间尺度，这对于观察脂质自组装、相分离等慢过程至关重要。相比之下，全原子模拟通常只能达到纳秒到几微秒。关键限制：CG水模型缺少偶极矩，这意味着它不能准确描述氢键网络和电荷相互作用。因此，所有CG模拟仅适用于低pH条件（FFA完全质子化，不带电荷）。这是一个重要的简化假设。力场参数化：SI中详细说明了酰胺基团和质子化羧基的参数是如何从实验液体性质（如密度、汽化热）推导出来的，确保了模型的物理准确性。全原子(AA)模拟：软件与力场：使用 NAMD 软件，力场为生物膜研究的金标准 CHARMM36 (用于脂质)和 CGENFF (用于小分子)，水模型为经典的 TIP3P。精度优势：AA模拟提供了最高的分子细节，能够准确计算氢键、静电相互作用等精细效应，这对于计算渗透自由能至关重要。互补验证：作者在AA和CG两个层次上都模拟了相同的双层膜体系，发现两者的膜厚度、脂质分布等关键性质高度一致（图S2-S5），这验证了CG模型的可靠性。模拟体系的生理相关性脂质组成：四组分混合物：摩尔比为 1:1:2:2 的 CER[NS]/CER[EOS]/CHOL/FFA。这个比例是基于实验测得的人类角质层脂质组成的简化模型。为什么选择CER[EOS]？CER[EOS]是一种超长链神经酰胺（C30饱和链+C18不饱和亚油酸链），它对于形成 LPP (13 nm厚的长周期相)至关重要。实验表明，缺少CER[EOS]的混合物很难形成LPP。 FFA的代表性：山萮酸(C22:0)的链长恰好位于SC中FFA链长分布的峰值，是一个合理的”平均”代表。简化的代价：真实SC含有上百种不同的脂质，本研究的四组分模型忽略了这种化学复杂性，这可能影响对水滴形成和稳定性的精细调控。初始构象的无偏性： CG自组装的哲学：CG模拟从完全随机混合开始（脂质和水分子在空间中随机分布），让系统在力的驱动下自发组装。这避免了人为预设结构可能带来的偏见，确保最终结构是热力学驱动的结果。 AA模拟的务实选择：由于AA模拟的时间尺度限制，从随机构象自组装成双层膜需要过长的时间。因此，AA模拟从预先构建的、已经平衡的双层膜开始，这是一个务实的折中。关键分析技术的原理自组装模拟：时间尺度：CG模拟持续 5-25 微秒。为什么需要这么长？因为脂质分子的扩散、翻转、相分离等过程都是缓慢的，需要足够长的时间才能达到平衡或亚稳态。观察目标：不仅观察最终的宏观结构（如层状、六方相、反相胶束），还追踪形成过程中的动力学细节（如水滴的成核与生长，图3E）。渗透性计算 (PMF)： ABF方法：PMF描述的是小分子在膜中不同位置的自由能。作者使用自适应偏置力 (ABF)方法，通过实时施加一个抵消系统内力的偏置力，使小分子能够更高效地在膜中”自由”移动，大幅加速采样。窗口采样：将膜的厚度方向（z轴，约4 nm）划分成40个重叠的窗口，每个窗口宽0.4 nm。这种重叠设计确保了在拼接各窗口数据时的平滑过渡。ABF的优势在于无需事先知道自由能曲面的形状，且让分子在窗口内自由扩散而非被约束在某个点附近。从PMF到渗透系数：PMF的峰值对应渗透能垒，扩散系数描述分子在膜中的移动速度。结合两者，通过公式(1)计算出渗透系数 $k_P$，可以直接与实验测量的皮肤渗透率对比。水滴/水通道的识别：聚类分析原理：对轨迹中的每一帧，计算所有水分子（或CG水珠）之间的距离。如果两个水分子距离小于阈值（CG为0.66 nm，AA为0.35 nm，这些阈值来自水的径向分布函数的第一个极小值），它们就被标记为”相邻”，属于同一个簇。水滴的定义：含有10个以上CG水珠（即30个以上水分子）的簇被定义为”水滴”。小于这个阈值的簇被认为是”自由”水或瞬时涨落，不算稳定的水滴。动态追踪：通过比较连续帧中水分子的簇归属，可以追踪水分子在水滴、水层和自由态之间的交换事件，这揭示了水滴的动态稳定性（表4、表5）。结果与分析 1. SPP双层模型：有序与无序的界面首先，作者构建并模拟了一个简化的SPP模型，该模型由CER[EOS], CER[NS], 胆固醇和FFA组成。图1：皮肤脂质模型双层的结构与渗透性。 (A-D) 全原子模拟快照，分别展示了四种主要脂质成分：CER[EOS] (灰色)、CER[NS] (蓝色)、胆固醇 (粉色) 和山萮酸 (青色)，氢原子已隐藏；每个子图右侧显示单个分子的结构及其粗粒化表示示意图。(E) 双层膜的电子密度分布（黑线）和末端甲基的密度分布（蓝线），橙色线标记有序-无序区域的边界位置。(F) 计算得到的皮肤渗透系数 kP（蓝色菱形）与 Potts-Guy 经验公式估计值（红色圆圈）对实验值的对比；方块标记为甘露醇的数据。log(kP) 的均方根误差分别为 0.73（计算值）和 0.72（经验值）。双层膜的”三明治”结构结构特征：长时间的全原子模拟（1.5 μs）揭示了一个令人惊讶的非均质结构：外层（固态有序区）：两侧是高度有序的”固态”外层（类似于凝胶相脂质），主要由CER和FFA的饱和碳链构成。这些长链像紧密排列的”栅栏”，链间的范德华力极强，侧向扩散缓慢（<0.2 nm²/μs）。核心（液态无序区）：膜中心是一个流动性很强的”液态”无序核心（类似于液晶相），主要由CER[EOS]的不饱和亚油酸尾链（C18:2）和少量胆固醇组成。不饱和双键导致链扭结，无法紧密排列，形成高度流动的区域。关键界面：有序-无序的界面位于距离膜中心约1.25 nm处（由电子密度曲线的拐点定义，图1E）。这个位置恰好对应饱和链末端甲基的分布峰。为什么会形成这种结构？这源于CER[EOS]的独特化学结构：它的C30饱和链很长，倾向于伸展并参与外层的有序排列；但它的C18不饱和亚油酸链（通过酯键连接）则”讨厌”有序环境，倾向于卷曲在膜中心。这种分子内的”矛盾”创造了宏观上的相分离。小编锐评：有CER[EOS]是不是就不能用SPP了。。渗透能垒的真正位置亲脂性渗透的精确预测：计算方法：作者计算了8种亲脂性小分子（辛醇-水分配系数 $K_{ow}$ 从0.2到5000）的PMF曲线（图S8）。每个分子都显示出单一的自由能峰，位于z ≈ 1.25 nm，恰好对应有序-无序界面。能垒的物理意义：小分子要从水相进入膜，首先遇到的是外层有序区，这里链紧密排列，小分子很容易”溶解”进去（PMF下降）。但当它试图进入中心无序区时，需要拨开周围紧密排列的饱和链，这需要克服熵力能垒——这就是主要的渗透障碍。扩散系数的位置依赖性：作者测量了5种亲脂性小分子在膜中不同位置的局部扩散系数 $D(z)$（图S8）。虽然 $D(z)$ 在膜中略有下降（水层中为1-3 nm²/ns，膜中心降至0.7-1.4 nm²/ns），但变化幅度远小于PMF的变化（几个 $k_BT$）。这说明能垒主要是热力学 (熵)效应，而非动力学 (扩散)限制。更重要的是，扩散系数与分子量的关系符合经典的Potts-Guy经验公式（$\log D = A - 0.0061 \times \mathrm{MW}$），验证了本文简化渗透模型的合理性。与实验的惊人一致：通过拟合公式(2)，计算的渗透系数与人体皮肤实验值的相关系数 $r^2 = 0.89$（图1F）。这证实了SPP模型+有序-无序界面确实能够定量描述亲脂性分子的渗透。甘露醇悖论：巨大的偏差：对于强亲水性分子甘露醇，模型预测的渗透系数为 $1.6 \times 10^{-7}$ cm/h，而实验值为 $3.7 \times 10^{-5}$ cm/h——低估了230倍！不是模型失败，而是路径不同：这个偏差与其他基于均质脂质双层的计算结果一致。它强烈暗示：亲水性分子根本不走脂质双层这条路，而是利用某种我们尚未在模型中捕捉到的”秘密通道”。这为后续发现间质水滴/水通道埋下了伏笔。 2. 加热诱导的相变：水滴与水通道的雏形实验设计的巧思为了加速结构转变并探索亚稳态结构，作者设计了一项巧妙的”加热-退火“全原子模拟，模拟了实验室制备皮肤脂质样品的常用热处理过程：初始结构：构建了一个由四层水合双层膜堆叠而成的大体系（16×16×32 nm³或24×24×32 nm³），代表了高度有序的多层层状相（图2A）。加热阶段：将系统加热至95℃并维持0.25 μs。为什么是95℃？这个温度远高于大多数神经酰胺的熔点（约60-85℃），足以打破脂质链间的范德华力，使分子获得足够的动能进行大尺度重排。为什么用全原子？虽然CG模拟更快，但作者希望保留氢键等精细相互作用，以准确捕捉水分子在脂质重排过程中的行为。退火阶段：迅速冷却回30℃（生理温度）并弛豫1.8 μs，观察系统会”冻结”在什么样的亚稳态结构中。半融合：膜融合的”半成品” 图2：经受加热的皮肤脂质双层达到半融合状态，间质水被限制在水滴或通道中。 (A) 初始多层堆叠结构。(B) 5:1水/脂比的系统在退火后形成包含连续水通道的半融合结构。(C) 2:1水/脂比的系统则形成包含孤立水滴的结构。(D) 水滴和通道的空间分布。什么是半融合？半融合 (hemifusion) 是膜融合过程的中间态：相邻双层膜的外层发生融合，形成了连续的脂质单层；但内层仍然保持独立 (图2B-C)。这是膜融合研究中的经典结构，常见于病毒入侵等过程。半融合的形成机制：加热使脂质链”熔化”，膜变得柔软且易弯曲。相邻双层膜在热涨落驱动下在多个位置发生局部接触。接触点处的外层脂质”流”到一起，形成半融合区域。 SI图S10-S12的时间演化显示，去质子化的FFA (COO⁻) 通过 Na⁺ 离子桥接，显著促进了膜间粘附。这揭示了一个重要机制：pH和离子强度可以调控皮肤屏障的相行为。水的命运：含水量决定结构高含水量 (5:1水/脂比)：水形成了连续的通道 (图2B)。物理图像：半融合区域形成了类似”反相六方相”的结构，其中脂质头基朝内排列，形成管状通道，水在管中流动。这是稳定的吗？由于水含量过高，这种结构在生理条件下可能不稳定，但它证明了皮肤脂质有形成水通道的内在倾向。生理含水量 (2:1水/脂比)：水被包裹在脂质核心中，形成了孤立的水滴 (图2C-D)。关键发现：原本位于双层之间的界面水层在半融合过程中被”挤压”和重新分配。一部分水被”困”在脂质核心中，被脂质头基包裹，形成反相胶束状水滴。水滴的形态：图2D显示，这些水滴呈球形，直径约1-2 nm，散布在脂质基质中。它们的大小和分布与后续自组装模拟的结果高度一致（图3）。启示：任何能够引起膜局部结构剧烈重排的事件（热、机械应力、化学物质）都有可能将界面水”包裹”到疏水核心中，从而创造出亲水性渗透路径的雏形。这为理解超声波、微针等物理促渗方法提供了分子机制。 3. 自组装模拟：LPP厚度与间质水滴的自发形成模拟策略：从混沌到有序为了探索更接近真实LPP的结构，作者设计了长时间的CG自组装模拟。关键的创新在于初始构象的选择：三明治起始结构：顶部和底部各有一个预组装的脂质单层（头基朝外），中间夹着 15 nm 厚的完全随机混合的脂质和水（图3A，视频S1）。设计意图：预组装的单层作为模板，模拟真实SC中角质细胞表面结合的脂质层，引导中心区域的脂质向其靠拢。中心的随机区域让系统有充分的自由度去探索不同的相结构（层状、六方、胶束等）。水缓冲层（外侧）允许体系在各向异性压力耦合下自由调整形状，避免周期性边界条件的人为限制。两个对照实验：脱水模型（模拟III）：对中心±6 nm范围内的水分子施加排斥势，阻止水进入脂质核心，模拟低湿度条件。水合模型（模拟I、II）：允许水自由扩散，模拟正常生理湿度。小编锐评：这个就算是强行给里面塞水呗，但不知道真实形成的能垒如何水的存在改变了一切图3：自组装的~13 nm层状结构，包含或不含间质水滴。 (A) 初始随机构象。(B) “脱水”模型最终形成的均一厚度的层状结构。(C) “水合”模型形成的厚度不均的层状结构。(D) (C)中水滴的放大图。(E) 水滴数量和半径随时间的演化。(F, G) 两次独立模拟中水滴的最终平面分布。(H) 由多个单元复制得到的多层结构。脱水模型的结果（图3B）：脂质在0.5-2 μs内逐渐从中心迁移到表面，厚度从15 nm收缩到 13 nm，恰好与实验测得的LPP厚度一致。最终形成的是均一、对称的层状结构，脂质头基集中在±6 nm处（图4，虚线）。这是理想的LPP吗？厚度对了，但内部结构过于简单——缺少实验观察到的±2 nm处的内层头基峰。水合模型的惊人发现（图3C-D）：最终结构呈现厚度不均：厚区约11 nm，薄区约6 nm（类似SPP）。关键观察：在厚区内部，水分子自发聚集形成了 20个左右的球形水滴（图3D），直径约2.6 nm（半径1.3 nm）。水滴的本质：这些不是随机涨落，而是反相胶束——脂质头基朝内，包裹着水核，疏水尾链朝外，与周围的有序脂质链接触（图5A）。水滴形成的动力学：成核、生长与平衡成核与生长过程（图3E）： 0-0.5微秒（成核期）：水滴数量快速增加，从0增至约20个。机制是经典的成核与生长：随机分布的水分子通过扩散相遇，形成小簇（”核”），小簇继续捕获附近的水分子而长大。 0.5-5微秒（平衡期）：水滴数量基本稳定，半径逐渐收敛到 1.3 nm。这表明系统已经达到了一个亚稳态平衡。普适性验证：SI中三组不同条件的模拟（2:1水/脂AA、5:1水/脂AA、10:1水/脂CG）的水滴尺寸分布峰值都在1.3 nm（图S19），证明这个尺寸不是偶然，而是由热力学稳定性决定的普适特征。水滴的空间分布（图3F-G）：准六方格子：两次独立模拟中，水滴在层状平面上的分布都呈现局部的六方堆积，但缺乏长程有序。滴间距离：相邻水滴间隔约3-5 nm，恰好是一个SPP双层膜的厚度。这意味着水滴之间被薄的脂质壁分隔，这些壁与SPP的结构类似。脂质分布的秘密图4：13 nm层状结构中各种脂质的分布。横坐标”Lamellar normal”是垂直于层状平面的坐标，0点代表层状结构的中心。曲线显示四种脂质（A: CER[EOS], B: CER[NS], C: 胆固醇, D: 山萮酸）的头基数量密度在”脱水”（虚线）和”水合”（点线）模型中的分布。外层峰 (±6 nm)：两个模型都有，对应外层脂质的头基。内层峰 (-2到+2 nm)：只有水合模型有！这些是包裹水滴的脂质头基。物理意义：水滴的存在迫使脂质头基向内弯曲，形成了一个全新的脂质-水界面。这正是反相胶束的特征。与LPP的联系：实验的中子衍射数据也显示±2 nm处有头基分布峰（虽然强度较弱）。本研究首次在分子层面揭示：这些内层峰可能来自包裹间质水滴的脂质头基！脂质的选择性富集： FFA富集在中心 (图4D)：它的单链结构和小头基使其更适合形成反相结构。胆固醇略富集在距中心约4 nm处 (图4C)：位于外层有序区和内层无序水滴区的交界处，可能起”缓冲”作用。神经酰胺主导外层 (图4A-B)：它们的大头基和双链结构更适合形成平坦的双层。 4. 水滴的稳定性与形成通道的能量学理论模型：界面张力 vs 弯曲弹性这些在CG模拟中发现的水滴是否真的稳定？为什么半径总是收敛到1.3 nm？作者构建了一个精巧的连续介质力学模型，将复杂的分子相互作用简化为两个宏观参数：自由能公式（Helfrich模型）： [F(S) = \int_S \left[ \gamma + \frac{K_c}{2}(c - c_0)^2 \right] \mathrm{d}A_S] 界面张力 $\gamma$：水-脂界面的表面能，类似于水滴在空气中的表面张力。作者使用 1-辛醇/水界面张力 γ ≈ 8.5 mN/m 作为估计（因为脂质尾链的疏水性与长链醇类似）。每增加1 nm²的水-脂界面，系统就要”付出”约8.5×10⁻²¹ J（约5 kcal/mol）的能量代价。这个项驱使水滴尽可能小以减少表面积。弯曲模量 $K_c$：脂质层抵抗弯曲的能力。通过计算SPP双层膜的面积压缩模量 ($K_A$ = 273±35 mN/m)，再用聚合物刷模型估算出 $K_c$ = 9.5±1.2 kcal/mol。这个项惩罚过度弯曲，驱使水滴朝着某个”舒适”的曲率半径（即自发曲率半径 $r_0$）生长。自发曲率 $c_0$：脂质”喜欢”的曲率。作者根据之前从皮肤渗透实验数据反推的水通道半径分布（峰值2.7 nm），取 $r_0$ = 2.7 nm。图5：水滴在层状核心中是亚稳态的。 (A, B) CG和AA模拟快照。(C) 不同模型计算的膜厚度。(D) 水滴能量随半径变化的理论曲线。(E) 大水滴收缩速率与能量梯度的关系。(F) 水滴变形为圆柱形（通道）的能量图。 1.3 nm：热力学稳定性的”甜蜜点” 能量曲线 (图5D)：对于球形水滴，$F(r)$ 在 $r^*$ = 1.3 nm 处有一个局部极小值（亚稳态）。物理解释：在小于1.3 nm时，界面张力占主导，水滴倾向于”长大”以降低单位水分子的表面能；在大于1.3 nm时，弯曲能惩罚变强（曲率偏离 $c_0$ 太多），水滴倾向于”缩小”。两者的平衡点就是1.3 nm。与模拟的完美契合：这个理论预测值与CG自组装、AA加热退火、以及多个独立CG运行的水滴半径观测值完全一致 (图5C)。动力学验证：大水滴会缩小 (图5E) 作者人为构建了含有更大水滴的体系（半径1.4-2.0 nm），然后模拟它们的演化。观察：所有大于1.3 nm的水滴都自发收缩，收缩速率 ($\mathrm{d}r/\mathrm{d}t$) 与理论能量梯度 ($\mathrm{d}F/\mathrm{d}r$) 成线性关系 (图5E)。时间尺度：收缩的时间常数为75-100 μs——这比水分子在水滴和水层间的交换时间（约1 ns）慢了75000倍！律速步骤（Rate-limiting step）：不是水分子的扩散，而是包裹水滴的脂质头基的重排。脂质分子要”松开手”，让水滴缩小，需要克服分子间的氢键和范德华力，这是一个缓慢的过程。这再次证明水滴是被脂质骨架稳定的结构，而非简单的水团聚集。通道形成：可能，但稀有圆柱形通道的能量图 (图5F)：作者计算了水滴拉伸成圆柱形”胶囊”（半径 $r$，长度 $L$）的自由能 $F(r, L)$。关键发现：要让一个半径1.3 nm的水滴拉伸成长度6 nm的通道（足以连接相邻水滴），需要克服 33-43 kcal/mol 的能量势垒（蓝色区域）。如果允许体积变化（即从外部水层”吸”更多水进来），能垒降至 33 kcal/mol；如果体积固定（恒定水滴大小），能垒为 43 kcal/mol。这个能垒有多高？在室温下（30°C），热涨落的典型能量是 $k_BT$ ≈ 0.6 kcal/mol。要靠纯热涨落越过33 kcal/mol的能垒，概率为 $\exp(-33/0.6)$ ≈ $10^{-24}$——几乎不可能。这解释了为什么在平衡态下，模拟中观察到的都是孤立水滴，而非连续通道。但并非不可逾越：促渗剂的作用：乙醇、油酸等促渗剂能够降低界面张力或改变弯曲模量，从而降低能垒。例如，若 γ 降低30%，能垒可能降至20 kcal/mol，使通道形成概率提高约 $10^7$ 倍。机械力的助力：超声波（频率20 kHz，周期50 μs）的振动周期与水滴-水滴水交换时间（40 μs，表5）相当。振动可以通过周期性压缩脂质层，反复将水滴推近，增加融合概率。根据原文估算，超声波提供的能量密度（>3 J/cm²）远超单个水滴通道化所需能量（约 $10^{-4}$ J/cm²），足以促成大量通道形成。层间相互作用：水滴融合的另一途径图6：脂质层状结构的相对运动促进水滴融合。当模拟一个包含两层、布满水滴的层状结构时，层间的相对滑动会压缩水滴的分布空间，导致一些小水滴融合形成更大的水滴。SI中的3D反相胶束相演化显示，在不到10 μs内，初始的8个孤立水滴中有6个融合成片层状域。实验设计：复制图3的单层模拟快照两次，堆叠成两层，观察多层系统中的水滴动力学（模拟VI）。观察：层间相对滑动压缩了水滴的二维分布空间，使原本分散的水滴被”挤到一起”。 1 μs内，水层厚度趋于均匀化（适应不规则的脂质表面波动）。 5 μs后，水滴数量从初始的38个减少到30个，中位半径仍稳定在1.3 nm (图6C)。融合机制：当两个水滴被挤到距离 <1 nm 时，它们之间的薄脂质壁被”挤破”，水滴合并。合并后的大水滴随后通过释放水分子（到外层或其他水滴）缓慢收缩回1.3 nm。生理意义：真实SC中，角质细胞表面的起伏、外界机械应力（如皮肤拉伸）都可能导致层间相对运动，从而动态地促进水滴融合和通道形成。这提供了一个不依赖促渗剂的、内源性的亲水渗透路径调节机制。 5. 多相共存模型：统一的屏障功能图景图7：皮肤脂质基质中不同相结构的示意图。 (A) 层状-SPP（双层）：致密有序的双层膜结构，主要由饱和链脂质构成。(B) 层状/反相六方相（通道）：在高水合条件下形成的连续水通道，脂质头基朝内排列。(C) 层状/反相胶束相（水滴）：在生理水合条件下形成的孤立水滴，被脂质头基包裹在疏水核心中。(D) 层状（无序核心）：含有流动性强的液晶相核心的双层结构。(E) 层状-LPP（有序核心）：厚层状结构，具有更有序的核心区域。本研究的核心贡献在于揭示了皮肤脂质基质并非单一均质的疏水屏障，而是多种相结构动态共存的复杂体系：主体结构：致密的层状相（SPP和LPP）提供了对亲脂性分子的主要屏障功能。亲水缺陷：在层状基质中镶嵌的间质水滴和瞬时水通道为亲水性分子提供了替代渗透路径。动态平衡：这些结构并非静态，而是在热力学驱动下不断调整，响应环境湿度、温度和外部干预（如促渗剂）的变化。这一统一模型首次在分子层面解释了为何亲水性大分子的实测渗透率远高于基于均质脂质双层模型的预测值，为理解皮肤屏障功能和开发透皮给药策略提供了坚实的理论基础。 Q&A Q1: 这项研究提出的“间质水滴”模型，与之前关于皮肤屏障的“砖墙-灰浆”模型是什么关系？ A1: 这个模型不是要推翻“砖墙-灰浆”模型，而是对其核心——“灰浆”（脂质基质）——进行了前所未有的精细化描绘。传统模型：将脂质“灰浆”视为一个均一的、连续的疏水层。本文模型：揭示了“灰浆”本身是非均一的、多相共存的。它主体上是一个致密的疏水屏障（层状脂质），但内部镶嵌着离散的、亚稳态的亲水性“微缺陷”（即间质水滴）。这个模型更动态，也更真实地反映了皮肤作为一种生物材料，需要在提供屏障功能的同时，保持一定的可塑性和对环境（如湿度）的响应能力。 Q2: 为什么粗粒化(CG)模拟能够观察到自组装和水滴形成，而全原子(AA)模拟不能？ A2: 关键在于时间尺度和计算成本。 CG模拟：通过简化原子表示（多个原子合成一个“珠子”），大大减少了计算量，使得模拟可以达到微秒(µs)甚至更长的时间尺度。脂质的自组装、相分离和水滴的成核与生长，这些都是缓慢的、需要大范围分子重排的过程，只有在微秒级的时间尺度上才能充分发生。 AA模拟：提供了最高的精度，但计算成本极其高昂，通常只能模拟纳秒(ns)到几微秒的尺度。在这个时间尺度上，系统往往来不及发生大规模的自组装，只能观察到基于初始构象的局部弛豫和性质。因此，本文巧妙地使用CG模拟来探索宏观的相行为，然后用AA模拟来精确计算特定构象下的物理性质（如渗透能垒）。 Q3: 文中提到加热模拟导致了“半融合(hemifusion)”，这个过程对于理解水通道的形成有什么启示？ A3: “半融合”是指两个相邻的脂质双层膜的外层发生融合，而内层仍然保持独立。在这个过程中，原本分隔两个双层的水层被“挤压”和重新分配。模拟显示，这些被挤压的水在脂质核心中形成了通道或水滴。这提供了一个重要的启示：任何能够引起膜局部结构剧烈重排的事件（无论是热、机械应力还是化学物质），都有可能将界面水“包裹”到疏水核心中，从而创造出亲水性路径的雏形。这为理解超声波、微针等物理促渗方法为何能增强亲水性药物渗透提供了可能的分子机制。关键结论与批判性总结潜在影响统一了皮肤渗透理论：首次提出了一个能够同时解释亲脂性和亲水性物质渗透路径的统一分子模型，解决了长期以来理论预测与实验观察之间的矛盾。为药物递送提供新靶点：揭示了间质水滴/水通道是亲水性大分子药物渗透的潜在”高速公路”。这意味着，未来开发新型透皮促渗剂的策略可以从”破坏整个屏障”转向特异性地稳定或诱导这些水通道的形成，从而实现更高效、更安全的药物递送。推动了计算皮肤科学的发展：展示了多尺度模拟在研究复杂生物屏障中的巨大潜力，为皮肤科学领域从宏观现象描述转向微观机制探究提供了强大的计算工具。研究局限性简化的脂质模型：尽管比以往的模型复杂，但本研究使用的仍然是一个简化的四组分混合物。真实角质层中上百种不同链长和头基的脂质所带来的化学复杂性，可能会对水滴的形成和稳定性产生更精细的调控。粗粒化力场的精度：CG模拟的结果依赖于力场参数的准确性。虽然本研究使用的SDK模型已被广泛验证，但它在描述某些特定的相互作用（如氢键）时仍然存在近似，可能会影响对水滴界面结构的精确描述。未考虑蛋白质和角质细胞：模型忽略了角质细胞包膜上共价结合的脂质以及角蛋白等蛋白质成分，这些都可能作为“锚定点”或模板，影响脂质的局部组织和水通道的形成。未来方向模拟扩展方向促渗剂的作用机制：利用该模型，可以直接在模拟中加入乙醇、油酸等经典的化学促渗剂，观察它们是如何影响水滴的形成、融合以及通道的稳定性的。预测：促渗剂可能通过降低界面张力 $\gamma$ 或改变弯曲模量 $K_c$，将水通道形成的能垒从33-43 kcal/mol降至20 kcal/mol左右，使通道形成概率提高约 $10^7$ 倍。疾病状态的模拟：通过改变脂质组成（例如，减少长链神经酰胺的比例）来模拟特应性皮炎等皮肤病状态，研究其屏障功能受损是否与间质水滴的异常增多或融合有关。可实验验证的预测间质水滴的直接观测：使用改进的冷冻电镜（cryo-TEM/cryo-EM）技术，在高湿度处理的皮肤脂质样品中寻找 ~1.3 nm 的水滴结构已有部分cryo-EM图像显示了类似的纳米级水滴特征，但分辨率有待提高预测：在生理湿度下，应观察到直径2.6 nm（半径1.3 nm）的球形水滴，密度约为5-10个/100 nm² 湿度依赖的相变研究：在不同相对湿度（RH = 30%, 60%, 90%）下测量皮肤脂质样品的小角X射线散射（SAXS）预测相变序列：低湿度（30% RH）：均一LPP相，只有13 nm的主衍射峰中等湿度（60% RH）：LPP + 弱衍射峰（来自水滴引起的周期性扰动）高湿度（90% RH）：连续相变，出现反相六方相特征峰（水通道）物理促渗方法的机制验证：超声波频率匹配：模拟预测20 kHz超声波（周期50 μs）与水滴-水层交换时间（40 μs）接近，可能通过”共振”促进水滴融合实验设计：比较不同频率（10 kHz, 20 kHz, 40 kHz）超声波对亲水性药物渗透率的影响，验证是否存在最优频率温和促渗策略：开发特异性稳定或诱导水通道的新型促渗剂，只为亲水性药物开”门”，而不破坏整体屏障功能注：详细的公式推导、方法学细节和补充图表分析请参见附录文档。

Specific Sytems · 2025-10-20

附录：核心公式与理论推导

附录：核心公式与理论推导本文档是《皮肤屏障的”水之道”：分子模拟揭示脂质相共存如何稳定间质水》的技术附录，包含详细的公式推导、方法学细节和补充图表分析。一、ABF（见上一篇）二、渗透系数的计算方法详解本文中，渗透系数（$k_p$）的计算基于非均匀溶解-扩散模型，并结合经验公式进行校准。 2.1 基于自由能和扩散系数的经典模型理论上，渗透系数的倒数，即 resistance（$R$），可以通过对膜内各处的 local resistance 进行积分得到： [\frac{1}{k_p} = R = \int \frac{\exp(\Delta G(z) / k_B T)}{D(z)} \mathrm{d}z] 这个公式的物理意义是，总的穿膜 resistance 是膜内每一点的 local resistance 之和。Local resistance 由两部分决定： $\exp(\Delta G(z) / k_B T)$：这部分代表”溶解“的难度。$\Delta G(z)$ 是分子在膜内$z$位置相对于在水中的自由能（即PMF）。这个值越大，分子越不愿意待在这个位置，相当于溶解度越低，resistance 越大。 $1/D(z)$：这部分代表”扩散“的难度。$D(z)$ 是分子在膜内$z$位置的局部扩散系数。扩散越慢，resistance 越大。 2.2 本文采用的简化与经验校准模型由于直接计算$D(z)$的复杂性和不确定性，作者采用了一种更巧妙的简化模型。他们发现，对于所研究的亲脂性小分子，其在膜内的平均扩散系数 $D$ 主要与分子量（MW）有关，且与经典的Potts-Guy经验公式（$D \sim \exp(-0.0061 \times \mathrm{MW})$）高度一致。因此，他们将渗透过程简化为由一个关键能垒控制的过程。 [k_P = \frac{D}{\lambda_0} P_{liq}] 2.3 公式的通俗解释这个公式可以这样理解：一个分子的渗透系数 $k_P$ 由三个因素共同决定： $D$（它能跑多快）：这是分子的平均扩散系数，主要由其大小决定。 $\lambda_0$（它要跑多远）：这是一个有效路径长度。它不只是膜的厚度，还考虑了分子在膜内迂回曲折的路径，因此通常比膜厚度大得多。这是一个需要通过实验数据来校准的经验参数。 $P_{liq}$（它进入”赛道”的概率）：这是最关键的创新点。作者假设，渗透并非在膜的任何地方都能发生，而是主要通过流动性更强的液态无序核心区。因此，$P_{liq}$ 代表了分子从有序区成功进入这个无序”赛道”的概率。这个概率可以通过分子穿过有序-无序界面所需的自由能垒 $\Delta G_{o/d}$ 来计算： [P_{liq} = \exp(-\Delta G_{o/d} / k_B T)] 最终，作者通过对一系列已知渗透性的分子进行MD模拟，计算它们的 $\Delta G_{o/d}$ 和 $D$，然后与实验的 $k_P$ 值进行线性回归，最终拟合得到了经验参数 $\lambda_0 \approx 59 \mu m$，从而建立了一个完整的预测模型。三、加热-退火模拟的详细过程 3.1 模拟的目的加热-退火模拟是一种经典的计算方法，用于探索系统的亚稳态结构。在实验中，合成皮肤脂质样品时经常需要加热来加速脂质混合和相转变。因此，作者通过模拟这一过程来研究在高湿度条件下，水分子如何重新组织。 3.2 初始结构的构建作者首先构建了一个由四层水合双层膜堆叠而成的大体系。具体步骤如下：单个双层膜的准备：使用前面提到的1:1:2:2 CER[NS]/CER[EOS]/CHOL/FFA组成，构建一个平衡的水合双层膜（如图1所示的SPP模型）。垂直堆叠：将这个双层膜沿着膜法线方向（Z轴）复制4次，形成4层双层膜的堆叠结构。每两层膜之间有一个水层分隔。体系尺寸：小体系：16 × 16 × 32 nm³ 大体系：24 × 24 × 32 nm³ 水/脂比：模拟了两种含水量： 5:1 水/脂比（较高湿度） 2:1 水/脂比（生理性湿度） pH条件：模拟了两种pH：低pH：所有游离脂肪酸（FFA）都质子化中性pH：50%的FFA质子化，50%去质子化 3.3 加热阶段（95°C，0.25 μs）温度升高：将体系从30°C升温至95°C。这个温度远高于大多数神经酰胺的熔点（通常在60-90°C）。为什么选择95°C：打破有序脂质链的堆积增加脂质分子的动能和流动性促进不同双层膜之间的接触和融合加速水分子的重新分配时间尺度：0.25 μs（250 ns）足够让脂质发生大规模重排，但不至于完全破坏膜结构。观察到的现象：相邻双层膜在多个接触点发生半融合（hemifusion）外层脂质单层融合，但内层仍保持独立原本分隔双层膜的水层被”挤压” 3.4 退火阶段（30°C，1.8 μs）温度降低：将体系从95°C缓慢冷却回30°C（生理温度）。为什么需要退火：让系统从高温的无序状态”凝固”到某个亚稳态结构观察水分子在冷却过程中如何重新组织模拟实验中样品制备后的冷却过程时间尺度：1.8 μs是一个相当长的弛豫时间，足以让脂质重新排列成稳定的构象。最终结构：高含水量（5:1）：形成连续的水通道，贯穿整个脂质基质低含水量（2:1）：形成孤立的水滴，被脂质头基包裹在疏水核心中 3.5 为什么不形成标准的LPP 在退火后的结构中，虽然观察到了类似LPP的一些特征（如CER[EOS]的伸展构象），但整体上保留了显著的双层膜痕迹，没有完全转变为均一的13 nm厚的LPP结构。原因如下：时间尺度限制：即使1.8 μs的模拟在计算上已经非常昂贵，但对于脂质的大规模重组（特别是长链神经酰胺的重排）来说，可能仍然太短。缺乏层间模板：在真实的角质层中，角质细胞表面的共价结合脂质可能作为”模板”，引导脂质组装成LPP。模拟中缺少这种模板效应。半融合是亚稳态：半融合状态本身就是一个能量局部极小值，系统可能”卡”在这个状态，需要更长时间或额外的驱动力才能进一步演化。 3.6 水滴与水通道的形成机制关键洞察：在加热过程中，当相邻双层膜发生半融合时，原本位于膜间的水层被”困”在了融合的脂质核心中。退火后：水含量高：水分子足够多，可以形成连续的柱状通道水含量低：水分子被分散成多个孤立的球形水滴这个结果表明，任何能引起膜局部结构剧烈重排的事件（热、机械应力、化学促渗剂）都可能将界面水”包裹”到疏水核心中，从而创造亲水性渗透路径。四、水滴自由能模型的详细推导 4.1 模型的物理基础文中提到：The free energy of the surface S of a water droplet was modeled as the sum of the interfacial tension with the lipid phase and the elastic bending energy of the surrounding lipid layer. 这个模型基于两个能量贡献：界面张力能：水-脂质界面的存在需要能量（$\gamma$），类似于水滴在空气中的表面张力。弯曲弹性能：包裹水滴的脂质头基需要弯曲，偏离其自然的曲率，这需要额外的能量。 4.2 完整的自由能公式 [F(S) = \int_S \left[ \gamma + \frac{K_c}{2} (c - c_0)^2 \right] \mathrm{d}A_S] 其中： $\gamma$：水-脂界面张力（单位：mN/m 或 kcal/mol/nm²）本文使用水-辛醇界面张力作为近似：$\gamma \approx 8.5 \pm 2$ mN/m $K_c$：脂质的弯曲模量（单位：kcal/mol）通过SPP双层膜的面积压缩模量计算：$K_A = 273 \pm 35$ mN/m 使用聚合物刷模型转换：$K_c = 9.5 \pm 1.2$ kcal/mol $c = r_x^{-1} + r_y^{-1}$：总曲率，$r_x$ 和 $r_y$ 是两个主曲率半径对于球形水滴：$c = 2/r$ 对于圆柱形：$c = 1/r$（沿柱轴方向曲率为0） $c_0 = r_0^{-1}$：脂质头基的自发曲率（spontaneous curvature）从实验推导：$r_0 \approx 2.7$ nm 这是脂质头基在高湿度下”最舒服”的弯曲程度 $\mathrm{d}A_S$：表面积微元 4.3 球形水滴的自由能对于半径为 $r$ 的球形水滴：表面积：$S = 4\pi r^2$ 曲率：$c = 2/r$ 代入公式： [F(r) = 4\pi r^2 \left[ \gamma + \frac{K_c}{2} \left(\frac{2}{r} - \frac{1}{r_0}\right)^2 \right]] 展开： [F(r) = 4\pi \gamma r^2 + 2\pi K_c \left[ 4 - \frac{4r}{r_0} + \frac{r^2}{r_0^2} \right]] 4.4 寻找能量最小值对 $r$ 求导并令其为零： [\frac{\mathrm{d}F}{\mathrm{d}r} = 8\pi \gamma r + 2\pi K_c \left[ -\frac{4}{r_0} + \frac{2r}{r_0^2} \right] = 0] 整理得到最稳定半径 $r^*$ 满足： [\gamma r + \frac{K_c}{4} \left( \frac{r}{r_0^2} - \frac{2}{r_0} \right) = 0] 代入数值（$\gamma = 8.5$ mN/m，$K_c = 9.5$ kcal/mol，$r_0 = 2.7$ nm），求解得： [r^* \approx 1.3 \text{ nm}] 这与模拟中观察到的水滴平衡半径完美吻合！ 4.5 物理意义 $r < r^*$：水滴太小，界面张力占主导，系统倾向于通过吸收更多水分子来增大半径，降低单位面积的界面能。 $r = r^*$：达到平衡，界面张力与弯曲能的竞争达到最优。 $r > r^*$：水滴过大，脂质头基被迫弯曲成比 $r_0$ 更大的曲率，弯曲能惩罚很大，系统倾向于释放水分子来缩小半径。 4.6 圆柱形通道的能量对于半径 $r$、长度 $L$ 的圆柱形通道：表面积：$S = 2\pi rL + 2\pi r^2$（侧面 + 两个端盖）侧面曲率：$c = 1/r$ 端盖曲率：$c = 2/r$ 总自由能： [F(r, L) = 2\pi rL \left[ \gamma + \frac{K_c}{2}\left(\frac{1}{r} - \frac{1}{r_0}\right)^2 \right] + 2\pi r^2 \left[ \gamma + \frac{K_c}{2}\left(\frac{2}{r} - \frac{1}{r_0}\right)^2 \right]] 4.7 形成通道的能垒假设从一个 $r = r^* = 1.3$ nm 的球形水滴出发，保持半径不变，拉伸成长度 $L = 6$ nm（足以连接到邻近水滴）的圆柱：初始能量：$F(r^*, L=0) \approx 0$（定义为参考点）最终能量：$F(r^*, L=6 \text{ nm})$ 计算得到： [\Delta F \approx 43 \text{ kcal/mol}] 如果允许体积变化（即从周围吸收更多水），最优路径的能垒稍低： [\Delta F \approx 33 \text{ kcal/mol}] 4.8 能垒的意义稀有事件：在 $k_BT \approx 0.6$ kcal/mol（30°C）时，玻尔兹曼因子： [P \sim \exp(-33/0.6) \sim 10^{-24}] 这意味着在平衡条件下，水通道形成是极其罕见的事件。可促进性：但这个能垒不是不可逾越的。外部干预（如促渗剂、超声波、机械应力）可以提供额外的能量或降低能垒，显著提高通道形成的概率。五、粗粒化力场参数化细节 5.1 SDK方法的9-6 Lennard-Jones参数本研究中使用的粗粒化力场基于SDK（Shinoda-DeVane-Klein）方法，采用9-6 Lennard-Jones势能函数而非传统的12-6形式。这种选择能够更好地描述软物质体系的相互作用。为了描述神经酰胺和游离脂肪酸的头基，作者从小分子的热力学数据（密度、表面张力、水合自由能）推导了新的力场参数：核心参数表： CG粒子类型1 CG粒子类型2 LJ ε（kcal/mol） LJ σ（Å） N（酰胺NH） N 0.2430 4.0506 O（羰基C=O） O 0.3233 3.7880 N O 0.5393 3.6246 N W（水） 0.9000 4.6100 O W 0.6690 4.2166 COOH COOH 0.6500 3.0000 COOH W 0.7627 4.5418 其中： N：酰胺NH基团（神经酰胺的鞘氨醇骨架） O：羰基C=O（神经酰胺的酰胺键） W：一个CG水粒子代表3个真实水分子 COOH：羧酸基团（游离脂肪酸头基） 5.2 参数化策略小分子模型化合物：甲酰胺（NH₂CHO）和N-甲基甲酰胺（CH₃NHCHO）：用于代表神经酰胺的酰胺头基丁酸（CH₃(CH₂)₂COOH）：用于代表游离脂肪酸的羧基拟合目标：对角相互作用（同类型粒子）：拟合纯物质的密度和表面张力与水的相互作用：拟合实验水合自由能非对角相互作用：使用几何平均组合规则 pH条件限制：由于CG水模型缺少偶极矩，无法稳定COO⁻等带电头基所有CG模拟仅适用于低pH条件（FFA完全质子化）开源资源：完整力场参数：https://github.com/CG-it/ffdb-sdk 模拟输入文件生成工具（CG-it）：https://github.com/CG-it/CG-it 兼容LAMMPS软件六、六方有序性分析 6.1 六方有序参数的定义六方有序性（$ \psi_6 $）是描述脂质尾链在膜平面上二维排列规整程度的参数，定义为： [\psi_6 = \frac{1}{N_{neighbors}} \sum_{j=1}^{N_{neighbors}} e^{i6\theta_j}] 其中 $\theta_j$ 是第 $j$ 个最近邻原子相对于中心原子的角度。物理意义： **$ \psi_6 = 1$**：完美的六方晶格（固态有序，gel相） **$ \psi_6 = 0$**：完全无序（液态无序，liquid-disordered相） **$0 < \psi_6 < 1$**：液-固共存或液晶相 6.2 胆固醇的流动化作用通过计算不同胆固醇含量下的六方有序参数，揭示了胆固醇对脂质膜流动性的影响：胆固醇含量 AA模拟 CG模拟相态 0% 0.75 0.55 固态有序gel 30% 0.48 0.50 固-液共存 50% 0.42 0.40 液态无序Ld 物理意义：纯神经酰胺：尾链高度平行排列，形成”固态”域，链间范德华力极强加入30%胆固醇：打断神经酰胺之间的紧密堆积，引入流动性，出现固-液共存 50% CHOL：接近完全液态，与SPP核心的无序区域一致 6.3 与实验观察的联系这一分析与实验观察到的相行为高度吻合： SPP的外层区域：主要由神经酰胺和FFA组成，$ \psi_6 \approx 0.7$（高度有序） SPP的核心区域：富含胆固醇和不饱和亚油酸链，$ \psi_6 \approx 0.4$（液态无序）胆固醇的双重作用：在低浓度时（<20%）：增加膜的紧密度（”凝聚效应”）在高浓度时（>30%）：增加流动性（”流动化效应”）这种有序-无序的相分离正是SPP双层膜形成”三明治”结构的微观机制。

Specific Sytems · 2025-10-10

角质层脂质基质的动态结构缺陷与屏障功能分子机制

Specific Sytems · 2025-10-08

揭秘酒精促渗：分子模拟揭示乙醇如何打开皮肤屏障

揭秘”酒精促渗”：分子模拟揭示乙醇如何”打开”皮肤屏障本文信息标题: 乙醇增强皮肤渗透效应的分子机制：一项分子动力学研究作者: Rakesh Gupta, Yogesh Badhe, Beena Rai, Samir Mitragotri 发表时间: 2020年3月16日单位: 塔塔研究开发与设计中心 (印度)，哈佛大学 (美国) 引用格式: Gupta, R., Badhe, Y., Rai, B., & Mitragotri, S. (2020). Molecular mechanism of the skin permeation enhancing effect of ethanol: a molecular dynamics study. RSC Advances, 10(21), 12234–12248. https://doi.org/10.1039/d0ra01692f 摘要乙醇被广泛用于各种药物和化妆品配方中，以增强活性成分的皮肤渗透。尽管众所周知乙醇能够渗入皮肤并增强极性和非极性分子的渗透，但其增强皮肤渗透性的确切机制尚未完全明了。目前已提出的机制包括：从角质层（SC）中提取脂质、使SC脂质双层流化、改变SC蛋白质构象以及增强药物在SC脂质中的溶解度。本研究中，我们对由神经酰胺、胆固醇和游离脂肪酸等摩尔混合物组成的SC脂质双层，在不同浓度的乙醇水溶液存在下进行了分子动力学（MD）模拟。结果发现，乙醇通过双重作用增强双层膜的渗透性：（a）提取皮肤脂质和（b）增强脂质链的迁移性。乙醇的促渗效应源于其与皮肤脂质头基原子形成氢键的卓越能力。此外，我们使用伞形采样模拟研究了从脂质双层中提取神经酰胺（CER）和游离脂肪酸（FFA）的自由能。结果发现，在所有乙醇浓度下，提取CER的自由能远高于FFA，表明与FFA相比，CER更难被提取。最后，我们展示了在乙醇存在下，苯甲酸药物分子穿过皮肤脂质双层的过程。研究发现，乙醇在几微秒内选择性地靶向并提取皮肤脂质双层中的FFA。随后，乙醇渗透到脂质层内部，并创造出药物分子可以轻易穿过的通道。我们的观察结果（包括无约束模拟和伞形采样模拟）与文献中报道的实验结果一致。核心结论乙醇通过两种协同机制增强皮肤渗透：选择性地提取脂质（主要是游离脂肪酸FFA）和增加脂质链的流动性。乙醇与脂质头基（特别是神经酰胺CER和FFA）形成氢键的能力是其发挥作用的关键，这种竞争性氢键破坏了脂质间的紧密堆积。相比神经酰胺（CER），游离脂肪酸（FFA）更容易被乙醇从角质层脂质膜中提取出来，自由能计算和无约束模拟都证实了这一点。乙醇在提取部分脂质后，会渗透到膜的疏水核心，并形成临时性的”通道”，为药物分子（如苯甲酸）的穿透提供了路径。背景将活性成分有效递送到皮肤深层乃至全身，是透皮给药和化妆品领域的核心挑战。我们皮肤的最外层，即角质层（Stratum Corneum, SC），是这一过程的主要障碍。角质层厚度仅有10-20微米，其结构常被比作”砖墙-灰浆“模型：角质细胞是”砖块”，而填充其间的脂质基质则是”灰浆”。这个由神经酰胺（CER）、胆固醇（CHOL）和游离脂肪酸（FFA）精密堆积而成的脂质基质，构成了阻止外界物质（尤其是水溶性和大分子物质）入侵的主要防线。为了克服这一屏障，化学促渗剂（Chemical Penetration Enhancers, CPEs）的应用变得至关重要。在众多CPEs中，乙醇因其高效、安全且应用广泛而备受关注。从日常的消毒洗手液到高端的透皮贴剂，乙醇无处不在。实验已经反复证实，乙醇能够显著提高多种活性分子的皮肤渗透率。然而，“乙醇如何做到这一点”的分子机制却一直存在争议。学术界提出了多种假说：它是否像溶剂一样“溶解”并提取出角质层中的脂质，从而“拆解”这堵墙？还是它只是“混入”脂质中，使其变得更加流化和无序，从而让药物分子更容易“挤”过去？亦或是它改变了角质层中蛋白质的构象？这些机制可能并非相互排斥，而是在不同浓度下协同作用。由于实验手段难以在原子和分子水平上直接观察这一动态过程，我们对乙醇作用的理解仍然是零散和不完整的。关键科学问题本文旨在利用全原子分子动力学（MD）模拟，在分子水平上系统性地、定量地回答以下核心科学问题：乙醇浓度效应：不同浓度的乙醇水溶液（从0到100%）是如何逐步影响角质层脂质双层膜的宏观结构和稳定性的？是否存在一个”阈值”浓度，在此之上膜的破坏会急剧加速？作用机制的区分：乙醇促渗的主要机制究竟是脂质提取还是膜结构流化？或者两者皆有？它们各自在不同浓度下的贡献是怎样的？作用的靶点选择性：在神经酰胺、胆固醇和游离脂肪酸这三种主要脂质中，乙醇是否对某一种有优先作用？如果是，为什么？这种选择性作用背后的热力学驱动力是什么？药物渗透通路：在乙醇作用下，药物分子（本文以苯甲酸为例）是如何穿过原本致密的脂质屏障的？乙醇是仅仅增加了膜的流动性，还是主动地在膜中开辟了新的”通道“？创新点系统性的浓度研究：首次通过长时间（微秒级）的MD模拟，系统地研究了从0到100%全浓度范围的乙醇对角质层脂质模型的影响，提供了连续变化的动态图像。机制的定量区分：结合无约束模拟（观察自发过程）和增强采样模拟（计算自由能），从结构和能量两个维度定量地区分了”脂质提取”和”膜流化”两种机制，并揭示了它们之间的协同关系。靶点选择性的热力学证据：通过计算提取不同脂质（CER vs. FFA）的自由能（PMF），首次从理论上定量证明了乙醇优先提取游离脂肪酸（FFA）的热力学倾向性，并解释了其原因。药物渗透路径的可视化：通过引入药物分子（苯甲酸）的模拟，直观地展示了乙醇在提取脂质后，如何渗透进入膜核心并形成瞬时通道，从而促进药物穿透的全过程。研究内容方法详述本研究采用了一套结合无约束模拟和增强采样的多层次MD模拟策略，以全面探究乙醇的作用机制。 1. 模型构建皮肤脂质双层模型：采用先前研究中已验证的等摩尔比CER-NS:CHOL:FFA三组分模型。其中，神经酰胺使用CER-NS（N-二十四烷酰基鞘氨醇），游离脂肪酸使用木蜡酸（C24:0）。这是一个广泛用于模拟角质层短周期相（SPP）的经典模型。溶剂环境：构建了8个不同乙醇摩尔分数（$x$，指乙醇在乙醇-水溶剂中的摩尔分数）的环境，浓度范围从$x=0.1$到$x=1.0$。表1：不同模拟体系中乙醇和水分子的数量乙醇摩尔分数 (x) 水分子数乙醇分子数 0.1 4608 512 0.2 4096 1024 0.3 3584 1536 0.4 3072 2048 0.5 2560 2560 0.6 2048 3072 0.8 1024 4096 1.0 0 5120 药物分子：选择苯甲酸（benzoic acid）作为模型药物，用于最终的渗透模拟。 2. 模拟参数与流程软件与力场：所有模拟均使用 GROMACS 软件进行。力场采用 GROMOS 和 Berger 的混合力场，其中脂质尾链的亚甲基基团被处理为联合原子。水分子使用 SPC 模型。这是一个在脂质模拟中被广泛验证的力场组合。无约束模拟（Unrestrained Simulation）：将预平衡的脂质双层置于不同浓度的乙醇-水盒子中。进行能量最小化，随后在NVT系综下进行5 ns的溶剂弛豫（脂质位置约束）。逐步撤销约束，在NVT下再平衡5 ns。在NPT系综下（305 K, 1 bar）进行20 ns的无约束平衡。最后进行长达 1.0 μs 的生产模拟。温度和压力分别由 Nosé-Hoover 和 Parrinello-Rahman 算法控制。伞形采样模拟（Umbrella Sampling）：用于计算提取单个脂质分子（CER或FFA）的自由能曲线（PMF）。通过慢速（0.02 nm/ps）恒速拉伸，从平衡构象中沿Z轴（膜法线方向）将一个脂质分子拉出膜，每隔0.2 nm保存一个构象作为伞形采样的窗口。对每个窗口的构象进行5 ns的平衡和 20 ns 的生产模拟，并使用WHAM方法构建最终的PMF曲线。为确保统计的可靠性，每个浓度下都从4个不同的初始XY位置拉伸2个分子，共进行8次独立的系列模拟。结果与分析乙醇浓度对膜结构的宏观影响通过对1 μs的无约束模拟轨迹进行分析，作者观察到了三个与乙醇浓度相关的显著现象。图1：不同乙醇浓度对双层膜结构的影响。快照取自1.0 μs模拟结束时。为清晰起见，图中未显示水和乙醇分子。CER、CHOL和FFA分别以橙色、绿色和蓝色显示。低浓度区 ($x < 0.2$): 脂质双层基本保持完整，只有极少数脂质（主要是FFA）被乙醇扰动。中浓度区 ($0.2 < x < 0.6$): 膜结构受到显著干扰。大量脂质被从双层中”拔”出并溶解到乙醇-水溶剂中。这一效应在FFA上比在CER上更为明显。高浓度区 ($x > 0.6$): 双层结构开始瓦解，变形为非层状结构，大量脂质被提取。这一“脂质提取”的现象与多种实验研究结果高度一致。乙醇选择性地提取游离脂肪酸 (FFA) 为了定量描述脂质提取过程，作者统计了在模拟过程中离开双层膜的CER和FFA分子的数量。图2：离开脂质双层的脂质数量。（a）FFA和（b）CER随模拟时间的变化。（c）不同乙醇浓度下，从双层膜中提取的脂质总数。作者在本文中定义了两种”离开”状态：一是”暂时离开双层（came out of the lipid bilayer）“，包括了所有部分或全部脱离膜但可能重新插入的事件；二是”被提取（extracted）“，特指那些完全脱离膜并进入体相溶剂的事件。结果清晰地表明： FFA更易被提取：在所有浓度下，被提取的FFA数量都远多于CER。在$x=0.2$的较低浓度下，就已经有显著数量的FFA被提取，而CER几乎没有。浓度依赖性：随着乙醇浓度的增加，FFA和CER的提取数量都随之上升，但FFA的提取量增长更快。这一定量结果首次揭示了乙醇对FFA具有明显的靶向选择性。乙醇渗透与膜内部结构变化乙醇不仅在膜表面“作案”，还会渗透到膜的内部。图3：不同组分沿膜法线方向的密度分布。该图展示了模拟最后200 ns的平均密度分布。（a）乙醇，（b）水，（c）FFA，（d）CER。乙醇的渗透：当乙醇浓度$x > 0.1$时，其密度分布图在膜中心（d=0 nm）出现明显的峰，表明乙醇已经穿透头基区域，进入了疏水核心。水的协同渗透：乙醇在进入膜内部时，会”携带”一部分水分子一同进入，这解释了为何乙醇能增强水溶性药物的渗透。脂质密度的降低：随着乙醇浓度的增加，FFA和CER的密度峰值显著下降，尤其是在$x \ge 0.8$时，FFA的密度峰几乎消失，表明其已大量脱离膜结构。而胆固醇（CHOL）在所有浓度下都未被提取，稳定地保留在膜中。乙醇导致膜内部流动性增加（流化）除了提取脂质，乙醇还通过影响脂质链的有序性来发挥作用。作者计算了脂质尾链的有序度参数（$S_z$）。$S_z=1$表示链完全伸直且垂直于膜平面，值越低代表越无序、流动性越高。公式的通俗解释有序度参数 $S_z$ 的计算公式为： [S_z = \frac{1}{2} (3 \langle \cos^2\theta \rangle - 1)] 其中，$\theta$ 是脂质链中特定碳原子骨架向量（通常由 $C_{n-1}$ 到 $C_{n+1}$ 的向量定义）与膜法线方向（Z轴）的夹角，$\langle \dots \rangle$ 表示对时间和分子系综的平均。这个公式衡量了脂质链相对于膜法线的排列规整程度。图4：CER和FFA链的有序度参数。（a-c）考虑了所有脂质分子的平均有序度。（d-f）只考虑仍留在双层膜内部的脂质的有序度。整体有序度下降：如图4a-c所示，随着乙醇浓度增加，所有脂质链的整体有序度都显著下降。这一下降部分是由于被提取到溶剂中的脂质变得完全无序所致。膜内部的流化：更关键的是图4d-f的结果。即使只分析那些仍然留在膜内部的脂质，它们的有序度也随着乙醇浓度的增加而降低。这证明了乙醇的渗透确实导致了膜核心的流化，增加了脂质链的运动能力。氢键网络：作用机制的核心乙醇的促渗能力根植于其形成氢键的能力。它通过与脂质头基竞争形成氢键，破坏了原本稳定的脂质间氢键网络。图5：脂质与溶剂间形成的氢键数量。 CER-乙醇 & FFA-乙醇氢键：随着乙醇浓度增加，这两种氢键的数量急剧上升。这表明乙醇分子主动与脂质头基结合。 CER-CER氢键：在所有浓度下，CER之间的氢键数量保持相对稳定。这强大的内聚力使得CER分子更难被单个”拔出”。 CER-FFA氢键：随着乙醇的介入，CER与FFA之间的氢键数量不断减少，直至消失。结论是：乙醇通过形成新的“脂质-乙醇”氢键，打破了原有的“脂质-脂质”和“脂质-水”氢键平衡。由于FFA自身的氢键网络较弱，它更容易被乙醇“俘获”并从膜中带走。自由能计算：定量证实FFA更易被提取为了从热力学上证明乙醇更容易提取FFA，作者使用伞形采样计算了将CER和FFA从膜中拉到溶剂里所需的自由能（PMF）。图6：提取CER和FFA的自由能。（a）伞形采样模拟快照。（b）不同乙醇浓度下，提取CER和FFA所需的总自由能垒。自由能垒：如图6b所示，在所有乙醇浓度下，提取FFA的自由能垒（红色曲线）都显著低于提取CER的自由能垒（黑色曲线）。例如，在$x=0.8$时，提取FFA仅需约$35 kJ/mol$，而提取CER则需要约$60 kJ/mol$。结论：这一结果为”乙醇选择性靶向FFA“提供了坚实的理论依据。提取FFA在热力学上更有利。图7：局部环境对提取自由能的影响。该图展示了被约束的脂质（CER或FFA）周围是CER（构型1）还是FFA/CHOL（构型2）时，其提取自由能的差异。结果表明，无论对于CER还是FFA，当它被其他CER分子包围时，其提取能垒都更高。这进一步证实了CER-CER之间强大的相互作用是维持膜稳定性的关键。图8：从已变形的膜中提取脂质的自由能。该图计算了在高浓度乙醇（$x=0.6$）作用下已经变形的膜中提取CER和FFA的自由能。结果显示，从变形膜中提取CER和FFA的能垒（分别为$39.25$和$25.16 kJ/mol$）远低于从完整膜中提取的能垒。这说明，一旦乙醇开始破坏膜结构，进一步的脂质提取过程会变得更加容易，形成一个正反馈循环。药物渗透机制的可视化最后，作者在一个含有乙醇（$x=0.6$）的体系中加入了苯甲酸药物分子，模拟了其渗透过程。图9：乙醇存在下药物渗透的时间演化快照。左侧为包含溶剂的侧视图，右侧为仅显示溶剂的侧视图。图10：药物渗透过程中各组分的密度分布演化。模拟过程清晰地展示了一个两步机制：第一阶段：脂质提取 (主要是 0 - 0.6 μs) FFA（自由脂肪酸）被显著提取：请看右上角的 FFA 图。在初始阶段（黑线），FFA在膜中有两个清晰的密度峰，表明它稳定存在于双层膜结构中。进入中间阶段（红线），这两个峰的高度急剧下降。这直接说明FFA分子正在大量地从它们原本所在的位置离开，即被从膜中提取出来。到了后期（绿线），FFA的峰几乎完全消失，证明提取过程非常彻底。 CER（神经酰胺）和 CHOL（胆固醇）相对稳定：再看左上角的 CER 图和中上方的 CHOL 图。在从黑线到红线的时间段内，它们的密度峰虽然也有所降低和变宽（表明膜的有序性在下降），但远没有FFA下降得那么剧烈。这说明，在模拟的早期和中期，乙醇的作用是有选择性的，它优先攻击并移除了结构中相对薄弱的FFA成分。第二阶段：通道形成与药物渗透 (主要是 0.3 - 1.0 μs) 乙醇（ETH）渗透并填充膜核心：请看中下方的 ETH 图。在初始阶段（黑线），乙醇主要富集在膜的表面（大约 d=7 nm 和 d=13 nm 处），但已经有少量开始进入膜的疏水核心（中心区域 d≈10 nm）。随着FFA被提取（红线），膜核心区域的乙醇密度开始显著增加。到了后期（绿线），膜核心区域完全被高浓度的乙醇填充，形成了一个贯穿膜的、富含乙醇的环境。这就是所谓的“通道”。药物（BEZ，苯甲酸）随之渗透：现在看最关键的左下角 BEZ 图。在初始阶段（黑线），药物分子几乎完全在膜的外部，膜核心区域的密度接近于零，说明膜的屏障功能完好。进入中间阶段（红线），恰好在FFA被大量提取、乙醇开始深入渗透的同一时期，我们可以看到药物分子开始出现在膜的核心区域。到了后期（绿线），药物分子在整个膜内（包括核心区域）的密度都已显著提高，表明药物已经成功穿透或正在穿透双层膜。水（Water）的协同渗透：右下角的 Water 图也证实了屏障的破坏。初始时（黑线），疏水核心几乎完全无水。随着乙醇通道的形成（红线到绿线），水分子的密度在核心区域也明显增加，说明膜变得更具亲水性，通透性大大增强。 Q&A Q1: 本研究为什么选择GROMOS力场而不是更现代的CHARMM36力场？ A1: 作者在方法部分提到，他们的模型借鉴了之前的研究，而那些研究主要基于GROMOS和Berger力场的组合。在计算化学领域，为了与历史数据进行比较并保持一致性，研究人员有时会继续使用经过充分验证的”旧”力场。虽然CHARMM36在许多方面可能更精确，但GROMOS联合原子力场在计算效率上更高，这对于进行微秒级的长时间模拟以及探索多种不同浓度体系来说是一个重要优势。 Q2: 伞形采样计算出的自由能垒仍然很高（>10 RT），为什么无约束模拟中还能观察到脂质自发脱离？ A2: 这是一个很好的问题，揭示了两种模拟方法的区别。伞形采样计算的是将一个脂质分子沿预设路径（Z轴）垂直拉出完整膜的自由能，这是一个高度受控的过程，遇到的阻力最大。而在长时间的无约束模拟中，乙醇的作用是协同的、多点的。多个乙醇分子同时作用于膜的不同位置，导致膜局部变形、弯曲、产生孔洞。脂质分子并非垂直”拔出”，而是可能沿着这些缺陷以更迂回、能量垒更低的路径”蠕动”出来。因此，无约束模拟观察到的自发过程，其路径不同于伞形采样，对应的能垒也更低。 Q3: 研究发现胆固醇（CHOL）在所有浓度下都未被提取，这背后的物理原因是什么？ A3: 这主要归因于胆固醇的分子结构和在膜中的定位。分子刚性：胆固醇拥有一个刚性的甾环结构，与神经酰胺和脂肪酸的柔性链不同，它像一个”刚性板”深深插入到疏水核心中，提供了主要的结构支撑。缺少强氢键位点：胆固醇只有一个-OH头基，其氢键能力远弱于拥有多个氢键供体和受体的神经酰胺，也弱于脂肪酸的羧基。这使得乙醇难以通过竞争性氢键来”捕获”它。疏水作用：胆固醇的整体疏水性极强，将其从疏水核心”拔”到水性环境中在能量上非常不利。这三点共同作用，使得胆固醇成为了角质层脂质膜中最稳定的”锚定”组分。 Q4: CER分子基本上相当于两条脂肪酸链被一个头基连在一起，它比单个FFA更难被提取出来不是很显然的吗？这个结论的深层意义是什么？ A4: 这个观察表面上直观，但其深层意义远不止”体积大”这么简单。解释如下：共价键的约束：最重要的一点是，CER的两条链是被共价键连接的。这意味着乙醇无法像对待FFA那样，只抓住一个头基就将一条独立的链”钓”出来。它必须克服将整个V形的、体积更大的分子从紧密堆积的邻居中拔出的巨大能垒和空间位阻。这不仅是两个FFA的简单加和，而是指数级的难度增加。更强的氢键网络：CER的头基（包含酰胺键和多个羟基）比FFA的单个羧基能形成更多、更强的氢键。如图5所示，CER-CER之间的氢键网络在乙醇存在下依然非常稳定。要提取一个CER分子，意味着需要同时断裂它与周围多个CER邻居形成的强大氢键网络，这个能量代价远高于断裂FFA与邻居之间较弱的相互作用。特定的堆积模式：在角质层模型中，CER的V形结构与CHOL和FFA形成了高度特异性的、犬牙交错的致密堆积。提取一个CER分子会破坏一大片区域的有序结构，而提取一个线性的FFA分子造成的局部扰动则小得多。因此，这个结论的深层意义在于，它揭示了角质层屏障的稳定性主要来源于神经酰胺分子自身的结构特征（双链共价连接）以及由它主导的强大氢键网络，而不仅仅是简单的疏水堆积。 Q5: 这项研究对化妆品或透皮制剂的配方设计有什么直接的指导意义？ A5: 这项研究为配方设计提供了两点关键的分子见解：（1）靶向性：它明确指出乙醇主要通过提取游离脂肪酸来破坏屏障。这意味着，如果一个配方中包含能与神经酰胺或胆固醇强相互作用的成分，可能会在不严重破坏屏障完整性的前提下，实现更温和的促渗。（2）通道机制：研究表明乙醇形成的”通道”是药物渗透的关键。这意味着促渗剂的作用不仅仅是增加”溶解度”，更是创造物理上的”通路”。因此，在设计促渗剂时，可以考虑那些既能与脂质头基作用，又能短暂驻留在疏水核心以形成瞬时通道的分子。关键结论与批判性总结潜在影响机制的澄清：为”乙醇作为化学促渗剂”这一经典现象提供了迄今最详尽、定量的分子机制图像，澄清了长期以来关于”脂质提取”与”膜流化”的争论，指出两者是协同作用的。靶点药物设计：揭示了游离脂肪酸（FFA）是乙醇作用的主要靶点，为未来设计更具选择性、更温和、副作用更小的化学促渗剂提供了新的思路。计算方法学：展示了如何结合长时间无约束模拟和增强采样模拟来系统性地研究复杂多组分体系，为计算药剂学和化妆品科学领域提供了优秀的研究范例。研究局限性模型简化：尽管模型包含了三大类脂质，但它仍然是一个简化模型。真实的角质层脂质包含多种不同链长的神经酰胺和脂肪酸，这种化学多样性的缺失可能会影响结果的普适性。忽略蛋白质：模型完全忽略了角质层中的角蛋白等蛋白质成分。乙醇也可能通过与蛋白质相互作用来改变其构象，从而影响屏障功能，这一机制在本研究中未被探讨。力场限制：研究使用了GROMOS联合原子力场，虽然计算效率高，但在某些细节（如氢键的精确描述）上可能不如全原子力场精确。未来方向更复杂的模型：未来的模拟可以引入更多种类的神经酰胺和脂肪酸，构建更接近真实皮肤化学组成的模型，以验证当前结论的稳健性。多组分促渗剂：研究乙醇与其他促渗剂（如丙二醇、油酸）的协同作用机制，这在实际配方中更为常见。皮肤病理模型：通过调整脂质比例（如减少神经酰胺含量）来模拟特应性皮炎等疾病状态下的皮肤屏障，研究乙醇对其影响是否与健康皮肤存在差异。小编锐评经典研究范式：本文采用的”无约束长时模拟 + 增强采样自由能计算“是研究分子相互作用机制的黄金组合。对于科研新手来说，这是一个非常值得学习和借鉴的技术流程。图表呈现：文章的逻辑清晰，但部分图的配色（如Fig. 1和Fig. 9）在今天看来略显陈旧，美观度和信息传达效率有提升空间。此外，个别图（如Fig. 2）的定量信息需要结合补充材料才能完全理解，图注本身可以更详尽一些。现象与数据的统一：必须先在构象上观察到显著的、可重复的现象，再去计算各种指标来定量描述它，否则单纯的数字计算很可能只是”投机取巧”或统计噪音。

Specific Sytems · 2025-10-07

温柔还是粗暴？揭秘两种常见表面活性剂（SDS/SLES）如何破坏你的皮肤屏障

“温柔”还是”粗暴”？揭秘两种常见表面活性剂（SDS/SLES）如何破坏你的皮肤屏障本文信息标题: 阴离子表面活性剂对角质层脂质模型膜水渗透性的影响作者: Sang-Wook Lee, Kwadwo E. Tettey, Yury Yarovoy, and Daeyeon Lee 发表时间: 2013年12月20日单位: 宾夕法尼亚大学化学与生物分子工程系 (美国)，联合利华研发中心 (美国) 引用格式: Lee, S.-W., Tettey, K. E., Yarovoy, Y., & Lee, D. (2014). Effects of Anionic Surfactants on the Water Permeability of a Model Stratum Corneum Lipid Membrane. Langmuir, 30(1), 220–226. https://doi.org/10.1021/la403138a 摘要皮肤最外层的角质层（Stratum Corneum, SC）呈“砖墙-砂浆”结构，其中多层脂质双层（砂浆）包裹着扁平的死细胞（砖块），构成了水分和其它物质运输的主要屏障。尽管表面活性剂等外源物质会影响角质层的理化性质，但关于常见表面活性剂如何损害SC脂质膜的锁水功能，我们仍知之甚少。本研究利用石英晶体微天平（QCM-D）技术，探究了两种常见的阴离子表面活性剂——十二烷基硫酸钠（SDS）和月桂醇聚醚硫酸酯钠（SLES）对角质层脂质模型膜水渗透性的影响。当处理浓度达到或超过临界胶束浓度（CMC）时，表面活性剂会吸收到膜中，导致脂质膜质量增加。同时，傅里叶变换红外光谱（FT-IR）证实，表面活性剂的渗入伴随着部分脂质的溶出。有趣的是，尽管纯SDS的吸水性远低于纯SLES，但经SDS处理的脂质膜吸水量却显著增加，与SLES处理的膜相当。研究揭示了两种截然不同的作用机制：SDS处理后，脂质膜的链构象有序性降低，膜变得更“软”，从而导致水吸附和扩散性增加；相反，SLES处理后，脂质膜的构象有序性和硬度反而增加，其吸水能力的提升主要归因于SLES分子本身的强吸湿性。背景我们的皮肤是抵御外界环境的第一道防线，其屏障功能主要由最外层的角质层（Stratum Corneum, SC）承担。角质层被形象地描述为一种“砖墙-砂浆”（brick-and-mortar）结构：其中，“砖块”是已死亡的、扁平化的角质细胞，“砂浆”则是由神经酰胺、游离脂肪酸和胆固醇等组成的细胞间脂质层。这些紧密堆叠的脂质层是控制水分流失和吸收的关键，决定了皮肤的保湿能力和健康状态。在日常生活中，我们的皮肤不可避免地会接触到各种外源物质，尤其是来自洁面、沐浴露、洗发水等清洁产品中的表面活性剂。这类产品为了达到有效的清洁和发泡效果，广泛使用阴离子表面活性剂，如十二烷基硫酸钠（SDS）和月桂醇聚醚硫酸酯钠（SLES）。然而，已有研究表明，这些表面活性剂可能损害角质层的屏障功能，例如引起角质层溶胀、弹性模量下降，甚至使其分解。尽管我们知道表面活性剂会对皮肤屏障产生影响，但其作用的分子机制，特别是它们如何具体地改变脂质层内部的结构，并最终影响水分子的“穿行”能力（即水渗透性），仍有许多未知之处。理解SDS和SLES这两种结构相似但性质有别的分子如何与皮肤脂质相互作用，对于开发更温和、更有效的个人护理产品至关重要。关键科学问题本研究旨在回答的核心科学问题是：两种广泛使用的阴离子表面活性剂SDS和SLES，是如何通过不同的分子机制影响并损害皮肤角质层脂质屏障的水分通透性的？具体而言，研究聚焦于以下几个方面： SDS和SLES是如何与脂质膜相互作用的？是简单吸附还是会渗入膜内，并导致原有脂质成分的流失？这两种表面活性剂对脂质膜的水分扩散系数（Diffusivity, D）和水溶解度（Solubility, S）有何不同影响，最终如何改变总的水渗透性（Permeability, P）？在分子水平上，它们是如何改变脂质膜的力学性能（如硬度）和内部脂质链的排列有序性的？这些结构变化与功能改变之间存在怎样的关联？创新点直接对比，机制区分：首次在同一实验体系下，直接比较了SDS和SLES这两种最常见的阴离子表面活性剂对模拟皮肤脂质屏障的影响，并揭示了它们截然不同的作用机制。技术联用，多维解析：巧妙地将QCM-D（用于实时监测质量和力学性质变化）与FT-IR光谱（用于分析化学成分和分子构象）相结合，从宏观功能（水渗透性）到微观结构（脂质链有序性），建立了清晰的“结构-性质”关联。颠覆性发现：研究发现，虽然两种表面活性剂都增强了水的渗透性，但其内在机理完全不同。SDS通过“搞乱”脂质排列、使屏障变“软”来实现；而 SLES则在使脂质排列更“规整”、屏障变“硬”的同时，依靠自身强大的吸水能力来增加膜的含水量。研究内容核心方法：“模拟皮肤”与“分子天平” 为了在可控的条件下研究表面活性剂与皮肤的作用，研究人员首先构建了一个“模拟皮肤屏障”。模型角质层脂质膜（Model SC Lipid Membrane）：使用神经酰胺（CER）、棕榈酸（FFA）和胆固醇（CHOL）按1:1:1的摩尔比混合制备。这个配比接近人体皮肤角质层中的生理比例，是该领域广泛使用的标准模型。石英晶体微天平（QCM-D）：这是一种极其灵敏的“天平”，可以实时监测沉积在其表面的薄膜质量和粘弹性质（如硬度/剪切模量）的微小变化。通过控制环境湿度，研究人员可以精确测量脂质膜吸收了多少水分，以及吸水后膜的硬度变化。傅里叶变换红外光谱（FT-IR）：这种技术通过分析分子对红外光的吸收来识别化学基团和推断分子的排列状态。在本研究中，它被用来确认表面活性剂是否进入了脂质膜，以及膜内脂质链的排列是变得更有序还是更无序。实验流程总览 graph TD subgraph direction LR subgraph "1. 模型制备" A("制备模拟SC 脂质膜") -- "喷涂于QCM传感器 和FT-IR窗口" --> B("形成均匀脂质薄膜") end subgraph "2. 表面活性剂处理" B -- "浸入不同浓度的 SDS或SLES溶液" --> C("处理后的脂质膜") end subgraph "3. 多维度分析" C -- "QCM-D分析" --> D("测量： - 表面活性剂吸收量 - 不同湿度下的吸水量(S) - 水扩散动力学(D) - 膜的剪切模量(硬度)") C -- "FT-IR分析" --> E("测量： - 化学成分变化 - 脂质链构象有序性") end subgraph "4. 建立构效关系" D -- "&" --> F("揭示渗透性改变(P=D·S) 背后的分子机制") E -- "&" --> F end end 结果与分析 1. 表面活性剂的“入侵”与“交换” 图1：(a) 用去离子水和不同浓度SDS处理后，干燥脂质膜的相对质量。(b) 用不同浓度SLES处理后，干燥脂质膜的相对质量。(c) 干燥脂质膜的相对质量作为归一化表面活性剂浓度（浓度/CMC）的函数。$m_{0,dry}$ 和 $m_{treated,dry}$ 分别代表初始制备和经表面活性剂处理后脂质膜的干燥质量。研究首先通过QCM-D监测了脂质膜与表面活性剂作用后的质量变化，揭示了一个与浓度密切相关的双重过程：低于CMC时，脂质被“萃取”：当表面活性剂浓度低于其临界胶束浓度（CMC）时，脂质膜的质量发生了轻微但明确的下降。具体来说，在0.12倍CMC的SDS和0.43倍CMC的SLES溶液中，质量分别下降了 $7.5 \pm 2.9%$ 和 $6.2 \pm 1.4%$。这表明，低浓度的表面活性剂单体主要扮演了“溶剂”的角色，从膜中“拽走”了一部分脂质分子。高于CMC时，表活剂“入侵”：当浓度达到或超过CMC时，情况发生逆转，膜的质量开始显著增加。在约1.15倍CMC时，SDS和SLES处理分别导致了 $15.9 \pm 2.9%$ 和 $2.2 \pm 2.9%$ 的质量增加。这强有力地证明了，当表面活性剂形成胶束后，它们具备了大规模“入侵”并整合到脂质膜内部的能力，其“入侵”的质量远超被“萃取”的脂质质量。图2：用(a) SDS和(b) SLES处理后，模型SC脂质膜的FT-IR光谱图。图中也包含了未处理的脂质膜以及纯表面活性剂的光谱作为对比。 FT-IR光谱分析为上述质量变化提供了分子层面的证据。成分变化：在高于CMC的浓度处理后，样品光谱中清晰地出现了来自SDS和SLES的特征吸收峰（位于 $1200-1300 \text{cm}^{-1}$ 的S-O不对称伸缩振动峰），直接证实了它们的“入侵”。与此同时，代表棕榈酸（约 $1700 \text{cm}^{-1}$ 的C=O伸缩振动）和神经酰胺（约 $1650 \text{cm}^{-1}$ 的酰胺I带）的吸收峰强度均观察到轻微下降。这证实了“入侵”与“萃取”是同时发生的过程。优先萃取：通过比较棕榈酸与神经酰胺特征峰的面积比（R），研究发现处理后的R值减小，表明两种表面活性剂都倾向于优先去除分子量更小的棕榈酸。 2. 皮肤屏障“漏水”了吗？——水渗透性分析渗透性（Permeability, P）由扩散系数（Diffusivity, D）和溶解度（Solubility, S）共同决定，即 P = D * S。其中，D反映水分子穿过膜的速度，S反映膜能容纳多少水分。图3：经SDS和SLES处理后，SC模型脂质膜的(a) 水扩散系数、(b) 水溶解度以及(c) 水渗透性，作为归一化表面活性剂浓度的函数。注：1 Barrer = $10^{-10} [\text{cm}^3(\text{STP}) \cdot \text{cm}] / [\text{cm}^2 \cdot \text{s} \cdot \text{cmHg}]$。溶解度(S)相似增加：如图3b所示，经两种表面活性剂处理后，膜的水溶解度都表现出几乎相同的急剧增加趋势。在高浓度下，溶解度增加了4-5倍，说明表面活性剂的加入显著提升了原本疏水的脂质膜的亲水性和储水能力。扩散系数(D)差异巨大：如图3a所示，真正的差异体现在水分子的扩散速度上。SDS处理导致水扩散系数急剧飙升，而SLES处理组的增幅则要平缓得多。渗透性(P)由扩散系数主导：由于扩散系数的巨大差异，最终导致总的水渗透性（图3c）表现出显著不同。尽管在低浓度下SLES的影响稍大，但随着浓度升高，SDS处理的脂质膜表现出远高于SLES处理膜的水渗透性，意味着其对皮肤屏障的破坏作用（就“漏水”而言）更为严重。 3. 屏障是变“软”了还是变“硬”了？——力学性质分析为何SDS和SLES对水扩散速度的影响差异如此之大？研究人员通过QCM-D分析了膜的剪切模量（G），即硬度，这直接反映了膜的结构完整性和致密性。图4：经表面活性剂处理的SC模型脂质膜在(a) 0% RH（干燥）和(b) 100% RH（湿润）下的归一化剪切模量。注：(a)图的参考态是未经处理的干燥膜的剪切模量；(b)图的参考态是各自经表面活性剂处理后的干燥膜的剪切模量。$G_{0,dry}$、$G_{treated,dry}$ 和 $G_{treated,hydrated}$ 分别代表：初始（未处理）干燥膜、处理后干燥膜、处理后湿润膜的剪切模量。结果揭示了两种表面活性剂截然相反的力学效应： SDS使膜变“软”：如图4a所示，在干燥状态下，随着SDS浓度的增加，脂质膜的剪切模量单调下降，说明SDS破坏了膜的内部结构，使其变得更松散、更柔软。 SLES使膜变“硬”：令人惊讶的是，SLES处理后，膜的剪切模量反而增加，并趋于一个平台值，表明膜的结构变得更坚固、更致密。吸水后变化：如图4b所示，在湿润状态下，水分子作为增塑剂使所有膜都变软。然而，SDS处理的膜软化程度远超SLES处理的膜，其剪切模量急剧下降至非常低的水平，进一步证实了其结构的严重受损。 4. 分子层面的“混乱”与“秩序”——揭示机制根源力学性质的迥异表现指向了分子层面的根本差异。FT-IR对脂质链中C-H₂伸缩振动峰位（约 $2917 \text{cm}^{-1}$ 和 $2849 \text{cm}^{-1}$）的分析最终揭开了谜底。这些峰的频率是脂质链构象有序性的灵敏探针：频率越高，代表链排列越无序（流动性越好）；频率越低，代表链排列越有序（排列越紧密）。图5：C-H₂不对称伸缩振动峰和对称伸缩振动峰的FT-IR波数位移。 SDS导致“混乱”：如图5所示，SDS处理后，两个C-H₂伸缩振动峰的频率均向高波数方向移动（升高）。这明确地表明，SDS分子的插入破坏了脂质链原有的紧密有序排列，使整个体系变得更加无序和松散，如同从“固态”向“液态”转变。这种分子层面的“混乱”完美地解释了为何膜会变软，以及为何水分子能更快地在其中扩散。 SLES导致“秩序”：与此相反，SLES处理后，两个峰的频率均向低波数方向移动（降低）。这表明，SLES的加入反而促进了脂质链的构象有序性，使其排列得更加规整和紧密。这种有序化解释了为何膜会变硬。研究者推测，这可能是因为SLES分子中额外的乙氧基（EO）使其头部基团更大、亲水性更强，难以像SDS那样深入并扰乱脂质核心，反而可能在脂质层间起到一种“锚定”或“桥接”的作用，促进了局部结构的有序化。 Q&A Q1: 为什么SLES能让脂质膜变得更硬、更有序，但最终还是增加了水的渗透性，破坏了屏障？ A1: 这是本研究最有趣的核心发现。SLES破坏屏障的逻辑与我们通常认为的“结构破坏导致功能丧失”不同。它对水渗透性的提升主要不依赖于增加扩散速度（D），而是通过极大地增加水的溶解度（S）来实现的。SLES分子本身比SDS更亲水（由于乙氧基的存在），当它整合到脂质膜中，就把整个膜变成了一块更吸水的“海绵”。尽管这块“海绵”的骨架（脂质链）可能变得更规整、更硬，但由于其内部能容纳的水分总量（S）急剧增加，根据渗透性公式 P = D * S，总的水渗透量（P）依然显著上升。 Q2: 研究提到在低于CMC时，表面活性剂反而导致膜质量下降，这说明了什么？ A2: 这说明在低浓度下，表面活性剂的单个分子（单体）占主导，它们的主要作用是从脂质膜表面“溶解”或“萃取”走一部分脂质分子，导致质量轻微下降。直到浓度升高到CMC以上，表面活性剂开始形成胶束，这些胶束聚集体才有足够的能力“攻击”并整合到脂质膜内部，导致质量的显著增加。这揭示了表面活性剂与皮肤作用存在一个关键的浓度阈值，即CMC。 Q3: 为什么说“胶束”而不是“单个分子”是破坏屏障的关键？这对我们日常使用清洁产品有什么启示？ A3: 研究结果强烈暗示，只有当表面活性剂浓度足够高、形成胶束后，才能大规模地渗入并改变脂质膜的结构和性质。单个的表面活性剂分子可能只能造成表面的轻微扰动。这对日常生活的启示是，清洁产品中表面活性剂的浓度和配方至关重要。使用高浓度、强刺激性的产品，或者在皮肤上停留时间过长，都可能导致表面活性剂浓度超过CMC，从而对皮肤屏障造成更深层的损害。 Q4: SDS和SLES只有一个乙氧基的区别，为何作用机制差异如此之大？这对产品开发有什么指导意义？ A4: 这一个乙氧基的微小结构差异，导致了分子尺寸、亲水性和空间构象的显著不同。SDS是线性小分子，更容易楔入脂质链之间，像“小撬棍”一样把原本整齐的排列撬乱。而SLES因为头部更大、更亲水，难以深入到疏水的脂质核心，其作用更偏向于在脂质层间或表面发挥作用，反而可能通过分子间作用力使局部结构更有序。这对产品开发的指导意义在于，通过精细调节表面活性剂的分子结构（如改变乙氧基数量、头部基团或碳链长度），可以精确调控其与皮肤的相互作用模式，从而在保证清洁力的同时，最大限度地降低对皮肤屏障的损害，开发出更“温和”的产品。关键结论与批判性总结本研究通过精巧的实验设计，清晰地揭示了两种常见阴离子表面活性剂SDS和SLES对皮肤脂质屏障的不同破坏机制。 SDS 是一种结构“扰乱剂”。它通过渗入脂质膜并破坏其内部脂质链的有序排列，导致膜结构变得松散、柔软，从而极大地增加了水分子的扩散速度，导致屏障功能受损。 SLES 则更像是一种“吸湿性增强剂”。它虽然也渗入膜中，但反而使脂质链排列更有序、膜结构更坚固；其破坏屏障的主要途径是利用自身强大的亲水性，显著提高脂质膜的含水量（溶解度），从而增加总的水渗透量。批判性总结：这项工作为理解表面活性剂与皮肤的相互作用提供了深刻的分子见解。然而，值得注意的是，本研究使用的是一个简化的体外模型，它仅包含角质层中的三种核心脂质，而真实皮肤还包含复杂的角质细胞、蛋白质以及更多种类的脂质。因此，这些发现在真实皮肤中的表现可能更为复杂。尽管如此，该研究建立的“结构-功能”分析方法和揭示的分子机制，为评估和开发对皮肤屏障更友好的新一代表面活性剂和个人护理产品配方提供了重要的理论基础和研究范式。

Specific Sytems · 2025-10-07

树枝状大分子纳米粒表面与膜相互作用机理

树枝状大分子/纳米粒表面π体系与膜相互作用机理表面含芳香π体系的纳米粒子在与磷脂双层接触时，可通过多种弱相互作用介导结合和穿透，包括π–π堆积、CH/π（芳香环与脂肪链CH键的相互作用）、阳离子–π作用以及疏水π作用等。研究表明，带电子云的芳香环能与膜中脂质的脂肪链或头部形成特殊稳定接触。例如，Cheng等发现在蛋白质中，磷脂酰胆碱(PC)头部的胆碱阳离子可通过形成”阳离子–π盒”与芳香残基（如酪氨酸）π平面发生强烈吸引：”the PC choline cation interaction with amino acid π systems forms the PC-specific site“。类似地，带氨基的磷脂酰乙醇胺(PE)或磷脂酰丝氨酸(PS)头部的铵离子也可与芳香π体系产生电荷–π相互作用；这些作用帮助粒子在膜表面定位。在膜疏水区，纳米粒子的芳香环可以与脂质烷基链的碳氢键形成CH–π或普通的范德华疏水作用。Efimova等研究的阳离子吡啶苯基树枝状聚合物中指出，含π键的苯基单元通过疏水作用插入脂肪链区：”hydrophobic interactions of phenylene units with the hydrocarbon tails of lipids were observed“，导致脂质双层形成缺陷。此外，π–π堆积往往发生在纳米粒子自身的芳香链之间或与另一芳香表面之间。例如，电子丰富的苯环与电子缺乏的全氟苯环有相反的电荷分布，相对的π四极矩使它们形成强稳定的π–π堆积：”the equal but opposite quadrupole moments of benzene and its highly fluorinated aromatic analogs allow… stabilizing π–π stacking interactions“。总之，各类π相互作用共同影响粒子与膜界面的结合强度、定位和动力学。 π体系电子属性对膜作用的影响芳香基团的电子属性（富电子或缺电子）显著调节其与膜相互作用的模式。以Jordanova等人研究的两种喹啉（纳夫啶酰胺）树枝状聚合物为例：未取代的N,N-二甲基氨基-喹啉酰胺树枝体(Dab)（电子给予）深入并夹入了不饱和脂肪链的扭曲部位，使脂质尾部排序增强，而其3-溴衍生物Dab-Br（电子吸引）则主要留在脂质头部，通过静电与磷酸基作用。具体地说，作者报告：”Dab incorporates in the kink formed by POPC unsaturated tails… Dab-Br interacts electrostatically with the phosphate of phosphatidylcholine“。这表明电子丰富的π体系易插入膜疏水区，而带强吸电子基团的芳香环则倾向于停留在亲水头区，依赖静电结合。另一方面，芳香环的氟取代可彻底反转其电荷分布：蒙科维奇等指出，苯环密集的π电子云使其中心带负电，而全氟苯的π云被吸电子氟拉扯呈正电；两者形成互补四极矩，从而极易发生π–π叠加。全氟芳香族结构同时高度疏水，表现出类似”类疏水效应”的超疏水性，这意味着全氟芳香修饰的纳米粒表面对脂肪链区域具有更强的亲和力。因此，电子给出/吸引基团的引入不仅改变π–π和静电相互作用，还显著调控膜穿透和扰动能力。可见，通过化学修饰调节π体系的电子特性，是控制纳米粒膜结合方式的关键策略。磷脂分子直接互作机理及模拟/实验证据多项实验和模拟研究直接揭示了π基团与磷脂头部及尾部的相互机制。例如，阳离子吡啶苯基树枝体与含胆固醇的阴性脂质体研究发现：带高离子度外围（如D3^50+、D2^29+）的树枝体通过纯静电作用吸附于脂质体表面，这种结合可被盐洗脱，且不进入疏水层、对膜无破坏作用。相反，次生带负载（D2^15+）的树枝体在参与静电结合的同时，其内部苯基环还深入脂质尾部区与烷基链相互作用，形成难以逆转的缺陷。更极端的是小代（D1^6+），其高度疏水刚性结构直接破坏了膜结构，使脂质体崩解。这些结果强调了分子层面不同相互作用的协同效应。类似地，模拟研究也印证了π体系作用：All-atom MD显示，纯疏水的芳香聚合物纳米点（polydot）能自发穿透DPPC膜，而表面带羧基负电的polydot则被阻留在膜面。具体地，”不带电的芳香族polydot自发渗透膜，而羧基化的polydot需要外力才能进入膜内”。此外，石墨烯氧化物（GO）等二维π体系也与磷脂头区通过静电吸附，与尾区通过范德华力结合。一项Langmuir单层研究发现，GO同时插入DPPC的脂肪链、头部及水相中，其结合既有静电又有分散作用（类似CH/π与疏水作用）。综合来看，这些建模与实验结果从多角度验证了π相互作用在粒子–膜结合和扰动中的关键角色。电子效应调控的实验与模拟支持除上述具体实例外，还有不少研究通过改变π系统电子性质来测试膜相互作用的变化。例如，弗氟富化策略常用于调节π表面的极性和疏水性。蒙科维奇等的综述指出，全氟芳香体系的超疏水特征可以明显增加与脂质尾部的亲和，暗示类似改性可增强穿膜能力。实验上，对比带有不同电子属性取代基的树枝体也证实了这一点：富电子纳夫啶系树枝体导致脂肪链排列有序，而缺电子衍生物则主要作用于头部。另外，对于肽/蛋白体系，使用氟化芳香氨基酸替代技术可以区分c-π与膜插入效应，佐证了π电子密度对结合模式的影响。总体而言，既有的模拟和实验数据一致表明：通过引入电子给出/吸引基团改变π平面的极性与疏水性，确实会调控纳米粒与膜相互作用的强度和性质。其他纳米粒示例虽然上述例子主要涉及树枝状聚合物，但类似机制也见于其他芳香表面纳米粒。例如，以DPPC为模型脂质，酯芳烃聚合物(polydots)插入研究表明，无论纳米粒大小如何，其表面疏水度决定了跨膜能力。图1示例中展示了DPPC分子和聚对苯乙炔(polydot)结构，对应模拟中中性polydot穿透膜层，而阴离子端基化polydot留在膜表面。此外，类似石墨烯、纳米颗粒或有机微球等，只要表面含芳香π体系，同样可通过上述π相互作用机制调节膜结合。综上所述，不论是树枝体还是其他纳米粒，修饰不同π体系（电子云密度或取代基）均能显著影响其与磷脂分子的相互作用模式和生物界面行为。表面刚性疏水结构对膜相互作用的影响疏水”锚定”作用：研究指出，金刚烷等刚性脂环可作为脂质双层膜的”锚”。例如，Štimac等提出了”adamantane as an ‘anchor’ in the lipid bilayer“的概念，实验证实将金刚烷锚基引入脂质体后可牢固插入双层膜。类似地，带有疏水金刚烷基团的氨基脲化合物被包封在磷脂胆固醇脂质体中，其与膜的相互作用”could be ascribed mainly to the adamantane moiety“，提示金刚烷基团是驱动插入脂双层的主要因素。因此，引入刚性疏水环烃显著增强粒子与疏水膜内核的亲和力，促进吸附和插入。与此相对，未修饰或强正电荷表面的树枝状大分子往往只能通过静电吸附于膜表面而不易穿透。膜结构扰动与通透性：疏水芳香环或烯烃基团可引发双层膜缺陷和通透性改变。Efimova等系统研究发现，当树枝状大分子外围带有一定量的疏水苯基单元时，苯基与脂质烷基链发生疏水相互作用，导致双层出现不可逆缺陷。例如，对应混合性树枝体 (D₂₁₅⁺) 在磷脂体中形成双层缺陷；而高度疏水且空间刚性的G1树枝体 (D₁₆⁺) 则”caused significant destruction of liposomal membranes“。相反，完全带电的树枝体 (D₃₅₀⁺、D₂₂₉⁺) 仅通过静电吸附在膜表面，不穿透内层，也不破坏膜结构。在脂质体模型中，带有疏水金刚烷基团的胍盐化合物使膜通透率略增（诱导约15%的荧光染料泄漏），但其结合疏水尾插入膜内核后并未引起剧烈破坏。相反，一旦外源疏水域在膜内形成有序域（如四氢萘或脂链聚集），可促进脂质重组。Verma等发现，表面具有有序排列的交替疏/亲水基团的纳米颗粒能”penetrate the plasma membrane without bilayer disruption“，而随机分布的则主要被内体捕获。这说明表面刚性序列化排列有利于非内吞通道穿膜。膜蛋白/脂质重排效应：高分子–膜相互作用可诱导膜成分重排。文献指出，大分子结合膜后常伴随脂质或膜蛋白的聚集，促进脂质跨膜迁移并提高膜离子通透性。例如，AFM 实验证实，嵌入脂双层的金刚烷-肽链自发聚集成”域”（domain），将活性取代基（如糖基）暴露于膜外。这一”域”聚集机制表明，刚性疏水基团一面插入膜内，一面让亲水/活性团显示在外，可介导膜-膜间或膜蛋白识别、囊泡聚集，而无需破坏膜完整性。细胞摄取效率与途径摄取效率提高：引入疏水刚性基团通常能增强纳米粒子的细胞内化效率。树枝状大分子修饰大量疏水苯基或脂链后，整体疏水性提高，有利于跨膜扩散或内吞。例如，一项研究发现含ClPhIQ苯基配体的G4 PAMAM树枝体，其脂溶性显著上升，从而“allows for the dendrimeric molecule to pass into the cell”。相反，末端带亲水胺基的树枝体氨基质子化后很难穿透疏水膜。此外，多阳离子金刚烷基分支树枝体（HYDRAmers）在巨噬细胞和上皮细胞中表现出极高的摄取率，说明刚性疏水骨架有利于细胞吸收。内吞途径选择性：不同修饰可改变纳米粒子进入细胞的途径。Russier等报道，多阳离子金刚烷基树枝体的一/二代在不同细胞中主要通过不同途径内化：第一代主要经由clathrin介导内吞和巨胞饮，而第二代对这些通路抑制剂的敏感性明显降低。这提示，修饰基团的类型和构型可调控主要内吞途径。另有研究表明，若粒子表面排列有序，可实现部分能量无关的直接穿膜（见上文）。总体来看，正电荷和疏水性增强的粒子往往进入内体/溶酶体途径，而高度有序或超疏水表面则可能绕过传统内吞通路直接进入胞质。分子作用机理疏水相互作用：刚性疏水基团（环烃、芳香或烯烃）通过疏水嵌入膜内核，提高粒子–膜结合。例如，上述胍盐化合物表明其脂链”could interact with the lipid bilayer with hydrophobic interactions as well, and not only with electrostatic interactions“。同样，苯环单元与脂双链的强疏水相互作用可导致双层缺陷。因此，疏水相互作用是插入和膜扰动的主要驱动力。空间刚性诱导插入：刚性基团（如金刚烷笼）通过固定空间构型增强穿膜。金刚烷的笼状结构和高立体阻力使其在膜内形成稳定锚点。这种刚性使得带金刚烷的分子在膜内形成紧密”域”，难以散逸，同时将亲水部分推向膜外。与之类似，具有芳香环的刚性树枝体在插入膜时稳定性更高，可形成难逆转的膜缺陷。聚集行为：表面刚性疏水基团还可诱导纳米粒子自身和膜组分的聚集。如前述，胍盐金刚烷分子在载于脂质体后，促使互补载脂体粘附并形成多室结构。Verma等观察到的条纹状纳米粒子穿膜现象也暗示粒子可聚集形成有利于穿膜的排列。这种聚集与有序排列可改变局部膜曲率或张力，从而促进渗透。膜蛋白协同作用：虽然文献对膜蛋白特异性较少报道，但已有研究表明聚合物–膜相互作用可伴随膜蛋白的重排。例如，一些树枝体结合膜时可引起膜上蛋白和脂质的聚集。这可能意味着修饰表面基团还能影响纳米粒子与膜蛋白受体的相互作用，进而改变内吞和信号传导过程。综上所述，表面修饰的刚性脂环、芳香环或烯基通过增强疏水性和刚性，明显调控了纳米粒子与细胞膜的相互作用：它们作为膜内核的”锚”，促进纳米粒子插入和聚集，从而诱导双层膜缺陷或增强膜通透性；同时，这些修饰基团显著影响细胞摄取效率和途径，如金刚烷基树枝体可高效进入细胞并根据代数和官能团性质选择不同的内吞机制。这些发现为设计具有特定膜-粒子界面行为的表面工程纳米载体提供了指导：通过合理引入刚性疏水基团和调控其空间排列，可以实现对粒子吸附、穿膜和细胞内化路径的精确控制。

Specific Sytems · 2025-10-07

破解金属蛋白相互作用密码：新型12-6-4力场参数精准模拟金属-咪唑复合物

破解金属蛋白相互作用密码：新型12-6-4力场参数精准模拟金属-咪唑复合物本文信息标题：模拟金属-咪唑复合物 (Simulating Metal-Imidazole Complexes) 作者：Zhen Li, Subhamoy Bhowmik, Luca Sagresti, Giuseppe Brancato, Madelyn Smith, David E. Benson, Pengfei Li, Kenneth M. Merz, Jr.* 发表时间：2024年7月31日单位：密歇根州立大学（美国）、比萨高等师范学校（意大利）、洛约拉大学芝加哥分校（美国）、卡尔文大学（美国）引用格式：Li, Z., Bhowmik, S., Sagresti, L., Brancato, G., Smith, M., Benson, D. E., Li, P., & Merz, K. M., Jr. (2024). Simulating Metal-Imidazole Complexes. Journal of Chemical Theory and Computation, 20, 6706-6716. https://doi.org/10.1021/acs.jctc.4c00581 摘要金属蛋白中最常见的配位模式之一是金属离子与组氨酸咪唑侧链的相互作用。虽然之前建立的咪唑-M(II)参数通过简单调节配位原子的极化率，展示了12-6-4 Lennard-Jones(LJ)型非键模型的灵活性和可靠性，但这些参数尚未应用于多咪唑复合物体系。为了填补这一空白，我们系统地模拟了五种在金属蛋白中常见的金属离子（Co(II)、Cu(II)、Mn(II)、Ni(II)和Zn(II)）与多个咪唑分子（1-6个）形成的复合物。通过大量采样（每个PMF窗口40 ns）构建自由能关联谱（使用OPC水模型和AMBER标准HID咪唑电荷模型），并与DFT计算的平衡距离进行比较，开发了一套新的参数集，专注于多咪唑复合物的能量和几何特征。获得的自由能谱与实验结合自由能和DFT计算距离一致。为了验证我们的模型，我们展示了可以封闭第一溶剂化壳层中含有多达六个咪唑分子的金属-咪唑复合物的热力学循环。背景金属离子在蛋白质中发挥着至关重要的作用，维持着从呼吸过程到蛋白水解等细菌、植物和动物的基本功能。特定金属离子的缺失可能导致致命的缺陷，如癌变、严重营养不良，最终导致死亡。超过25%的蛋白质含有金属离子，这些离子可以发挥结构或催化作用，并且是设计新型药物制剂的靶标。为了克服这一挑战，开发了12-6-4 LJ模型，通过添加C4项来解释离子诱导偶极相互作用。离子诱导偶极相互作用与r^-4成正比，其中r是两个粒子之间的距离。研究发现，12-6-4模型可以成功地同时重现各种金属离子在不同水模型中的实验HFE和IOD。关键科学问题如何开发一套可靠的力场参数来准确描述金属离子与多个咪唑配体之间的相互作用？现有的咪唑-金属参数主要针对单个咪唑分子进行优化，当体系中存在多个咪唑配体时，这些参数的准确性和可移植性仍存在疑问。创新点扩展采样策略：首次采用每个PMF窗口40 ns的大量采样，相比传统的4 ns采样，能够捕获到关键的π-堆积中间态多咪唑体系参数化：系统地开发了适用于1-6个咪唑分子配位的金属离子力场参数热力学循环验证：通过封闭热力学循环验证参数的自洽性和可靠性发现阳离子-π堆积效应：首次在PMF计算中观察到金属离子与咪唑分子的阳离子-π堆积构象核心方法：12-6-4势函数模型本研究使用12-6-4非键模型结合AMBER力场： [U(r_{ij}) = \frac{C_{12}}{r_{ij}^{12}} - \frac{C_6}{r_{ij}^6} - \frac{C_4}{r_{ij}^4} + \frac{eQ_iQ_j}{r_{ij}}] 这个公式描述了金属离子与配体原子之间的相互作用能。第一项代表短程排斥，第二项是范德华吸引，关键的第三项捕获了离子诱导偶极相互作用，最后一项是标准的库仑静电相互作用。主要结果通过扩展采样参数化，成功开发了11种金属离子（Ag(I)、Ca(II)、Cd(II)、Co(II)、Cu(I)、Cu(II)、Fe(II)、Mg(II)、Mn(II)、Ni(II)、Zn(II)）的新力场参数，能够准确重现实验结合自由能，热力学循环平均绝对误差仅为0.61 kcal/mol。

Specific Sytems · 2025-10-07

【cell】淀粉样纤维的结构并非一成不变，而是动态演化的生命体

【cell】淀粉样纤维的结构并非一成不变，而是动态演化的”生命体” 本文信息标题: 淀粉样蛋白组装过程中纤维多态性的结构演化作者: Martin Wilkinson, Yong Xu, Dev Thacker, Sheena E. Radford, Neil A. Ranson 等发表时间: 2023年12月21日单位: 利兹大学 (University of Leeds)，英国引用格式: Wilkinson, M., Xu, Y., Thacker, D., Taylor, A. I. P., Fisher, D. G., Gallardo, R. U., Radford, S. E., & Ranson, N. A. (2023). Structural evolution of fibril polymorphs during amyloid assembly. Cell, 186(26), 5798–5811.e7. https://doi.org/10.1016/j.cell.2023.11.025 数据与代码: CryoEM数据集: EMPIAR: 11714, 11715, 11716, 11717 CryoEM电镜图: EMDB: 15696, 15728, 15729, 15730, 15731, 15753, 15754, 15755, 15756 原子坐标: PDB: 8AWT, 8AZ0, 8AZ1, 8AZ2, 8AZ3, 8AZ4, 8AZ5, 8AZ6, 8AZ7 原始数据: University of Leeds Data Repository: https://doi.org/10.5518/1230 摘要冷冻电子显微镜（cryo-EM）为我们理解包括疾病相关蛋白在内的淀粉样纤维结构提供了前所未有的视角。然而，这些已解析的结构通常代表了漫长组装过程的终点产物，它们与组装早期的纤维之间的关系仍然未知。因此，在组装过程中是否会形成具有不同结构和潜在不同病理特性的纤维，一直是一个悬而未决的问题。本研究利用cryo-EM技术，在体外解析了一种与疾病相关的人胰岛淀粉样多肽（IAPP-S20G）在纤维化过程不同时间点的纤维结构。惊人的是，在迟滞期、增长期和平台期形成的纤维具有截然不同的结构，随着纤维化进程的推进，新的构象不断出现，而另一些则会消失。对野生型hIAPP的时间序列研究也显示了类似的纤维结构随时间变化的现象，表明这是IAPP淀粉样蛋白组装的一个普遍特性。这项关于瞬时存在的纤维结构的发现，对于理解淀粉样蛋白的组装机制具有重要意义，并可能为揭示疾病中淀粉样蛋白的演进过程提供新的见解。背景淀粉样纤维的形成，被誉为“蛋白质折叠的阴暗面”，是众多人类重大疾病的共同病理标志，包括阿尔茨海默病（AD）、帕金森病（PD）以及2型糖尿病（T2D）。这些疾病的特征是，原本可溶的功能性蛋白质错误折叠，并自发聚集成不溶性的、富含标志性“交叉β-折叠”（cross-β）结构的纤维状沉积物。这一过程通常遵循一个经典的“成核-生长”动力学模型，表现为典型的S型曲线，包含反应初期的迟滞期（lag phase）、纤维快速增长的增长期（growth phase）和反应达到平衡的平台期（plateau phase）。近年来，随着冷冻电镜（cryo-EM）技术的革命性突破，科学家们解析了大量高分辨率的淀粉样纤维结构。这些研究揭示了一个惊人的事实：同一条多肽链可以折叠成多种不同的三维结构，这种现象被称为结构多态性（polymorphism）。这表明淀粉样蛋白的聚集并非简单的线性过程，而是在一个崎岖的能量景观上，通过复杂的分子事件级联发生的。不同的多态性结构（或称为“株”，strains）可能具有不同的生物毒性和传播能力，这被认为是解释同一种蛋白却能导致不同临床表型疾病（如α-突触核蛋白在PD和多系统萎缩症中的不同表现）的分子基础。然而，当前几乎所有已报道的淀粉样纤维高分辨率结构，无论是从患者脑组织中提取的（ex vivo），还是在实验室中重组的（in vitro），都只捕捉了单个时间点的快照，这个时间点通常代表了疾病的终末期或体外反应的终点。这留下了一个巨大的知识空白：在漫长的聚集过程中，纤维的结构是否始终如一？或者，是否存在一些只在特定阶段出现的、瞬时存在的中间态纤维结构？这些早期的、可能转瞬即逝的结构，是否可能具有独特的、甚至更强的生物学危害性，却因为在终点时消失而被我们长期忽略？解答这些问题对于从根本上理解淀粉样蛋白的形成机制和疾病进展至关重要。关键科学问题本研究旨在解决淀粉样蛋白领域一个长期存在且至关重要的核心问题：淀粉样纤维的结构多态性在聚集反应的整个时间进程中是恒定的，还是会随着时间动态演化？具体来说，研究团队试图通过高分辨率的结构生物学手段，直接“目睹”并回答以下几个层层递进的问题：在聚集反应的迟滞期、增长期和平台期，优势的纤维结构是否相同？是否存在一些只在特定阶段（尤其是早期）出现的瞬时纤维物种，它们在反应后期会消失或被其他结构取代？如果纤维结构确实在演化，那么这种演化遵循什么样的规律？是否存在从一种结构到另一种结构的结构谱系（structural lineages）？驱动这种结构演化的 underlying 物理化学和动力学机制是什么？是动力学控制（谁长得快谁就占优）还是热力学控制（谁最稳定谁就占优）在主导不同阶段的演化？创新点首次实现多时间点结构解析：首次通过高分辨率冷冻电镜技术，在同一聚集反应的不同时间点（迟滞期、增长期、平台期）对淀粉样纤维进行结构解析，将研究从静态终点推向了动态过程。直接证实动态演化：提供了直接的、原子分辨率的证据，证明了淀粉样纤维多态性是动态演化的，颠覆了过去将纤维视为静态终产物的传统观念。发现多种瞬时与全新结构：在IAPP-S20G的聚集过程中，总共解析了七种不同的纤维多态体结构，其中五种是全新的，并发现了一些仅在早期或中期存在的瞬时结构。提出结构演化模型：基于详实的结构和动力学数据，提出了一个整合了动力学控制和热力学驱动的纤维结构演化模型，为理解不同阶段优势多态体的转变提供了合理的机制解释。研究内容核心方法：多时间点冷冻电镜结构解析为了捕捉淀粉样纤维在组装过程中的动态变化，研究团队设计了一套严谨的实验流程。他们以与早发型2型糖尿病相关的IAPP-S20G突变体为模型，在体外进行静态孵育，模拟其自发聚集过程。时间点采样：基于硫黄素T（ThT）荧光（一种检测淀粉样纤维的常用染料）和高效液相色谱（HPLC）对反应进程的监测，研究人员精心挑选了三个代表性的时间点进行采样： 3周（迟滞期后期）：此时ThT信号很低，但已有少量可沉淀的纤维形成。 6周（增长期中段）：ThT信号快速上升，是纤维大量形成和增殖的阶段。 22周（平台期）：ThT信号达到饱和，反应进入表观上的稳态。结构解析流程：对每个时间点的样品，研究团队都进行了冷冻电镜数据采集和复杂的图像处理分析。 graph TD subgraph "实验流程" direction LR A("IAPP-S20G 单体溶液") --> B("静态孵育 (室温，pH 6.8)"); B --> C1("3周采样 (迟滞期)"); B --> C2("6周采样 (增长期)"); B --> C3("22周采样 (平台期)"); end subgraph "数据处理流程" direction LR D("冷冻制样 & Cryo-EM数据采集") --> E("2D分类 (识别不同形态的纤维)"); E --> F("3D分类 (分离不同多态体)"); F --> G("高分辨率 三维重构"); G --> H("原子模型搭建 与精修"); end C1 --> D; C2 --> D; C3 --> D; 通过对数百万个纤维片段图像进行分类和重构，他们得以在原子分辨率水平上解析出每个时间点存在的主要纤维结构。实验结果与分析：一场动态的结构演化“接力赛” 研究结果戏剧性地揭示了IAPP-S20G纤维群体的结构组成在不同阶段发生了深刻的演变，如同场上选手不断更替的接力赛。图1：淀粉样纤维多态性组装的可能模型。 (A-B) 先前研究解析的野生型hIAPP和IAPP-S20G纤维结构。(C-D) 两种理论模型：(C) 平行组装模型，不同多态体同时独立生长；(D) 序贯组装模型，一种多态体可能催化另一种的形成。下方的示意图表明，宏观的ThT生长曲线（品红色）可能掩盖了单个多态体（红色和蓝色）复杂的、截然不同的组装过程。图2：IAPP-S20G纤维群体随时间的初步表征。 (A) ThT荧光（红色）和上清液中剩余单体浓度（蓝色）的时间进程图，标示了迟滞期、增长期和平台期。有趣的是，早期聚集体对ThT的响应较弱。(B) 代表性的负染电镜图像显示了3周、6周和22周时纤维形态的多样性。(C) 负染电镜图像中测量的纤维交叉周期距离分布热图，显示了不同时间点纤维形态的演变。早期（2-3周）的纤维大多是无扭曲的。迟滞期（3周）：瞬时先驱者的出现在反应的早期阶段，电镜下观察到的大部分纤维（约68%）是没有规则扭曲的直线状纤维，其结构无法通过常规的螺旋重构方法解析。然而，在剩余约32%的有规则结构的纤维中，研究人员解析出了一种全新的、从未报道过的结构。 2PFP结构：这是一种由两条原纤维（2PF）构成的纤维，每条肽链折叠成独特的P形（P-fold），因此被命名为2PFP。结构特征：它的交叉周期约为21 nm，与野生型（WT）IAPP纤维（约25 nm）相似。更有趣的是，尽管整体折叠不同，2PFP与WT IAPP纤维在残基15-28区域共享相似的主链构象，并且具有保守的原纤维间相互作用界面。图3：不同组装阶段存在不同的IAPP-S20G纤维群体。 (A) 3周、6周和22周的代表性冷冻电镜图像。(B) 每个时间点数据集的2D分类平均图，按交叉周期距离对不同的多态体进行颜色编码。(C) 精选的2D分类平均图，展示了初步识别出的不同规则纤维形式及其交叉周期。图4：Cryo-EM结构解析揭示了在组装的不同阶段，多种IAPP-S20G纤维多态体的差异性分布。 (A, E, H) 3周、6周和22周数据集中所有纤维片段的多态体分布饼图。(B, F, I) 每个多态体最终电镜密度图的切片视图。(C, G, K) 每个数据集中解析出的各多态体核心和表面视图。(D) 3周的2PFP结构（深绿）与WT IAPP的2PFS结构（浅绿）叠加，显示了它们共享的保守核心（蓝/红高亮）和相互作用界面。(J) 22周的2PFL电镜图中，清晰可见一个有序的水分子通道（红球）。这个2PFP结构是本次演化大戏的“开场角色”，但它也是一个瞬时存在的“先驱者”。增长期（6周）：多态性的大爆发到了反应的增长期，纤维的景象发生了翻天覆地的变化。 2PFP的消失：在6周的样品中，迟滞期出现的2PFP结构几乎完全消失（占比<1%）。六种新结构登场：取而代之的是一个高度复杂的混合体，研究人员从中成功解析出了四种高分辨率结构，并识别出另外两种稀有结构。这些结构可以被归类为两个主要的结构谱系（lineage）： C-谱系：基于一个共同的、由C形折叠（C-fold）肽链构成的双原纤维核心（2PFC）。这个核心可以进一步吸附新的肽链，形成三原纤维的3PFCU和四原纤维的4PFCU。其中，2PFC和3PFCU是先前研究在终点样品中发现的结构，而4PFCU是本次发现的新结构。 L-谱系：基于一个由L形折叠（L-fold）肽链构成的双原纤维核心（2PFL）。L-fold与早期的P-fold在结构上最为相似。此外，还存在一个由2PFL核心和另外两条肽链组成的四原纤维结构4PFLU。图5：纤维化时间进程中观察到的不同IAPP-S20G纤维结构和亚基折叠。 (A) 解析出的七种独特IAPP-S20G纤维结构，按其核心分为P-谱系、L-谱系和C-谱系。(B) 五种不同的亚基折叠构象：P-fold, L-fold, C-fold, U-fold, 和 J-fold。(C) 五种折叠在保守区域的叠加。(D) 2PFL和2PFP的叠加，显示了它们虽然共享一个相似的链构象，但第二条链的堆叠方式完全不同，形成了不同的纤维架构。(E, F) L-谱系和C-谱系内部各成员的叠加，显示它们共享一个保守的2PF核心。在这一阶段，2PFC和2PFL是两种最主要的结构，各占约30%，而由它们衍生出的更大结构（3PF和4PF）占比较低。平台期（22周）：向更大、更稳定的结构成熟当反应进入平台期，纤维群体的多样性再次降低，显示出一种“优胜劣汰”的成熟过程。瞬时物种的淘汰：增长期出现的2PFC和3PFCU结构完全消失。优势物种的富集：L-谱系的2PFL和4PFLU的比例显著增加，分别达到43%和19%，成为绝对的优势物种。C-谱系中只有最大的4PFCU得以保留（15%）。新结构的发现：由于4PFLU的富集，研究人员得以解析其高分辨率结构。此外，还发现了一个占比仅2%的、结构更为独特的四原纤维结构4PFLJ，其外部两条肽链呈现一种全新的J形折叠（J-fold）。图6：IAPP-S20G纤维多态体在组装时间进程中的结构成熟总结。 (A) 各多态体在不同时间点的分布百分比，背景为ThT荧光曲线。(B) 各亚基折叠类型在不同时间点的分布。(C) 负染电镜测量的交叉周期分布，显示纤维整体上变得更“长”（交叉周期更大）。(D) 不同尺寸（2PF, 3PF, 4PF）纤维的分布，显示了从2PF向4PF的转变。(E) 基于结构计算的每层纤维的平均自由能（ΔG°/layer），显示了随着时间推移，纤维整体变得更稳定。(F) 各谱系在不同时间点的演化示意图。总的来看，整个聚集过程呈现出一个清晰的演化趋势：从早期形成的、较小的（2PF）、动力学上优先的瞬时结构，演变为中期的多样化结构混合体，最终成熟为尺寸更大（4PF）、热力学上更稳定的少数优势结构。结果逻辑与机制推演为了解释这种复杂的结构演化现象，研究者提出了一个基于动态变化的动力学景观的模型。图7：IAPP-S20G多态体演进的卡通总结与提出的不同组装阶段动力学景观机制。 (A) 结合了结构信息的ThT曲线，展示了不同阶段的物种比例。(B) 基于结构和出现顺序提出的潜在组装路径示意图。该模型假设了亚基的逐步吸附（accretion）机制，即在已形成的2PF核心上添加新的肽链形成3PF和4PF结构。(C) 不同组装阶段的示意性能量景观图。在迟滞期，能量景观可能比较简单，2PFP是动力学上最容易形成的低谷。进入增长期，随着纤维表面的出现，由二次成核主导的路径被激活，能量景观变得复杂，出现了多个能量相近的低谷（C-谱系和L-谱系）。在平台期，反应趋于平衡，体系缓慢地向能量更低的、更稳定的4PF结构演化。 graph LR subgraph "迟滞期 (Lag Phase)" direction LR Monomer("单体 (高浓度)") --"初级成核 (动力学控制)"--> Untwisted("无扭曲纤维 (结构未知, 68%)"); Monomer --"初级成核 (动力学控制)"--> P_2PFP("2PFP (P-fold, 32%) **瞬时先驱**"); end subgraph "增长期 (Growth Phase)" direction LR FibrilSurface("纤维表面 (低单体浓度)") --"二次成核 (动力学/热力学竞争)"--> L_Lineage("L-谱系 2PFL (30%) 4PFLU (4%)"); FibrilSurface --"二次成核 (动力学/热力学竞争)"--> C_Lineage("C-谱系 2PFC (30%) 3PFCU (10%) 4PFCU (7%)"); end subgraph "平台期 (Plateau Phase)" direction LR Equilibrium("长时间孵育 (热力学驱动)") --> Final_L("L-谱系主导 2PFL (43%) 4PFLU (19%) 4PFLJ (2%)"); Equilibrium --> Final_C("C-谱系残留 4PFCU (15%)"); end P_2PFP --"消失"--> FibrilSurface; L_Lineage --"成熟/富集"--> Final_L; C_Lineage --"部分消失，部分富集"--> Final_C; 这个模型的核心思想是，驱动纤维形成的微观机制在不同阶段是不同的。在迟滞期，单体浓度高，纤维浓度低，初级成核占主导，这有利于形成那些成核势垒最低、形成速度最快的结构（如2PFP）。进入增长期后，大量纤维表面出现，二次成核（在已有纤维表面催化新纤维的形成）成为主导，其速率比初级成核快了$10^8$倍。这开启了通往C-谱系和L-谱系的新路径，它们可能在二次成核上更具优势，从而迅速取代了2PFP。最后，在漫长的平台期，随着单体被大量消耗，反应接近平衡，热力学稳定性成为主导因素，体系缓慢地向能量更低的、由更多亚基组成的4PF结构演化。 Q&A Q1: 为什么早期的纤维（迟滞期）不怎么与ThT荧光染料结合？ A1: 这强烈暗示了早期纤维与后期纤维在结构上的根本不同。ThT染料的荧光来自于它嵌入到成熟淀粉样纤维的交叉β-折叠结构中的特定沟槽。迟滞期大量存在的无扭曲纤维和独特的2PFP结构，可能缺乏这种适合ThT紧密结合的构象，导致荧光信号很弱。这提醒我们，单独依赖ThT可能无法准确监测淀粉样蛋白聚集的全过程，尤其会低估早期物种的形成。 Q2: 文中提出的“C-谱系”和“L-谱系”是如何定义的？它们之间可以相互转化吗？ A2: 这两个谱系是根据构成其双原纤维（2PF）核心的肽链折叠方式来定义的。C-谱系的核心是两条C形折叠的肽链（2PFC），而L-谱系的核心是两条L形折叠的肽链（2PFL）。本文的叠加分析显示，每个谱系内部的更大结构（3PF和4PF）都是在共享的2PF核心上通过“吸附”新的肽链形成的。研究没有提供L-谱系和C-谱系之间直接相互转化的证据，它们似乎是在增长期通过二次成核平行出现的两条演化路径。 Q3: 为什么在反应后期，纤维会趋向于形成更大（更多原纤维）的结构？ A3: 这背后是热力学的驱动力。研究团队通过计算发现，虽然构成不同纤维的单个肽链折叠（P-fold, L-fold, C-fold等）在每个残基的平均稳定性上相差无几（约$-0.8\ \mathrm{kcal/mol}$），但由更多肽链组成的纤维（如4PF）在每一层结构上的总稳定性要显著高于较小的纤维（2PF）。因此，在反应后期，当体系有足够的时间去探索各种可能性时，它会自发地向能量更低的、更稳定的状态演化，即形成更大的4PF组装体。 Q4: 这项研究对野生型（WT）IAPP也有意义吗？它对理解人类疾病有什么启示？ A4: 是的。研究团队对WT hIAPP也进行了类似的时间序列实验，同样观察到了纤维结构随时间演变的现象，从早期的无定型结构转变为后期更均一的、有特定结构的群体。这表明纤维的动态成熟是一个普遍现象，而不仅仅是S20G突变体的特性。这对疾病研究有重大启示：在疾病的早期阶段，可能存在一些结构独特、毒性不同的瞬时纤维物种。我们目前从晚期患者身上看到的纤维结构可能只是“幸存者”，而真正的“始作俑者”可能早已消失。未来的诊断和治疗策略或许需要考虑这些早期、瞬时的病理结构。关键结论与批判性总结核心结论淀粉样纤维多态性是动态演化的：淀粉样纤维的结构在聚集过程中并非一成不变，而是经历了一个从动力学优先的瞬时物种到热力学稳定的成熟物种的复杂演化过程。瞬时纤维物种的存在：在IAPP-S20G的聚集早期（迟滞期）存在一种独特的2PFP多态体，它在反应进入增长期后几乎完全消失。结构演化的阶段性：迟滞期、增长期和平台期分别由不同结构特征的纤维群体主导，多样性在增长期达到顶峰，在平台期又趋于简化。向更大、更稳定结构的成熟：随着反应的进行，纤维组装体有明显的趋势变得更大（从2PF到4PF）和更稳定，这是由热力学驱动的。机制解释：这种演化可以通过一个动态的能量景观模型来解释，其中初级成核和二次成核在不同阶段扮演主导角色，分别青睐动力学上易于形成和热力学上更稳定的结构。批判性总结潜在影响: 颠覆性认知：这项工作从根本上改变了我们将淀粉样纤维视为静态终点的看法，揭示了其组装过程的动态性和复杂性，为整个领域提供了新的理论框架。疾病机理新视角：提示我们疾病早期可能存在独特的、具有不同病理活性的瞬时纤维物种，这可能对解释疾病的起始和早期进展至关重要。药物研发新思路：为药物开发提供了新的靶点思路。例如，可以设计特异性稳定无毒早期物种或抑制向有毒物种转变的药物，而不是仅仅靶向终末期的纤维。研究局限性: 体外研究：研究是在简化的体外缓冲液系统中进行的，缺乏细胞内复杂的环境因素（如分子伴侣、脂质膜、拥挤效应等），这些因素可能会极大地影响纤维的演化路径。转化机制未知：研究观察到了不同多态体的“此消彼长”，但无法确定其转化的具体分子机制，例如，是一种结构直接重塑为另一种，还是需要先解聚成单体再重新组装。定量分析的挑战：由于淀粉样蛋白聚集反应的随机性和异质性，精确量化不同时间点各多态体的比例仍然是一个技术挑战，文中的百分比是基于大量图像统计的近似值。未来研究方向: 实时追踪：开发能够实时、单分子水平上追踪单个纤维结构演变的技术（如结合特殊荧光探针的高速AFM或冷冻电镜断层成像），以直接观察结构转化过程。生物学相关性：研究不同时间点形成的纤维物种的生物学活性，包括它们的细胞毒性、传播能力（种子活性）以及与细胞成分的相互作用。体内验证：在细胞模型或动物模型中探究淀粉样纤维是否也存在类似的结构成熟过程，这将是验证该发现在生物学上重要性的关键一步。

Specific Sytems · 2025-10-07

Mendelevium

Contact

Specific Sytems

植物重金属解毒的分子防线：金属结合蛋白的保护机制

聚合物自组装体系的自由能面构建：从指标到景观的综合综述

从合作自组装到水溶性超分子聚合物：粗粒化模拟揭示BTA纤维的逐步生长机制

如何从头设计具有非生物催化机制的金属酶？深度学习设计锌基酮还原酶实现高效不对称合成

铁锰摇摆：超氧化物歧化酶如何通过氧化还原调谐改变金属偏好

如何设计出高对映选择性的人工金属酶？David Baker团队的从头设计尝试

高通量测量、构象动力学和机器学习怎样一起解释酶活性调控

机器学习势函数让酶反应模拟从量子精度走向分子力学速度

SuperMetal：扩散生成模型以亚埃精度预测蛋白质金属离子结合位点，无需预知离子数

ERAM让酶促反应建模真正走向多模态与任务无关

ERAM框架技术附录

透明质酸硫酸化，多糖的构象特征决定其皮肤渗透能力

透明质酸外用镇痛：联合促透剂打开皮肤屏障的新策略

酶工程新时代的基石：物理建模如何突破定向进化的天花板

甲基丙烯酸酯聚合物如何作用于细菌外膜：粗粒化分子动力学给出的四阶段机制

MetalKB：用知识驱动图框架预测蛋白金属结合位点

MetalKB：用知识驱动图框架预测蛋白金属结合位点

倾斜角的物理决定因素：从膜厚度到跨膜电位

椭球粒子更易被膜包裹？微凝胶形状与膜刚性调控细胞摄取机制

膜通透化的分子动力学模拟（上篇）：方法学与机制综述

细菌孕酮5β-还原酶的底物选择性调控与5β-二氢类固醇的高效合成

膜通透化的分子动力学模拟（下篇）：案例研究与机制解析

偶极复合驱动的聚电解质凝聚：从离子熵到相图

均聚物也能自组装：驱动力、设计策略与应用全景

透明质酸的多层次渗透增强机制：从水合膨胀到脂质双层插入

破解'聚集密码'：胰岛素-HA-聚电解质协同递送策略（下）

破解角质层的蛋白守门员：角质细胞间隙/透明质酸结合蛋白的调研（中篇）

角质层结构深度解析：从纳米脂质到宏观屏障的多尺度组织

单步O-GlcNAc标记锁定FEN1糖基化控制细胞周期

透明质酸基水凝胶胰岛素载体：技术细节与补充结果【附录】

Riff-Diff：催化基序支架实现高效从头酶设计（图解附录）

机器学习如何预测酶的催化能力：从数据到应用的系统综述

皮肤屏障的’水之道’：角质层水通道与透明质酸渗透机制（上）

透明质酸基水凝胶胰岛素载体：促进慢性伤口愈合的新型递送系统

【综述】计算酶学全景：QM/MM方法揭示催化机制、蛋白质动力学与变构调控，指导从头酶设计与共价药物开发

预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口

预反应态vs自由态：用双态MD梳理SDR“葫芦口袋”精准打开大位阻芳香酮入口（附录）

GH161家族β-葡聚糖磷酸化酶：从肠道宏基因组到催化机制的结构解析

EnzyControl：酶设计方法的技术细节与算法深解

让酶生成可控：EnzyControl为骨架生成引入功能与底物特异性

皮肤屏障的两种面孔：分子模拟揭示亲水与疏水跨膜孔道的形成机理

解码皮肤“长城”：冷冻电镜与分子模拟联手揭示皮肤屏障的原子级奥秘

Untitled

破解膜孔之谜：双CV联手揭示从成核到扩展的完整能量图景

附录A：CV设计原理与PLUMED实现的技术细节

从序列到纳米结构：FibrilGen如何让肽自组装建模变得简单

皮肤屏障的「水之道」：分子模拟揭示脂质相共存如何稳定间质水

附录：核心公式与理论推导

角质层脂质基质的动态结构缺陷与屏障功能分子机制

揭秘酒精促渗：分子模拟揭示乙醇如何打开皮肤屏障

温柔还是粗暴？揭秘两种常见表面活性剂（SDS/SLES）如何破坏你的皮肤屏障

树枝状大分子纳米粒表面与膜相互作用机理

破解金属蛋白相互作用密码：新型12-6-4力场参数精准模拟金属-咪唑复合物

【cell】淀粉样纤维的结构并非一成不变，而是动态演化的生命体