Martini 3粗粒化力场下的碳水化合物建模
本文信息
- 标题: Martini 3 Coarse-Grained Force Field for Carbohydrates
- 作者: Fabian Grünewald, Mats H. Punt, Elizabeth E. Jefferys, Petteri A. Vainikka, Valtteri Virtanen, Melanie König, Weria Pezeshkian, Maarit Karonen, Mark S. P. Sansom, Paulo C. T. Souza†, Siewert J. Marrink† (*共同第一作者,†通讯作者)
- 发表时间: 2022年
- 单位:
- University of Groningen (荷兰格罗宁根大学)
- University of Oxford (英国牛津大学)
- University of Turku (芬兰图尔库大学)
- University of Lyon (法国里昂大学)
- University of Copenhagen (丹麦哥本哈根大学)
- 引用格式: Grünewald, F., Punt, M. H., Jefferys, E. E., Vainikka, P. A., Virtanen, V., König, M., Pezeshkian, W., Karonen, M., Sansom, M. S. P., Souza, P. C. T., & Marrink, S. J. (2022). Martini 3 Coarse-Grained Force Field for Carbohydrates. Journal of Chemical Theory and Computation. https://doi.org/10.1021/acs.jctc.2c00757
- GitHub代码: https://github.com/marrink-lab/martini-forcefields
其他参考资源
- Punt, M. (2021). “Sweet” Martini 3 – Guidelines for a Transferable Sugar Model in Martini 3. Master’s Thesis, University of Groningen.
- Martini官方文档:https://www.cgmartini.nl/
概述
Martini 3是Martini力场的第三代版本,对碳水化合物的参数化进行了完全的重新优化。相比Martini 2存在的粘性效应(overaggregation),Martini 3通过改进相互作用平衡,能够更准确地描述碳水化合物体系,特别是复杂的多糖体系。
透明质酸(Hyaluronic Acid,HA,又称玻尿酸)是由N-乙酰葡萄糖胺(NAG)和葡萄糖醛酸(GlcA)通过β-1,3-glycosidic链接形成的线性多糖,是重要的生物大分子。
参数化策略
总体设计原则
Martini 3碳水化合物建模遵循三条核心映射规则:
- 最大化二醇基团:在单个珠子中包含尽可能多的二醇单元,从而最大化4:1映射(四个重原子映射到一个珠子)
- 保持官能团完整性:将官能团尽可能保持在一起,特别是当存在取代基时
- 规范化命名方向:从异头体碳(C1)开始,逆时针进行分组,确保不同糖类的等效片段生成规范命名
珠子类型(Bead Types)
| 珠子类型 | 大小 | 重原子映射比例 | 应用 |
|---|---|---|---|
| R珠子 | 常规 (σ=0.47 nm) | 4:1 | 线性、无分支结构 |
| S珠子 | 小 (σ=0.41 nm) | 3:1或4:1 | 环结构、分支结构(推荐用于单糖) |
| T珠子 | 极小 (σ=0.34 nm) | 2:1 | 芳香环堆积、紧凑结构 |
| TC4珠子 | 虚拟位点 | 无质量 | 放置在单糖环中心,增强芳香相互作用 |
参数文件说明
官方提供的 martini_v3.0.0_sugars_v2.itp 参数文件包含:
- 单糖(13种):只有
[constraints]参数,不一定有angles/dihedrals(有侧链才有?)- 包括:GLC, MAN, GAL, FRUF, LFUC, LRHA, RIBF, XYL, INO, GLA, GYN, NMC
- 二糖(3种):完整的bonds, constraints, angles, dihedrals参数
- LAC(乳糖), SUCR(蔗糖), TREH(海藻糖)
- 多糖/寡糖:未提供现成参数,需要用户按照下述参数化流程自行开发
参数化方法
为获得键合参数和分子体积,使用三种流行的原子力场:
| 糖类 | 使用的力场 |
|---|---|
| D-葡萄糖, D-甘露糖 | GLYCAM06h |
| D-核糖, D-核糖呋喃糖, D-木糖 | CHARMM36 |
| D-果糖呋喃糖 | CHARMM36 |
| N-乙酰葡萄糖胺(NAG) | GLYCAM06h |
| 葡萄糖醛酸(GlcA) | CHARMM36 |
| 肌醇 | GROMOS54a7 |
关键设置:
- 所有模拟在水中,周期边界条件
- 充分采样以获得准确的键合分布
- 从原子级轨迹映射到中心-几何(COG)位置提取珠子坐标
- 用简谐势拟合原子级分布
单糖建模
单糖映射方案
在Martini 3中,所有单糖都由三个珠子建模,分别命名为A、B、C:
- A珠子:包含异头体碳(anomeric carbon, 通常是C1),异头体氧(O1,连接到C1的羟基氧)属于A珠子
- B珠子:包含第二个二醇单元
- C珠子:包含醚氧原子(ring ether oxygen,通常是O5)

图1:单糖参数化策略
- a) 系统映射方案示例,以葡萄糖醛酸为例,展示从原子级到粗粒化的映射过程及从异头体碳C1逆时针分组的规则
- b) 单糖中所有片段的珠子类型分配,包括各功能团对应的Martini 3珠子类型及其ΔG(Oct→W)值
- c) 键合相互作用设计原则,单糖表现为刚性三角形,所有内部环约束统一缩放15%以改善SASA
N-乙酰葡萄糖胺(N-Acetylglucosamine,GlcNAc或NAG)
化学结构:$\ce{C8H15NO6}$
映射原理:原子级结构:C1-O1-C2($\ce{NHAC}$)-C3($\ce{OH}$)-C4($\ce{OH}$)-C5-O5-C6($\ce{CH2OH}$),其中O1为异头体氧,O5为环氧(ether oxygen)
粗粒化映射(四个珠子+虚拟位点):
| 珠子 | 包含原子 | 说明 |
|---|---|---|
| A珠 | C1-O1-C2 | 包含异头体碳C1和异头体氧O1 |
| B珠 | C3-C4 | 二醇单元 |
| C珠 | C5-O5-C6 | 包含环氧O5和羟甲基 |
| D珠 | N-乙酰基($\ce{NHAC}$) | N-乙酰官能团,连接到A珠(C2位置) |
| VS | 虚拟位点 | TC4类型,放置在环中心 |
珠子类型选择依据:
珠子类型的选择基于匹配全原子的分子体积和辛醇-水转移自由能。下表总结了各碎片的珠子类型分配:
| 珠子 | 碎片类型 | Martini珠子类型 | 选择依据 |
|---|---|---|---|
| A | 异头体 | SN6 | 异头体碳+O1,极性碎片 |
| B | 二醇 | SP4r | 含两个羟基的二醇单元 |
| C | 半缩醛+醚 | SP1r | 中等极性,环氧和羟甲基组合 |
| D | N-乙酰基 | SP3d | 酰胺官能团,极性 |
| VS | 虚拟位点 | TC4 | 疏水珠子,无质量,增强π堆积相互作用 |

葡萄糖醛酸(D-Glucuronic Acid,GlcA或GLA)
化学结构:$\ce{C6H10O7}$(末端葡萄糖变为羧酸)
映射原理:与葡萄糖类似,但C6($\ce{-CH2OH}$)被替换为羧基($\ce{-COOH}$)
原子级结构:C1-O1-C2($\ce{OH}$)-C3($\ce{OH}$)-C4($\ce{OH}$)-C5-O5-C6($\ce{COOH}$),其中O1为异头体氧,O5为环氧(ether oxygen)
粗粒化映射(四个珠子+虚拟位点):
| 珠子 | 包含原子 | 说明 |
|---|---|---|
| A珠 | C1-O1-C2 | 包含异头体碳C1和异头体氧O1 |
| B珠 | C3-C4 | 二醇单元 |
| C珠 | C5-O5 | 包含环氧O5 |
| D珠 | C6($\ce{COOH}$) | 羧酸官能团,生理pH下去质子化 |
| VS | 虚拟位点 | TC4类型,放置在环中心 |
珠子类型选择依据:
| 珠子 | 碎片类型 | Martini珠子类型 | 选择依据 |
|---|---|---|---|
| A | 异头体 | SP4r | 异头体碳+O1,极性碎片 |
| B | 二醇 | SP4r | 标准二醇单元,含两个羟基 |
| C | 环氧醚 | TN4ar | 环氧和邻近碳 |
| D | 羧酸根 | SQ5n(带电-1) | 生理pH下去质子化,强极性 |
| VS | 虚拟位点 | TC4 | 增强π堆积相互作用 |
实验分配系数验证(Table S2):
| 单糖 | 实验Log P | Martini 3预测(kJ/mol) | 误差(kJ/mol) | 精度评价 |
|---|---|---|---|---|
| NAG | -3.03 ± 0.34 | -16.02 ± 0.33 | 1.27 | 优秀 |
| GLA | -3.26 ± 0.11 | -18.17 ± 0.31 | 0.44 | 最优 |
两种单糖的辛醇-水分配系数预测均达到高精度,验证了珠子类型选择和非键参数的准确性。
内部环约束的15%缩放
见正文Figure 1c,2(附录)。为了准确再现碳水化合物的分子体积和溶剂可及表面积(SASA),Martini 3对单糖环内的所有键长进行了统一的15%放大处理:
- 环内键长:A-B、A-C、B-C(形成糖环的三个珠子之间的键)统一放大15%
- 糖苷键:连接两个单糖单元的键(如NAG的A珠到GlcA的B珠)不缩放,保持原始距离
- 物理意义:直接从几何中心(COG)映射会低估分子体积约8%,15%的键长放大可使CG模型的Connolly表面与全原子参考高度一致
- 适用性:这个缩放因子对所有单糖都适用,保证了模型的可迁移性
单糖内部键合
- 键合类型:使用约束(constraints)而非简谐键,因为单糖在CG层级表现为刚性三角形
- 无angles/dihedrals:单糖环内三个珠子(A-B-C)之间不需要角度或二面角参数
原始力场文件
[ moleculetype ]
; molname nrexcl
GLA 1
[ atoms ]
; nr type resnr residue atom cgnr charge mass
1 SP4r 1 GLA A 1 0 54
2 SP4r 1 GLA B 2 0 54
3 TN4ar 1 GLA C 3 0 36
; 4 SP3 1 GLA D 4 0 54
4 SQ5n 1 GLA D 4 -1.0 54 ;deprotonated at physiological pH
5 TC4 1 GLA VS 5 0 0
[constraints]
; i j funct length
1 2 1 0.376 ;15% COG scaled
1 3 1 0.335
2 3 1 0.311
3 4 1 0.222 ;unscaled, constraint because Fk > 80000
[angles]
; i j k funct angle fk
1 3 4 10 180 290
[dihedrals]
; i j k l funct angle fc
4 1 2 3 2 55 140
[ exclusions ]
5 1 2 3 4
4 2
[ virtual_sitesn ]
5 1 1 2 3
[ moleculetype ]
; molname nrexcl
GYN 1
[ atoms ]
; nr type resnr residue atom cgnr charge mass
1 SN6 1 GYN A 1 0 54
2 SP4r 1 GYN B 2 0 54
3 SP1r 1 GYN C 3 0 54
4 SP3d 1 GYN D 4 0 54
5 TC4 1 GYN VS 5 0 0
[bonds]
; i j funct length fk
1 4 1 0.339 4700 ;unscaled
[constraints]
; i j funct length
1 2 1 0.392 ;15% COG scaled
1 3 1 0.427
2 3 1 0.397
[ angles ]
; i j k funct angle fk
3 1 4 10 147 100
[dihedrals]
; i j k l funct angle fc
4 3 2 1 2 0 160
[ exclusions ]
5 1 2 3 4
4 2
[ virtual_sitesn ]
5 1 1 2 3
多糖建模

图4:寡糖和多糖的参数化策略(详细讲解见下)
- a) 复杂碳水化合物的系统化映射策略
- b) 两个连接的单糖片段之间引入的角度和二面角
- c) 三个连续单糖片段之间引入的二面角
- d) 糖苷键形成时新产生片段的珠子分配
- 第一组(1-1、1-2、1-3、1-4链接):使用SP1r珠子
- 这个珠子类型直接来自单糖中的半缩醛片段
- 已通过海藻糖和蔗糖的转移自由能验证(误差<3 kJ/mol)
- 第二组(1-5、1-6链接):使用SN6r珠子
- 与半缩醛片段类似,但一个OH被醚键取代
- SN6r的自相互作用比SP1r弱一级,反映了化学结构变化
- 特殊情况(N-乙酰神经氨酸的1-4链接):
- 将羧酸与剩余碳片段组合,避免产生键长过短的2:1映射片段
- 使用标准羧基珠子类型
糖苷键参数化
透明质酸(HA)的组成:由NAG(GlcNAc)和GlcA通过β-1,3糖苷键交替连接而成。
糖苷键的分类
Martini 3将糖苷键分为六组,根据α/β异构体和链接碳位置:
| 糖苷键类型 | 例子 | 映射方向 | 接收方珠子类型 |
|---|---|---|---|
| Class 1 | α/β-1,1 & 1,2 | 异头体相连 | T珠子 |
| Class 2 | α/β-1,3 & 1,4 | 最常见的β-1,4 | T珠子 |
| Class 3 | α/β-1,5 & 1,6 | 包括6-脱氧 | SN6r珠子(减弱相互作用) |
透明质酸中的β-1,3链接属于Class 2:这是该力场中最常见的链接类型之一。
如何确定“接收单糖单元”?
在糖苷键连接中,需要明确哪个单糖是“供体”(donor),哪个是“接收者”(acceptor):
- 规则:采用CHARMM-GUI约定,连接原子归属于CG层级中珠子编号更高的单糖单元
- 例子:乳糖(α-1,4连接的葡萄糖-半乳糖)
- 原子级连接:葡萄糖的C1连接到半乳糖的C4
- CG级连接:葡萄糖的A珠连接到半乳糖的B珠
- 糖苷醚氧原子归属于B珠(即半乳糖一侧,珠子编号更高的单元)
β-1,3糖苷键的具体连接方式
对于透明质酸的NAG-GlcA重复单元:
- 原子级:NAG的C1(异头体碳)连接到GlcA的C3
- CG级:NAG的A珠连接到GlcA的B珠
- 糖苷醚氧归属:包含在GlcA的B珠中(接收方单糖)
体积损失补偿
糖苷缩合反应使总重原子数减少1(损失一个氧原子):\(\ce{C6H12O6 + C6H10O7 - H2O -> C12H20O11}\)
Martini 3的解决方案:
- 供体单糖(提供异头体碳C1的一侧):保持原有珠子类型
- 接收单糖(通过其他碳如C3/C4接收连接的一侧):将接收糖苷键的珠子从S珠改为T珠(更小),以补偿重原子损失
具体到透明质酸:
- NAG单元(供体):A(SP1r) - B(SP1r) - C(SP1r)
- GlcA单元(接收方):A’(TP1) - B’(SP1r,包含糖苷醚氧) - C’(SQ4)
- 注意:GlcA的A’珠从SP1r改为TP1(T珠),补偿糖苷缩合的重原子损失
键合相互作用
多糖键合参数
- 糖苷键键长:从全原子参考映射获得,α和β异构体的键长明显不同,需分开处理
- Angles(键角):定义所有跨越两个单糖单元之间糖苷键的角度
- 例如:A-糖苷键-B’,B-糖苷键-A’,A-糖苷键-C’等
- 具体数值需从全原子MD模拟的分布拟合调和势获得
- Dihedrals(二面角):
- 单糖内部:使用improper dihedral(funct=2,调和势)维持环平面性
- 例如:GLA的4-1-2-3,用于保持糖环的平面构象
- 主二面角(两个单糖连接):使用proper dihedral(funct=1,周期性势函数)控制绕糖苷键的旋转(见Figure 4b)
- 对于每个糖苷键,定义一个主二面角来控制绕该键的旋转
- 二面角的具体原子选择取决于糖苷键连接类型(不同连接方式有不同的原子组合)
- 例如:LAC (β-1,4链接,糖苷键为B-A’): 主二面角为A-B-A’-B’
- 例如:SUCR/TREH (α-1,1链接,糖苷键为A-A’): 主二面角为B-A-A’-C’
- 长程二面角(三个或更多单糖连接):当连接超过两个单糖单元时,引入跨越三个连续单糖单元(n, n+1, n+2)的长程二面角,定义n和n+2残基相对于n+1残基平面的取向(见Figure 4c)
- 对于含有N个单糖的多糖链,需要定义N-2个这样的长程二面角(每个连续三联体一个)
- 例如:透明质酸(HA)的NAG₁-GlcA₂-NAG₃片段,长程二面角为B₁-A₂-B₂-A₃(从第1个残基选B珠,从第2个残基选A和B珠定义平面,从第3个残基选A珠),B₂-A₃-B₃-A₄,……
- 这类二面角对多糖刚度至关重要,尤其是在较长的碳水化合物链中
- 所有二面角参数通过匹配全原子参考模拟的构象分布获得
- 单糖内部:使用improper dihedral(funct=2,调和势)维持环平面性
- 受限弯曲势:对于被二面角势覆盖的角度,使用Bulacu等人的受限弯曲势,防止角度变为共线导致数值不稳定
特殊处理
- 葡聚糖(dextran)使用3-bonded neighbor exclusions以改善稳定性
- 其他模型仅排除1-bonded neighbors(Martini脂质标准)
- 虚拟位点的包含显著影响聚集行为和化学性质
建模流程总览
mindmap
root(碳水化合物建模)
**单糖建模**
映射策略
**从C1逆时针分组**
最大化二醇单元
保持官能团完整
珠子分配
基本3珠子:A-B-C
A珠:异头体碳+O1
B珠:二醇单元
C珠:环氧O5
侧链D珠:NAG/GLA
N-乙酰基:SP3d
羧基:SQ5n带电荷
**虚拟位点TC4**:π堆积
键合参数
Constraints:环内键
**15%键长缩放**
Improper dihedral:平面性
**多糖建模**
糖苷键规则
**糖苷醚氧归属珠子编号更高单元**
**接收方S珠改为T珠**:补偿重原子损失
α/β键长不同需分开处理
糖苷键分类
Class 1:α/β-1,1 & 1,2
Class 2:α/β-1,3 & 1,4
Class 3:α/β-1,5 & 1,6
键合参数
糖苷键:不缩放
Angles:跨糖苷键角度
主dihedral:单个糖苷键旋转
**长程dihedral:N-2个**,跨3残基
参数化流程
1.全原子MD模拟
2.映射到CG珠子
3.拟合分布获参数
**验证与应用**
验证指标
SASA:小于5%误差
转移自由能:1.5 kJ/mol
**渗透压:解决粘性效应**
应用案例
葡聚糖溶液性质
蛋白质-糖脂识别
糖蛋白/LPS体系
验证方法与应用案例
Martini 3碳水化合物力场经过验证,在多个物理化学性质和实际应用中表现优异。详细内容请参见:
验证指标概览
力场验证基于三个核心物理化学性质:
- 溶剂可及表面积(SASA)
- 15%键长缩放后,偏差 <5%(Martini 2为~8%)
- Connolly表面与全原子高度一致
- 辛醇-水转移自由能
- 平均绝对误差:1.5 kJ/mol
- 达到小分子Martini参数的精度水平
- 渗透压
- 0-1.5 molal浓度:与实验优异吻合
- 解决了Martini 2的”粘性效应”问题
应用案例概览
- 葡聚糖溶液性质:准确预测黏度、回转半径、扩散系数
- 蛋白质-糖脂识别:成功模拟LecA与GM1的特异性结合
- 糖蛋白、LPS、糖脂筏等复杂体系