生物物理学MCP服务器推荐:让AI成为科研的得力助手
什么是MCP(Model Context Protocol)
模型上下文协议(Model Context Protocol,MCP)是Anthropic于2024年11月推出的开放标准,它定义了AI模型与外部工具或资源之间统一的双向通信协议。简单来说,MCP就像是给AI装上了“工具插件”,让它能够直接访问数据库、运行计算、调用API等,而不仅仅是根据训练数据生成回答。
对于生物物理学和计算化学研究者来说,MCP带来了以下突破:
- 无缝数据访问:AI可以直接从PubMed、arXiv、UniProt等数据库获取最新文献和蛋白质数据
- 实时计算能力:在超算平台(如NERSC的Perlmutter)上运行分子动力学模拟
- 智能工具编排:AI助手可以自动调用合适的工具完成复杂的研究任务
- 快速原型验证:系统生物学中的机理模型可以以前所未有的速度进行构建和测试
Lawrence Berkeley国家实验室的研究人员已经使用MCP连接了NERSC API、光束线知识库和X射线数据库,实现了从数据获取到超算计算的全流程自动化。
使用 Anthropic Life Sciences 插件市场
Anthropic 官方维护了一个专门的生命科学插件市场,包含多个预配置的 MCP 服务器和技能(skills),可以一键安装。
添加插件市场
/plugin marketplace add https://github.com/anthropics/life-sciences.git
可用的生命科学插件
MCP 服务器:
pubmed@life-sciences:PubMed 文献数据库访问biorender@life-sciences:BioRender 科学图表制作synapse@life-sciences:Sage Bionetworks Synapse 数据平台wiley-scholar-gateway@life-sciences:Wiley 学术文献网关benchling-mcp@life-sciences:Benchling 实验室信息管理10x-genomics@life-sciences:10x Genomics 单细胞数据
技能(Skills):
single-cell-rna-qc@life-sciences:单细胞RNA测序质控分析
安装示例
# 安装 PubMed 插件
/plugin install pubmed@life-sciences
# 安装 Wiley Scholar Gateway
/plugin install wiley-scholar-gateway@life-sciences
# 安装 BioRender(科学图表制作)
/plugin install biorender@life-sciences
# 安装单细胞 RNA-seq 质控技能
/plugin install single-cell-rna-qc@life-sciences
验证插件安装
安装完成后,可以在 Claude Code 中直接使用:
请使用 PubMed 搜索关于 "CRISPR Cas9 off-target effects" 的最新文献
注意:插件市场的工具会自动添加到 Claude Code 的 MCP 配置中,无需手动编辑 mcp.json。
第三方mcp安装与配置步骤
前置要求
- 安装uv(Python包管理器):
curl -LsSf https://astral.sh/uv/install.sh | sh - 将uv添加到PATH(永久生效):
echo 'export PATH="$HOME/.local/bin:$PATH"' >> ~/.bashrc source ~/.bashrc
安装MCP服务器
让CLAUDE CODE自己装吧,把GitHub上的安装说明扔给它就行,要不然白学cc了,哈哈。codex同理。
配置Claude Code
- 编辑配置文件:
nano ~/.claude/mcp.json # 对于Claude Code -
添加服务器配置(参考下面的配置示例)
- 重启Claude Code使配置生效,可能需要退出terminal重开一个。
生物物理学研究的MCP服务器
具体介绍和安装说明详见GitHub。
一、文献数据库类
1. Reference MCP [GitHub:https://github.com/ndchikin/reference-mcp]
功能:从CiteAs和Google Scholar获取BibTeX格式的文献引用
可用工具:
get_citeas_data:通过DOI、URL或关键词获取引用get_scholar_data:搜索Google Scholar并返回BibTeX引用列表
安装方法:
uv tool install reference-mcp
配置示例(添加到~/.claude.json):
{
"mcpServers": {
"reference-mcp": {
"command": "uvx",
"args": ["reference-mcp"],
"disabled": false
}
}
}
实际应用:在写论文或综述时,AI可以自动获取所有引用文献的BibTeX格式,无需手动查找和格式化。
2. PubMed MCP [GitHub:https://github.com/andybrandt/mcp-simple-pubmed]
功能:访问PubMed生物医学文献数据库
核心工具:
search_articles:支持关键词、作者、期刊、日期过滤的文献搜索get_article_metadata:获取文章的标题、摘要、作者、DOI等详细信息- 另有14个高级工具用于更复杂的PubMed操作
安装方法:
uv tool install mcp-simple-pubmed
配置示例:
{
"pubmed": {
"command": "uvx",
"args": ["mcp-simple-pubmed"],
"disabled": false
}
}
实际应用:研究角质层蛋白时,AI可以自动搜索“stratum corneum proteins intercellular space”相关的最新文献,并提取关键信息。
3. arXiv MCP GitHub:https://github.com/blazickjp/arxiv-mcp-server
功能:搜索和下载arXiv预印本
可用工具:
search_papers:按关键词、分类(如cond-mat.soft、physics.chem-ph)搜索论文download_paper:下载PDF文件到本地list_papers:列出已下载的论文read_paper:读取并提取论文内容
安装方法:
uv tool install arxiv-mcp-server
配置示例:
{
"arxiv": {
"command": "uvx",
"args": [
"arxiv-mcp-server",
"--storage-path",
"~/research/arxiv_papers"
],
"disabled": false
}
}
测试案例:搜索“coarse-grained molecular dynamics polymer self-assembly”,可以找到粗粒化分子动力学模拟聚合物自组装的相关预印本。
二、蛋白质结构与序列类
4. AlphaFold MCP [GitHub:https://github.com/Augmented-Nature/AlphaFold-MCP-Server]
功能:访问AlphaFold蛋白质结构预测数据库
核心能力:
- 通过UniProt ID检索结构预测
- 按蛋白名称或基因搜索可用结构
- 获取逐残基置信度分数(pLDDT)
- 分析置信度分布,识别高/低置信度区域
- 多格式下载(PDB、mmCIF)
安装方法:
uv tool install alphafold-mcp-server
实际应用:研究角质层蛋白CDSN时,可以快速获取AlphaFold预测的三维结构,分析其与HA的潜在结合位点。
5. UniProt MCP [GitHub:https://github.com/TakumiY235/uniprot-mcp-server]
功能:访问UniProt蛋白质知识库
核心工具:
- 按名称、关键词、生物体搜索蛋白质
- 获取详细的蛋白质注释信息
- 检索氨基酸序列
- 多蛋白比较分析
安装方法:
uv tool install uniprot-mcp-server
实际应用:快速获取Kallikrein 5/7、LL-37等角质层蛋白的序列信息和功能注释。
三、化学与药物发现类
6. PubChem MCP [GitHub:https://github.com/Augmented-Nature/PubChem-MCP-Server]
功能:访问超过1.1亿化合物的数据库
强大的10+工具:
- 子结构/超结构搜索
- 3D构象检索
- Tanimoto相似性搜索
- ADMET性质预测(吸收、分布、代谢、排泄、毒性)
- Lipinski规则评估
- 分子性质计算
安装方法:
# 从GitHub安装(需要网络连接)
uv tool install --from git+https://github.com/Augmented-Nature/PubChem-MCP-Server.git pubchem-mcp-server
实际应用:研究HA衍生物的渗透性时,可以预测其ADMET性质,筛选合适的化学修饰策略。
四、代码智能与开发辅助类
7. Context7 [npm:https://www.npmjs.com/package/@context7/mcp-server]
功能:实时代码文档查询
优势:
- 快速获取最新文档:比搜索引擎更精准
- 代码示例丰富:直接可用的代码片段
- API文档完整:参数、返回值、用法详细说明
- 多库支持:Biopython、Uni-Mol、MDAnalysis等分子建模工具
配置示例(需要API密钥):
{
"context7": {
"command": "npx",
"args": ["-y", "@context7/mcp-server"],
"env": {
"CONTEXT7_API_KEY": "your-api-key-here"
},
"disabled": false
}
}
实际应用:写GROMACS分析脚本时,AI可以自动查询MDAnalysis的最新API用法,避免查阅过时文档。
8. Serena [GitHub:https://github.com/oraios/serena]
功能:语义代码操作和IDE集成
核心工具:
find_symbol:查找符号定义find_referencing_symbols:查找所有引用insert_after_symbol:智能插入代码
关键特性:
- 专为IDE内编码辅助优化
- 支持VSCode、Cursor、Cline等
- 使用语义理解而非grep式搜索
- 避免读取整个文件,提高效率
安装方法:
uvx --from git+https://github.com/oraios/serena serena start-mcp-server \
--context ide-assistant \
--project-from-cwd
实际应用:在大型分子动力学分析代码库中,快速定位特定函数的定义和调用位置。
完整配置示例
以下是一个适用于生物物理学研究的完整MCP配置(~/.claude.json):
{
"mcpServers": {
"context7": {
"command": "npx",
"args": ["-y", "@context7/mcp-server"],
"env": {
"CONTEXT7_API_KEY": "your-api-key-here"
},
"disabled": false
},
"arxiv": {
"command": "uvx",
"args": [
"arxiv-mcp-server",
"--storage-path",
"~/research/arxiv_papers"
],
"disabled": false
},
"reference-mcp": {
"command": "uvx",
"args": ["reference-mcp"],
"disabled": false
},
"pubmed": {
"command": "uvx",
"args": ["mcp-simple-pubmed"],
"disabled": false
},
"alphafold": {
"command": "uvx",
"args": ["alphafold-mcp-server"],
"disabled": false
},
"uniprot": {
"command": "uvx",
"args": ["uniprot-mcp-server"],
"disabled": false
},
"serena": {
"command": "uvx",
"args": [
"--from",
"git+https://github.com/oraios/serena",
"serena",
"start-mcp-server",
"--context",
"ide-assistant",
"--project-from-cwd"
],
"disabled": false
}
}
}
实际研究案例
案例1:角质层蛋白调研
研究目标:调研角质层细胞间隙中可能存在的蛋白质
MCP工作流:
- PubMed搜索:AI使用
search_articles搜索“stratum corneum intercellular proteins” - 文献引用:通过
get_citeas_data获取关键文献的BibTeX引用 - 蛋白质信息:用UniProt MCP查询CDSN、KLK5/7、LL-37等蛋白的序列和功能
- 结构预测:通过AlphaFold MCP获取蛋白质三维结构
- 结果整理:AI自动整理成表格,包含28种蛋白的定位、功能、与HA的相互作用
时间节省:从2-3天的手动文献调研缩短到1-2小时的AI辅助调研。
案例2:分子动力学文献综述
研究目标:撰写关于角质层脂质双层的MD模拟综述
MCP工作流:
- arXiv搜索:搜索“stratum corneum lipid bilayer molecular dynamics”
- 论文下载:自动下载相关预印本PDF
- 内容提取:使用
read_paper提取方法学细节和关键结论 - 引用管理:通过Reference MCP生成所有文献的BibTeX
- Context7辅助:查询GROMACS、LAMMPS等MD软件的最新用法
成果:快速掌握领域最新进展,避免遗漏重要文献。
其他API地址
可以直接告诉cc有这些API,让调研过程更自动化。比如想知道某蛋白的等电点但没查到,可以直接获取序列、写代码预测,一步完成。
- UniProt REST:
https://rest.uniprot.org/uniprotkb/{Acc}.json,快速获取任意蛋白的序列与注释。 - RCSB PDB REST:
https://data.rcsb.org/rest/v1/core/entry/{PDB_ID}提供文本摘要,https://files.rcsb.org/download/{PDB_ID}.pdb或.cif可直接下载结构,https://search.rcsb.org/rcsbsearch/v2/query支持POST JSON条件检索(分辨率、链类型等)。 - PDBe API:
https://www.ebi.ac.uk/pdbe/api/pdb/entry/molecules/{PDB_ID}返回链、序列、配体等详情,.../residue_listing/可遍历残基级信息。 - AlphaFold DB:
https://alphafold.ebi.ac.uk/api/prediction/{UniProt_ID}提供序列、pLDDT分布与下载链接。 - GlyGen/GlyCosmos:
https://api.glygen.org/protein/{UniProt_ID}可查询糖基化位点与实验证据。 - GlyConnect:
https://glyconnect.expasy.org/api/proteins/{ID}返回具体glycan结构(网络较慢,必要时重试)。 - HGNC/OMIM/NCBI Gene:
https://rest.genenames.org/fetch/symbol/{symbol}可获得HGNC核心信息,其他接口需注册或API key。 - NCBI Entrez eutils:
https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=protein&id=...返回蛋白摘要,efetch可抓取序列。 - ENA Browser/Ensembl REST:
https://rest.ensembl.org/sequence/id/{ENSEMBL_ID}?content-type=text/plain可获取DNA或蛋白序列。 - 化学与配体API:
https://pubchem.ncbi.nlm.nih.gov/rest/pug/compound/cid/{CID}/JSON提供理化属性,https://files.rcsb.org/ligands/download/{Lig}.cif可下载配体结构。
总结
MCP协议的出现标志着科研AI助手从被动回答到主动工具调用的质的飞跃。对于生物物理学和计算化学研究者,合理配置MCP服务器可以:
- 大幅节省文献调研时间(从数天缩短到数小时)
- 提高数据获取准确性(直接从数据库获取,避免手动错误)
- 加速研究迭代速度(快速验证计算假设)
- 降低学习曲线(AI自动查询最新API文档)
随着MCP生态系统的不断成熟,更多专业科研工具将以MCP服务器的形式出现,真正实现“让AI成为每个研究者的虚拟博士后”的愿景。