Home > Techniques > AI > 生物物理学MCP服务器推荐:让AI成为科研的得力助手

生物物理学MCP服务器推荐:让AI成为科研的得力助手
MCP Model-Context-Protocol biophysics computational-chemistry PubMed arXiv AlphaFold protein-structure molecular-dynamics AI-tools

生物物理学MCP服务器推荐:让AI成为科研的得力助手

什么是MCP(Model Context Protocol)

模型上下文协议(Model Context Protocol,MCP)是Anthropic于2024年11月推出的开放标准,它定义了AI模型与外部工具或资源之间统一的双向通信协议。简单来说,MCP就像是给AI装上了“工具插件”,让它能够直接访问数据库、运行计算、调用API等,而不仅仅是根据训练数据生成回答。

对于生物物理学和计算化学研究者来说,MCP带来了以下突破:

  1. 无缝数据访问:AI可以直接从PubMed、arXiv、UniProt等数据库获取最新文献和蛋白质数据
  2. 实时计算能力:在超算平台(如NERSC的Perlmutter)上运行分子动力学模拟
  3. 智能工具编排:AI助手可以自动调用合适的工具完成复杂的研究任务
  4. 快速原型验证:系统生物学中的机理模型可以以前所未有的速度进行构建和测试

Lawrence Berkeley国家实验室的研究人员已经使用MCP连接了NERSC API、光束线知识库和X射线数据库,实现了从数据获取到超算计算的全流程自动化。

使用 Anthropic Life Sciences 插件市场

Anthropic 官方维护了一个专门的生命科学插件市场,包含多个预配置的 MCP 服务器和技能(skills),可以一键安装。

添加插件市场

/plugin marketplace add https://github.com/anthropics/life-sciences.git

可用的生命科学插件

MCP 服务器

  • pubmed@life-sciences:PubMed 文献数据库访问
  • biorender@life-sciences:BioRender 科学图表制作
  • synapse@life-sciences:Sage Bionetworks Synapse 数据平台
  • wiley-scholar-gateway@life-sciences:Wiley 学术文献网关
  • benchling-mcp@life-sciences:Benchling 实验室信息管理
  • 10x-genomics@life-sciences:10x Genomics 单细胞数据

技能(Skills)

  • single-cell-rna-qc@life-sciences:单细胞RNA测序质控分析

安装示例

# 安装 PubMed 插件
/plugin install pubmed@life-sciences

# 安装 Wiley Scholar Gateway
/plugin install wiley-scholar-gateway@life-sciences

# 安装 BioRender(科学图表制作)
/plugin install biorender@life-sciences

# 安装单细胞 RNA-seq 质控技能
/plugin install single-cell-rna-qc@life-sciences

验证插件安装

安装完成后,可以在 Claude Code 中直接使用:

请使用 PubMed 搜索关于 "CRISPR Cas9 off-target effects" 的最新文献

注意:插件市场的工具会自动添加到 Claude Code 的 MCP 配置中,无需手动编辑 mcp.json

第三方mcp安装与配置步骤

前置要求

  1. 安装uv(Python包管理器):
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
  2. 将uv添加到PATH(永久生效):
    echo 'export PATH="$HOME/.local/bin:$PATH"' >> ~/.bashrc
    source ~/.bashrc
    

安装MCP服务器

让CLAUDE CODE自己装吧,把GitHub上的安装说明扔给它就行,要不然白学cc了,哈哈。codex同理。

配置Claude Code

  1. 编辑配置文件:
    nano ~/.claude/mcp.json  # 对于Claude Code
    
  2. 添加服务器配置(参考下面的配置示例)

  3. 重启Claude Code使配置生效,可能需要退出terminal重开一个。

生物物理学研究的MCP服务器

具体介绍和安装说明详见GitHub。

一、文献数据库类

1. Reference MCP [GitHub:https://github.com/ndchikin/reference-mcp]

功能:从CiteAs和Google Scholar获取BibTeX格式的文献引用

可用工具

  • get_citeas_data:通过DOI、URL或关键词获取引用
  • get_scholar_data:搜索Google Scholar并返回BibTeX引用列表

安装方法

uv tool install reference-mcp

配置示例(添加到~/.claude.json):

{
  "mcpServers": {
    "reference-mcp": {
      "command": "uvx",
      "args": ["reference-mcp"],
      "disabled": false
    }
  }
}

实际应用:在写论文或综述时,AI可以自动获取所有引用文献的BibTeX格式,无需手动查找和格式化。

2. PubMed MCP [GitHub:https://github.com/andybrandt/mcp-simple-pubmed]

功能:访问PubMed生物医学文献数据库

核心工具

  • search_articles:支持关键词、作者、期刊、日期过滤的文献搜索
  • get_article_metadata:获取文章的标题、摘要、作者、DOI等详细信息
  • 另有14个高级工具用于更复杂的PubMed操作

安装方法

uv tool install mcp-simple-pubmed

配置示例

{
  "pubmed": {
    "command": "uvx",
    "args": ["mcp-simple-pubmed"],
    "disabled": false
  }
}

实际应用:研究角质层蛋白时,AI可以自动搜索“stratum corneum proteins intercellular space”相关的最新文献,并提取关键信息。

3. arXiv MCP GitHub:https://github.com/blazickjp/arxiv-mcp-server

功能:搜索和下载arXiv预印本

可用工具

  • search_papers:按关键词、分类(如cond-mat.soft、physics.chem-ph)搜索论文
  • download_paper:下载PDF文件到本地
  • list_papers:列出已下载的论文
  • read_paper:读取并提取论文内容

安装方法

uv tool install arxiv-mcp-server

配置示例

{
  "arxiv": {
    "command": "uvx",
    "args": [
      "arxiv-mcp-server",
      "--storage-path",
      "~/research/arxiv_papers"
    ],
    "disabled": false
  }
}

测试案例:搜索“coarse-grained molecular dynamics polymer self-assembly”,可以找到粗粒化分子动力学模拟聚合物自组装的相关预印本。

二、蛋白质结构与序列类

4. AlphaFold MCP [GitHub:https://github.com/Augmented-Nature/AlphaFold-MCP-Server]

功能:访问AlphaFold蛋白质结构预测数据库

核心能力

  • 通过UniProt ID检索结构预测
  • 按蛋白名称或基因搜索可用结构
  • 获取逐残基置信度分数(pLDDT)
  • 分析置信度分布,识别高/低置信度区域
  • 多格式下载(PDB、mmCIF)

安装方法

uv tool install alphafold-mcp-server

实际应用:研究角质层蛋白CDSN时,可以快速获取AlphaFold预测的三维结构,分析其与HA的潜在结合位点。

5. UniProt MCP [GitHub:https://github.com/TakumiY235/uniprot-mcp-server]

功能:访问UniProt蛋白质知识库

核心工具

  • 按名称、关键词、生物体搜索蛋白质
  • 获取详细的蛋白质注释信息
  • 检索氨基酸序列
  • 多蛋白比较分析

安装方法

uv tool install uniprot-mcp-server

实际应用:快速获取Kallikrein 5/7、LL-37等角质层蛋白的序列信息和功能注释。

三、化学与药物发现类

6. PubChem MCP [GitHub:https://github.com/Augmented-Nature/PubChem-MCP-Server]

功能:访问超过1.1亿化合物的数据库

强大的10+工具

  • 子结构/超结构搜索
  • 3D构象检索
  • Tanimoto相似性搜索
  • ADMET性质预测(吸收、分布、代谢、排泄、毒性)
  • Lipinski规则评估
  • 分子性质计算

安装方法

# 从GitHub安装(需要网络连接)
uv tool install --from git+https://github.com/Augmented-Nature/PubChem-MCP-Server.git pubchem-mcp-server

实际应用:研究HA衍生物的渗透性时,可以预测其ADMET性质,筛选合适的化学修饰策略。

四、代码智能与开发辅助类

7. Context7 [npm:https://www.npmjs.com/package/@context7/mcp-server]

功能:实时代码文档查询

优势

  • 快速获取最新文档:比搜索引擎更精准
  • 代码示例丰富:直接可用的代码片段
  • API文档完整:参数、返回值、用法详细说明
  • 多库支持:Biopython、Uni-Mol、MDAnalysis等分子建模工具

配置示例(需要API密钥):

{
  "context7": {
    "command": "npx",
    "args": ["-y", "@context7/mcp-server"],
    "env": {
      "CONTEXT7_API_KEY": "your-api-key-here"
    },
    "disabled": false
  }
}

实际应用:写GROMACS分析脚本时,AI可以自动查询MDAnalysis的最新API用法,避免查阅过时文档。

8. Serena [GitHub:https://github.com/oraios/serena]

功能:语义代码操作和IDE集成

核心工具

  • find_symbol:查找符号定义
  • find_referencing_symbols:查找所有引用
  • insert_after_symbol:智能插入代码

关键特性

  • 专为IDE内编码辅助优化
  • 支持VSCode、Cursor、Cline等
  • 使用语义理解而非grep式搜索
  • 避免读取整个文件,提高效率

安装方法

uvx --from git+https://github.com/oraios/serena serena start-mcp-server \
  --context ide-assistant \
  --project-from-cwd

实际应用:在大型分子动力学分析代码库中,快速定位特定函数的定义和调用位置。

完整配置示例

以下是一个适用于生物物理学研究的完整MCP配置(~/.claude.json):

{
  "mcpServers": {
    "context7": {
      "command": "npx",
      "args": ["-y", "@context7/mcp-server"],
      "env": {
        "CONTEXT7_API_KEY": "your-api-key-here"
      },
      "disabled": false
    },
    "arxiv": {
      "command": "uvx",
      "args": [
        "arxiv-mcp-server",
        "--storage-path",
        "~/research/arxiv_papers"
      ],
      "disabled": false
    },
    "reference-mcp": {
      "command": "uvx",
      "args": ["reference-mcp"],
      "disabled": false
    },
    "pubmed": {
      "command": "uvx",
      "args": ["mcp-simple-pubmed"],
      "disabled": false
    },
    "alphafold": {
      "command": "uvx",
      "args": ["alphafold-mcp-server"],
      "disabled": false
    },
    "uniprot": {
      "command": "uvx",
      "args": ["uniprot-mcp-server"],
      "disabled": false
    },
    "serena": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://github.com/oraios/serena",
        "serena",
        "start-mcp-server",
        "--context",
        "ide-assistant",
        "--project-from-cwd"
      ],
      "disabled": false
    }
  }
}

实际研究案例

案例1:角质层蛋白调研

研究目标:调研角质层细胞间隙中可能存在的蛋白质

MCP工作流

  1. PubMed搜索:AI使用search_articles搜索“stratum corneum intercellular proteins”
  2. 文献引用:通过get_citeas_data获取关键文献的BibTeX引用
  3. 蛋白质信息:用UniProt MCP查询CDSN、KLK5/7、LL-37等蛋白的序列和功能
  4. 结构预测:通过AlphaFold MCP获取蛋白质三维结构
  5. 结果整理:AI自动整理成表格,包含28种蛋白的定位、功能、与HA的相互作用

时间节省:从2-3天的手动文献调研缩短到1-2小时的AI辅助调研。

案例2:分子动力学文献综述

研究目标:撰写关于角质层脂质双层的MD模拟综述

MCP工作流

  1. arXiv搜索:搜索“stratum corneum lipid bilayer molecular dynamics”
  2. 论文下载:自动下载相关预印本PDF
  3. 内容提取:使用read_paper提取方法学细节和关键结论
  4. 引用管理:通过Reference MCP生成所有文献的BibTeX
  5. Context7辅助:查询GROMACS、LAMMPS等MD软件的最新用法

成果:快速掌握领域最新进展,避免遗漏重要文献。

其他API地址

可以直接告诉cc有这些API,让调研过程更自动化。比如想知道某蛋白的等电点但没查到,可以直接获取序列、写代码预测,一步完成。

  1. UniProt RESThttps://rest.uniprot.org/uniprotkb/{Acc}.json,快速获取任意蛋白的序列与注释。
  2. RCSB PDB RESThttps://data.rcsb.org/rest/v1/core/entry/{PDB_ID}提供文本摘要,https://files.rcsb.org/download/{PDB_ID}.pdb.cif可直接下载结构,https://search.rcsb.org/rcsbsearch/v2/query支持POST JSON条件检索(分辨率、链类型等)。
  3. PDBe APIhttps://www.ebi.ac.uk/pdbe/api/pdb/entry/molecules/{PDB_ID}返回链、序列、配体等详情,.../residue_listing/可遍历残基级信息。
  4. AlphaFold DBhttps://alphafold.ebi.ac.uk/api/prediction/{UniProt_ID}提供序列、pLDDT分布与下载链接。
  5. GlyGen/GlyCosmoshttps://api.glygen.org/protein/{UniProt_ID}可查询糖基化位点与实验证据。
  6. GlyConnecthttps://glyconnect.expasy.org/api/proteins/{ID}返回具体glycan结构(网络较慢,必要时重试)。
  7. HGNC/OMIM/NCBI Genehttps://rest.genenames.org/fetch/symbol/{symbol}可获得HGNC核心信息,其他接口需注册或API key。
  8. NCBI Entrez eutilshttps://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=protein&id=...返回蛋白摘要,efetch可抓取序列。
  9. ENA Browser/Ensembl RESThttps://rest.ensembl.org/sequence/id/{ENSEMBL_ID}?content-type=text/plain可获取DNA或蛋白序列。
  10. 化学与配体APIhttps://pubchem.ncbi.nlm.nih.gov/rest/pug/compound/cid/{CID}/JSON提供理化属性,https://files.rcsb.org/ligands/download/{Lig}.cif可下载配体结构。

总结

MCP协议的出现标志着科研AI助手从被动回答到主动工具调用的质的飞跃。对于生物物理学和计算化学研究者,合理配置MCP服务器可以:

  1. 大幅节省文献调研时间(从数天缩短到数小时)
  2. 提高数据获取准确性(直接从数据库获取,避免手动错误)
  3. 加速研究迭代速度(快速验证计算假设)
  4. 降低学习曲线(AI自动查询最新API文档)

随着MCP生态系统的不断成熟,更多专业科研工具将以MCP服务器的形式出现,真正实现“让AI成为每个研究者的虚拟博士后”的愿景。