南京肽业YM说多肽|AI 驱动多肽药物开发工具初步介绍
临床前研发场景: 多肽创新药、靶向肽、多肽偶联药物 PDC、长效多肽、环肽药物
关键词:AI 工具、计算化学、自动化脚本、实验闭环
一、多肽药物开发的核心目标(AI 必须解决的 5 大成药性问题)
-
高亲和力与高选择性(不脱靶、有效结合靶点)
-
代谢稳定性(不易被酶降解、延长半衰期)
-
膜通透性(细胞穿透、口服 / 递送可行性)
-
低免疫原性与低毒性
-
可合成、可放大、可制剂
AI 工具的价值:从源头设计就把这 5 点全部纳入约束条件。
二、AI 多肽药物开发全流程工具(按研发阶段详细说明)
(一)靶点结构解析:决定药物成败的第一步
1. AlphaFold 2 / AlphaFold 3(高精度结构预测)
用途
- 预测靶蛋白(GPCR、离子通道、酶、受体)三维结构
- 预测多肽–蛋白复合物结构(AF3 最强)
- 确定结合口袋、关键残基、氢键位点、疏水区域
输出
- PDB 结构文件
- 置信度 pLDDT、PAE 图谱(判断结构可靠性)
药物开发意义
- 没有 AF,很多膜蛋白无法做多肽药物设计
- 让理性设计从 “盲猜” 变成 “按口袋设计”
2. ColabFold(轻量化快速预测)
适合:批量、快速、无 GPU 服务器团队。
3. PyMOL / ChimeraXX(结构分析与作图)
必须做
- 标注结合位点
- 测量口袋大小
- 确定多肽长度、环化位点
- 输出可用于对接的 “干净 PDB”
(二)AI 多肽序列与骨架设计(药物分子创造核心)
1. ProteinMPNN(最主流:结构 → 最优序列)
药物开发核心用途
- 给定靶点结合界面 → 自动生成高亲和力多肽序列
- 可强制约束:电荷、亲疏水性、环化位点、二硫键
- 保证多肽折叠稳定、不易降解
输出
- 50~200 条候选多肽
- 每条带稳定性评分、亲和力预测
2. RFdiffusion(从头骨架设计:无模板创新药)
最强能力
- 不需要天然多肽模板
- 直接按靶点口袋形状生成全新骨架
- 支持环肽、订书肽、二硫键肽、双环肽
药物场景
- 难成药靶点(如 KRAS、p53、转录因子)
- 高选择性、高稳定性多肽药物
3. ESM-2 / ESM3(蛋白质大模型)
用途
- 序列功能预测
- 亲和力预测
- 毒性、免疫原性、溶解度预测
- 成药性早期过滤
意义
4. PepINVENT / 非天然氨基酸设计工具
药物开发关键
- 引入 NAA、β- 氨基酸、环化、D - 氨基酸
- 提升半衰期、稳定性、细胞膜通透性
- 解决多肽药物最大痛点:易降解
(三)虚拟筛选与成药性验证(AI + 计算化学)
1. 分子对接 Docking
工具
- Schrödinger Glide(商用高精度,药企标配)
- AutoDock Vina(开源批量)
- HDock(多肽–蛋白专用)
输出指标
- 结合能(Affinity)
- 结合模式
- 氢键、疏水作用、π-π 堆积
用途
2. 分子动力学模拟 MD(判断结合稳不稳定)
工具
- GROMACS(开源、批量、快)
- Amber(高精度、药企)
- Desmond(Schrödinger,易用)
分析指标(药物研发必看)
- RMSD:构象是否稳定
- RMSF:残基柔性
- 氢键占有率
- 结合自由能分解
- 疏水性表面积
意义
3. 自由能计算(精准亲和力排名)
工具
- MM-GBSA / MM-PBSA
- FEP/TI(最高精度,用于 PCC 候选)
用途
(四)Python 自动化:药物研发的 “中枢神经”
Python 不是软件,是全流程自动化骨架。
你能用 Python 自动完成:
- 批量调用 AlphaFold / ProteinMPNN
- 批量对接、批量 MD 分析
- 自动提取结合能、RMSD、氢键、稳定性
- 自动生成实验报告、活性预测模型
- 实验数据回流 → AI 自动优化下一代序列
常用库
- Biopython:序列 / 结构处理
- Pandas:数据整理
- MDAnalysis:MD 轨迹分析
- Matplotlib/Seaborn:作图
- Scikit-learn / XGBoost:建立 QSAR 模型
- PyTorch:训练序列–活性模型
三、多肽药物开发:AI 全流程标准化步骤(最详细版)
阶段 1:靶点确定与结构解析
- 确定疾病靶点(如受体、酶、肿瘤抗原)
- 输入序列 → AlphaFold3 预测结构
- ChimeraX 分析:
- 输出:用于设计的 “干净靶点 PDB”
阶段 2:AI 多肽骨架与序列设计
-
RFdiffusion 生成适配口袋的多肽骨架
-
ProteinMPNN 生成高亲和力序列(50~200 条)
-
ESM-2 预测:
- 自动过滤,保留 50~100 条
阶段 3:虚拟筛选(计算机先做 “实验”)
-
分子对接 → 取 Top 20~30
-
分子动力学模拟(MD) → 验证稳定性
-
自由能计算 → 精准排序
- 最终选出 10~15 条进入合成
阶段 4:实验验证(湿实验)
- 多肽合成与纯化
- 亲和力检测(SPR / BLI)
- 细胞活性(IC50 / EC50)
- 稳定性测试(血浆、温度、酶稳定性)
- 选择性、毒性、免疫原性
阶段 5:AI 迭代优化(药物开发核心闭环)
- 实验数据输入 Python 平台
- AI 学习:
- 自动生成第二代优化序列
- 再次进入虚拟筛选 → 合成 → 实验
- 一般迭代 2~4 轮即可得到临床前候选药物(PCC)
四、药企最常用的黄金工具组合(直接照抄用)
结构预测:AlphaFold3 + ColabFold
AI 设计:RFdiffusion + ProteinMPNN + ESM
虚拟筛选:Schrödinger (Glide + Desmond + MMGBSA)
MD 模拟:GROMACS / Amber
自动化:Python 全流程串联
成药性优化:非天然氨基酸 + 环化策略
南京肽业YM说多肽|AI 驱动多肽药物开发工具初步介绍