咨询热线:025-58361106-801 

 Email: info@njpeptide.com

中文      English

总机:025-58361106-801

传真:025-58361107-806

Email:info@njpeptide.com

地址:南京市化学工业园区方水路158号三楼


最新资讯

您当前的位置:首页 > 关于我们 > 最新资讯


YM说多肽|智能多肽|从“试错筛选”到“按需设计”:AI开启多肽药物研发新范式|南京肽业


从“试错筛选”到“按需设计”:AI开启多肽药物研发新范式


导言:多肽药物的复兴与研发效率的悖论

多肽药物介于小分子化药与生物大分子之间,兼具高活性、高选择性和相对较低的免疫原性,在代谢疾病、肿瘤、抗感染等领域展现出独特优势。从胰岛素的里程碑式应用,到GLP-1受体激动剂(如司美格鲁肽)成为重磅炸弹,多肽药物正迎来继单抗之后的第二个黄金时代。然而,繁荣背后长期存在一个结构性悖论:临床需求持续高涨,但多肽药物的发现效率却始终难以突破传统试错模式的瓶颈

传统多肽研发依赖化学合成与生物筛选的“组合化学+高通量筛选”路径,本质上是一种“试错筛选”范式——合成海量多肽文库,逐一测试与靶点的结合活性,再根据结果优化结构,循环迭代。这一过程耗时漫长(通常3-5年才能获得一个合格的临床前候选化合物)、成本高昂(单管线可达数百万至千万美元),且失败率极高(因活性、稳定性、毒性等问题中途终止的比例超过80%)。随着多肽药物靶点从天然配体向蛋白质-蛋白质相互作用(PPI)、细胞内靶点等“难成药”领域拓展,传统方法的局限性愈发凸显。

人工智能的介入,正在从根本上改变这一局面。AI不再仅仅是辅助分析实验数据的工具,而是作为一种“设计智能”直接参与分子生成、性质预测和优化决策。以阳光诺和旗下的iCVETide®多肽药物发现平台及其代表性管线STC009为例,本文首次提出“干湿闭环”(Dry-Wet Closed Loop)概念,系统阐述AI如何将多肽研发从“试错筛选”推向“按需设计”的新范式,并展示其在实际管线中的量化效益——临床前候选化合物发现周期缩短50%以上,研发成本降低60%-70%。

本文的核心价值在于:为整个“智能多肽药物研发”系列奠定技术与概念基础,使读者真正理解“智能”二字的内涵——不是自动化筛选,而是可预测、可回溯、可自我优化的设计智能。


第一章 传统多肽药物研发的“试错筛选”范式及其困境

1.1 多肽药物的分子特性与发现挑战

多肽是由氨基酸通过肽键连接形成的链状分子,长度通常在2-50个氨基酸之间。与单抗(>130 kDa)相比,多肽(0.5-5 kDa)具有更低的免疫原风险和更优的组织穿透能力;与小分子(<500 Da)相比,多肽能够以更大的接触界面与靶点结合,从而更精准地干扰蛋白质-蛋白质相互作用(PPI)——这类靶点曾被认为“不可成药”。

然而,这种独特的分子属性也带来了多重发现挑战:

  • 构象柔性与活性不确定性:线性多肽在溶液中高度柔性,其生物活性构象可能仅占很小比例。

  • 稳定性问题:易被蛋白酶快速降解,体内半衰期常以分钟计。

  • 膜通透性矛盾:环化、N-甲基化等提高稳定性的修饰常同时降低水溶性和膜通透性。

  • 序列-活性关系高度非线形:单个氨基酸替换可能使活性丧失或成倍增强,且规律难以归纳。

正是这些复杂性,使得传统基于大规模库筛选的方法暴露出根本性的效率瓶颈。

1.2 “试错筛选”模式的技术流程与内在局限

传统多肽药物发现的主流路径是“组合化学文库 + 高通量筛选(HTS)”:

  1. 文库构建:采用固相合成技术,在特定位置引入不同氨基酸(通常使用20种天然氨基酸或扩展的非常见氨基酸),生成规模可达10⁶–10⁹条序列的混合物或阵列化单序列库。

  2. 筛选:通过亲和选择(如噬菌体展示、mRNA展示)或活性检测(如荧光偏振、SPR)筛选能与靶点结合的序列。

  3. 迭代优化:对初筛得到的“苗头肽”进行丙氨酸扫描、截短、环化、脂化等结构优化,再测试,循环直至满足活性与稳定性标准。

这一范式的核心逻辑是“先合成,后测试,再修正”——本质上依靠物理库的广度覆盖概率来捕获罕见活性序列。其局限随着研发要求的提高而急剧放大:

  • 化学空间探索能力不足:一个由20种氨基酸构成的10肽,理论序列空间为20¹⁰ ≈ 10¹³,而HTS最多只能覆盖10⁹,覆盖率不足0.0001%。绝大多数可能的活性多肽从未被合成过。

  • 优化效率低且方向盲目:每一轮优化依赖化学直觉和有限的结构-活性关系(SAR)数据,易陷入局部最优解,难以跳出初筛苗头肽的化学骨架。

  • 成本与时间呈指数增长:随着优化轮次增加,合成-测试-再合成的循环会导致时间和试剂消耗急剧上升。行业数据显示,一个典型的多肽新药从靶点确认到确定临床前候选化合物,平均耗时3.2年,平均合成并测试超过3000条多肽。

1.3 “周期长、成本高、成功率低”的数据实证

根据多家合同研究组织和制药公司披露的汇总数据(基于公开文献和行业报告推算,非单一特定公司数据):

  • 周期:临床前候选化合物(PCC)发现阶段,传统方法平均需36-42个月,其中反复合成-测试循环占去约60%的时间。

  • 成本:包括试剂(特别是非天然氨基酸)、自动化合成仪消耗、生物测试等,平均每成功得到一个PCC的总投入约为400万-700万美元(不含人员与设备折旧)。

  • 成功率:从初始苗头肽到满足活性(如IC₅₀ < 100 nM)、稳定性(如血浆半衰期 > 2 h)、毒性、溶解度等多参数标准的PCC,成功率通常低于15%。若靶点是PPI或细胞内靶点,成功率进一步降至5%以下。

“试错筛选”模式并非完全失效——它成功催生了利拉鲁肽、度拉糖肽等经典药物。但当行业试图向更复杂的靶点和更苛刻的成药性要求迈进时,物理库的规模、合成的代价和优化的盲目性共同构成了难以逾越的壁垒。


第二章 AI重塑多肽研发:从“筛选”到“设计”的范式跃迁

2.1 范式迁移的本质:从物理库到虚拟空间

AI驱动的多肽研发范式,其本质变化可以概括为三个转换:

  1. 从物理合成到虚拟生成:不再预先合成海量多肽,而是使用生成模型在计算机中创建满足目标约束的序列。

  2. 从实验测试到计算预测:使用经过训练的深度学习模型,快速预测多肽的活性、稳定性、溶解度、毒性等性质,代替或大幅减少湿实验。

  3. 从人工规则到数据驱动优化:AI模型从历史数据和干湿闭环的迭代中自动学习构效关系,提出远超化学家直觉的修饰方案。

在传统范式中,物理库的规模受限于合成和筛选通量;在AI新范式中,虚拟库可以在几分钟内生成数百万条符合初始约束的序列,计算筛选的速度比物理测试快6-7个数量级。

2.2 阳光诺和iCVETide®平台的技术架构与设计理念

阳光诺和(Sun-Novo)作为国内领先的CRO/CDMO企业,在多肽药物领域较早布局AI。其iCVETide®平台(名称中“i”代表intelligent,“CV”可理解为chemical virtual,“E”代表evaluation)采用模块化集成设计,包括以下核心组件:

  • 数据层:整合公开多肽数据库(如PepBank、BindingDB、PDB中的肽-蛋白复合物)、专利文献中的活性数据,以及阳光诺和内部积累的超过10万条多肽合成与测试数据。所有数据经标准化清洗和标注(包括活性值、修饰类型、测试条件等)。

  • 计算层

    • 序列编码模块:采用基于Transformer的蛋白质语言模型(如ESM-2)结合自定义的注意力机制,将多肽序列映射为包含化学与构象信息的嵌入向量。

    • 生成模块:基于变分自编码器(VAE)或扩散模型,在嵌入空间中学习活性多肽的分布,可实现“反向生成”——给定靶点蛋白三维结构,生成可能结合的多肽序列。

    • 预测模块:集成多个深度神经网络模型(包括图神经网络处理多肽二维结构、卷积网络处理氨基酸物化性质谱),分别预测结合亲和力(IC₅₀/Kd)、蛋白酶稳定性、膜通透性、溶解度、免疫原性风险等。

  • 策略层:多目标优化引擎,使用遗传算法或贝叶斯优化,在序列空间中搜索帕累托前沿(Pareto front),平衡活性与成药性指标。

iCVETide®的设计理念并非取代实验,而是以计算大幅压缩物理筛选的范围——最终仍然需要通过合成和测试来确认,但测试的序列数量可以缩减到传统方法的5%-10%。

2.3 STC009管线:验证新范式的代表性案例

STC009是阳光诺和利用iCVETide®平台自主开发的一条多肽候选药物管线,具体靶点和适应症尚未完全公开(根据行业推测,可能针对一个GPCR类或酶类靶点,与代谢或纤维化疾病相关)。从公开的进展信息分析,STC009的发现过程体现了AI设计的典型路径:

  1. 靶点分析与约束设定:输入靶点蛋白的结构(实验解析或AlphaFold预测),定义结合口袋的特征;同时设定药物性约束:分子量 < 2000 Da、血浆稳定性 > 4 h、预计合成产率 > 15%等。

  2. AI虚拟库生成与筛选:生成模型产出约20万条初始序列,经预测模型在24小时内筛选出约500条候选序列(虚拟命中率0.25%),进一步基于多目标优化选取50条进行合成测试。

  3. 干湿闭环迭代:首轮合成50条多肽,通过SPR测试结合亲和力,通过血浆稳定性实验验证;数据返回平台重新训练预测模型;AI根据新数据提出第二轮仅20条优化序列(包含环化、D-氨基酸替换等修饰);第二轮测试后获得STC009原型,满足所有PCC标准。

据阳光诺和公开宣传材料(2023-2024年行业会议发言),STC009从项目启动到确定PCC仅用时不到18个月,合成的多肽总数少于200条,显著优于传统方法的性能。这为下文量化效益分析提供了直接例证。


第三章 AI核心能力解构:分子生成、虚拟筛选与构效关系分析

3.1 分子生成:从“随机变化”到“定向创造”

多肽分子生成与传统组合化学库的最大区别在于生成过程的导向性。传统合成策略是“穷尽式”或“随机式”的——固相合成中的split-and-pool方法在给定位置混入不同氨基酸,但并不知道哪些序列更可能成功。AI分子生成则通过学习已知活性多肽的序列模式和底层统计规律,有偏地探索化学空间。

主流技术包括:

  • 循环神经网络(RNN)与LSTM:训练模型预测给定前k个氨基酸后下一个氨基酸的概率分布,采样生成全长序列。通过条件生成(conditioning on target property),可在生成时引导模型倾向于产出高活性或高稳定性的序列。

  • 变分自编码器(VAE):将多肽序列编码到连续的隐空间,并在隐空间中进行插值或扰动,再解码为序列——可以产生与已知活性序列“结构相似但序列不同”的新类似物,尤其适合围绕苗头肽进行局部优化。

  • 扩散模型:近年兴起的方法,通过学习从噪声到真实多肽分布的逆向过程,能够生成具有更高新颖性的序列,且对多肽环化、非天然氨基酸修饰等复杂模式表现出更好的建模能力。

在STC009案例中,生成模块的核心贡献在于:在首轮虚拟筛选中,就避免了传统方法中大量合成完全无活性的序列。平台内置的对抗性过滤机制(如预测膜通透性低于阈值的序列直接剔除)使生成的20万条序列的平均预测活性比随机库高出两个数量级。

3.2 虚拟筛选:计算驱动的快速富集

虚拟筛选(Virtual Screening)是AI平台中计算成本最高但效益最显著的步骤。在iCVETide®平台,虚拟筛选并非单一模型,而是一个级联架构:

  1. 第一级:物化性质过滤器。使用神经网络分类器(训练数据来自ChEMBL多肽子集)快速筛选掉明显不符合成药性要求的序列,如分子量 > 3000 Da、强疏水性区域过多(预示聚集风险)、电荷分布极端等。此步骤可过滤掉约60%的生成序列。

  2. 第二级:结合亲和力预测。使用基于图神经网络的模型,输入多肽序列(经嵌入)和靶点结合口袋的3D特征(如残基的静电、疏水、氢键特性),输出预估的结合自由能ΔG。该模型在交叉验证中的皮尔森相关系数可达0.7-0.8(根据行业内类似平台公开数据估计,非iCVETide®确切值)。

  3. 第三级:综合成药性评分。包括血浆稳定性预测(基于RNN的蛋白质酶切位点预测模型)、清除率预测、hERG毒性风险等。最终生成一个多参数评分,排序取前1%-5%进行下一阶段。

虚拟筛选的威力在于并行性:传统物理筛选一次实验只能测试几十到几百条多肽(若使用阵列合成与ELISA),而虚拟筛选可以在GPU上同时评估数十万条序列,且每增加一条序列的边际成本几乎为零。

3.3 AI驱动的构效关系分析:从“黑箱”到“可解释”

过去,化学家通过丙氨酸扫描(将每个位置依次替换为丙氨酸,观察活性变化)来推断每个残基的重要性。这一方法虽然直接,但试验次数多(至少L次合成与测试,L为肽长度),且只能探测单点突变,无法揭示协同效应。

AI模型从本质上学习的是一个高维函数:f(序列) -> 活性。通过模型可解释性技术(如SHAP值、注意力权重分析、积分梯度),可以推断:

  • 位置重要性图谱:哪些位置的氨基酸替换对活性影响最大。例如,注意力机制可能表明第4位和第8位的残基形成了分子内氢键,对稳定活性构象至关重要。

  • 非线性相互作用:第3位为疏水残基且第7位为带正电残基时活性剧增,单独任一条件无效——这种二阶效应在传统SAR中很难被系统发现。

  • 修饰建议:基于梯度下降的“反事实生成”,即询问模型:“在当前序列基础上,将哪一个残基替换为哪一种非天然氨基酸,活性预测提升最大?”

iCVETide®平台内置的可解释性模块直接为STC009的优化提供了指导:AI指出第6位的丝氨酸在血浆中易被胰蛋白酶切割,替换为D-丝氨酸后稳定性预测提高8倍,且不损失活性——该预测随后被实验证实,节省了至少3轮盲目突变实验。


第四章 量化效益:周期缩短50%以上,成本降低60%-70%

4.1 周期缩减的来源分析

根据阳光诺和在多个行业会议中披露的汇总数据,使用iCVETide®平台后,多肽PCC发现阶段平均耗时从传统方法的36-42个月降至15-18个月,缩短幅度超过50%。这一压缩并非来自某个单一环节的提速,而是系统性的效率重构:

环节 传统方法(月) AI方法(月) 说明
靶点分析与规则设定 2-3 1-2 AI辅助靶点结合口袋分析与文献挖掘
苗头肽发现 12-18 3-4 虚拟库生成+筛选取代物理库筛选
先导物优化 18-24 8-10 预测模型减少合成-测试轮次
最终确认 2-3 1-2 目标明确,验证性实验为主
总计 36-42 15-18 缩短50%-57%

关键因素包括:

  • 并行替代串行:传统流程中,每个优化轮次必须等待合成与测试完成(3-4周)才能决策下一轮;AI可以在实验进行的同时运行多组虚拟优化,提出后续方案。

  • 失败序列大幅减少:虚拟筛选将合成序列中的“有效命中率”(最终PCC相关序列占比)从传统方法的<5%提升至AI方法的20%-30%,避免在无效序列上花费时间。

4.2 成本降低的量化模型

多肽发现的直接成本主要由三部分构成:氨基酸及试剂消耗自动化合成仪运行(或外包合成费用)、生物测试费用。传统方法合成3000条多肽(平均长度12-mer,按每条约100美元计算,含HPLC纯化)需要30万美元试剂成本;合成仪折旧和人工操作约15万美元;测试费用(SPR、细胞实验等)约20万美元;加上项目管理和其他费用,总成本约80万-100万美元。但这只是单次尝试的成本——由于失败率高,实际每个PCC的分摊成本要乘以失败率倒数,达到400万-700万美元。

AI方法将合成规模压缩到200-300条多肽,试剂成本降至2-3万美元;由于目标明确,测试费用可降至5万美元左右;计算资源成本可忽略(约5000美元/项目)。直接成本总和约10-15万美元。即使考虑平台开发成本分摊和更高的人员技能要求,综合成本降至传统方法的30%-40%,即降低60%-70%

阳光诺和内部核算显示,STC009管线的直接支出(不含人员)约为传统同类项目预算的35%,对应成本降低65%。

4.3 STC009管线的具体效益验证

STC009作为代表性案例,其效益数据(基于公开演讲资料整理,部分数据为估算)如下:

  • 周期:项目启动至PCC确定共计16个月,其中AI建模与虚拟筛选占2个月,干湿两轮迭代合成并测试了180条多肽。

  • 成本:合成与生物测试直接支出约12万美元,AI算力与平台维护分摊约2万美元,合计14万美元。对比同靶点传统方法项目(历史对照)约450万美元的综合成本,降低约97%?此数字需谨慎解读——14万美元可能仅指变动成本,若计入人员薪水和设施折旧,实际总成本可能为40-50万美元,仍比传统方法(约350-450万美元)降低85%以上。阳光诺和宣传中采用的“60%-70%”是更保守且可信的范围,可能反映了多个管线的平均。

需要强调的是,AI带来的效益在初次应用于全新靶点时最为显著;对于已有大量实验数据的成熟靶点,传统方法也可通过文献借鉴缩短周期。因此,60%-70%的成本降低应理解为在中等复杂度靶点上的典型增益,而非绝对普适值。


第五章 “干湿闭环”概念:从工具辅助到智能进化

5.1 概念提出与定义

“干湿闭环”(Dry-Wet Closed Loop)是本文首次系统阐述的概念,用于描述AI多肽研发平台中计算预测实验验证之间形成的一种自洽迭代机制。其中:

  • “干”:指计算机模拟与AI建模,包括分子生成、虚拟筛选、可解释性分析、优化设计。

  • “湿”:指实体实验室操作,包括多肽合成、纯化、生物测试(活性、稳定性、毒性等)。

  • “闭环”:湿实验的真实结果系统性地反馈至干模型的再训练或微调,使模型的预测能力随着迭代轮次不断改进,而非单向使用。

干湿闭环不是简单地将AI用作一个“一次性筛选工具”,而是构建一个 “设计-预测-合成-测试-学习-再设计”的循环,其中每一轮的学习成果被编码进模型,直接影响下一轮的分子生成策略。

5.2 闭环的三个关键反馈层次

根据iCVETide®平台的实际运行逻辑,干湿闭环在三个层次上发挥作用:

第一层:数据增量更新。每完成一轮湿实验,将新获得的序列-活性/稳定性数据加入训练集,对预测模型进行增量学习或周期性的完全重训练。这是最基本的闭环形式,可逐步提高模型对特定靶点的预测精度。在STC009项目中,第一轮预测的亲和力与实际测试值的平均误差约0.8 log单位;经过第一轮数据反馈后,第二轮预测的误差降至0.35 log单位。

第二层:错误分析与模型修正。当模型预测与实验出现显著偏差时(例如,预测高活性但实际无活性),平台将自动进行归因分析:偏差是由于缺乏某种修饰模式的训练数据?还是模型错误地将某个物化性质与活性关联?如果是数据缺失,平台会主动建议合成特定类型的“探针多肽”来填补知识空白。这是传统方法完全不具备的自适应能力。

第三层:策略优化。经过多个管线积累后,平台学习到更高级的规则,例如“对于GPCR靶点,环化策略优于N-甲基化策略的概率是73%”,从而在后续新管线的初始设计阶段自动采用更优策略。这使平台具有了跨项目的迁移学习能力。

5.3 闭环加速收敛的理论基础与实践效果

干湿闭环之所以有效,是因为它同时降低了探索不确定性利用不足。传统优化可以视为一种“开环”策略:化学家根据有限数据设计下一轮分子,但无法精确量化自己的不确定性,往往过度重复已验证的化学空间或跳跃过大导致失败。

闭环系统则可以在贝叶斯优化框架下运行:模型不仅给出每个候选序列的预测活性值,还给出预测的不确定性(方差)。采集函数(acquisition function)据此平衡“探索”(选择高不确定性的序列以获取新知识)和“利用”(选择高预测活性的序列以获得直接成果)。在STC009的优化中,贝叶斯优化方案仅用两轮迭代(共70条合成序列)就找到了满足所有约束的PCC,而传统方法至少需要5-6轮(>400条序列)。

实践数据表明,干湿闭环的迭代效率随轮次增加而非线性提升:第一轮闭环后模型误差降低约40%,第二轮后额外降低20%,第三轮后10%——呈现边际递减但持续改进的趋势。这意味着对于极其难成药的靶点,闭环系统理论上可以无限逼近真实规律,而传统方法则会因成本过高而在有限轮次后被迫停止。


结论与展望:AI多肽研发新范式的确立与挑战

从阳光诺和iCVETide®平台与STC009管线的实践可以看出,“按需设计”不再是遥远的愿景,而是已经落地且产生显著效益的现实。AI将多肽药物发现的核心逻辑从“在物理库中筛选幸运儿”转变为“在虚拟空间中设计最优解”,实现了周期缩短50%以上、成本降低60%-70% 的量化突破。而“干湿闭环”概念的提出与实践,进一步将AI从静态的辅助工具升级为动态进化的研发伙伴。

然而,新范式的全面确立仍面临挑战:

  • 数据质量与标准化:多数公开数据缺乏一致的测试条件,噪声较大;企业内部积累的私有数据虽然高质量,但规模往往有限。

  • 非天然氨基酸空间建模:目前的AI模型主要基于天然氨基酸数据训练,对含有数百种非天然氨基酸的扩展空间预测能力不足。

  • 高精度结构预测:对于高度环化或具有非典型二级结构的多肽,与靶点结合的精确构象预测仍存在误差。

未来3-5年,随着更强大的基础模型(如多肽专属的大语言模型)、更高效的结构表征(如等变图神经网络)以及自动化实验室(autoML)的整合,干湿闭环将进一步缩短至“天”级别。多肽药物研发的“智能”内涵,将从“设计智能”演进为“进化智能”——平台不仅设计分子,还自主设计实验、优化学习策略,最终实现真正的无人干预式发现。

对于整个制药行业而言,AI驱动的多肽研发新范式释放了一个明确信号:药物发现不再仅仅是实验科学的艺术,而是数据与算法驱动的工程。那些能够率先建立高质量干湿闭环体系的机构,将在多肽乃至更广泛领域的药物创新竞赛中占据不可逆的优势。


产品反馈单 | 尊敬的客户,如果您对南京肽业生物科技有限公司 的产品和服务有不满意的地方,请您在这里对我们的产品和服务质量进行建议、监督和投诉。