咨询热线:025-58361106-801   18061682550        

 Email: info@njpeptide.com

中文      English

总机:025-58361106-801

传真:025-58361107-806

Email:info@njpeptide.com

地址:南京市化学工业园区方水路158号三楼


学术动态

您当前的位置:首页 > 关于我们 > 学术动态


YM说多肽:公开蛋白数据库训练 AI 模型 生成物知识产权风险何在?

使用公开蛋白质数据库训练的 AI 模型,其输出成果是否受数据库知识产权约束?这一问题直击 AI 制药领域知识产权风险的核心。
简言之,公开蛋白质数据库本身的法律约束AI 生成多肽的专利性,是两个截然不同层面的问题,其中后者风险更高,更是决定成果归属的核心关键。
两者的核心差异与关联可通过下表清晰区分:
层面 数据库的知识产权约束(输入层面) AI 生成物的专利风险(输出层面)
约束对象 对数据库本身的访问、使用和分发行为 AI 模型输出的具体多肽序列能否被认定为专利法意义上的 “发明”
主要风险 违反数据库的使用许可协议(如未按要求署名、用于禁止的商业用途等) 专利权根本不被授权,或因 AI 被视为 “发明人” 导致专利被判无效
法律依据 数据库的使用条款、开源许可协议(如 CC 协议) 专利法中关于 “发明人”“创造性” 和 “充分公开” 的要求
现状与趋势 大多数科学数据库鼓励开放共享,但要求合规使用。政策倾向于保障 “输入端” 的数据获取 法律尚不明确,存在重大不确定性,是当前争议和诉讼的焦点

核心问题详解:数据库约束可管理 AI 生成物专利性是关键挑战

数据库约束:可管理的 “准入规则”

PDB、AlphaFold DB 等主流科学数据库,设立初衷便是促进科学共享。它们大多采用开放许可(如 CC-BY 协议),这意味着只要遵守署名等基本要求,即可免费用于商业研发。
例如,欧洲 DSSP 数据库明确声明其数据 “免于所有版权限制”,可自由应用于商业用途。在中国,国家基因库生命大数据平台也作出规定,利用其公开数据产出的成果,知识产权由用户自行约定。
总而言之,只要合规使用,数据库约束本身通常不会成为成果商业化的障碍。其关键在于,使用者需仔细研读每一个数据库的 “使用条款”,确保行为合法合规。

专利性风险:AI 制药的 “阿喀琉斯之踵”

相较于数据库约束,AI 生成多肽的专利性风险才是真正的核心挑战,尤其是在多肽、抗体这类序列明确、合成相对容易的分子领域。具体风险主要体现在三方面:
  1. 发明人身份问题:专利法要求有明确的 “人类发明人”。若 AI 仅凭一个提示就生成具有突破性的多肽序列,而人类研究者仅负责执行合成验证,专利局或法院可能认定 AI 才是真正的 “构思者”,进而导致专利无效。
  2. “构思” 与 “付诸实践” 的界限问题:对于合成路径复杂的分子,人类在将数据转化为实物过程中作出的贡献,可能被视为 “构思” 的一部分。但多肽的序列本身就足以构成完整 “构思”,因此这一领域的专利风险更高。
  3. 创造性与充分公开问题:AI 生成的多肽可能被质疑不具备 “非显而易见性”,也就是专利法意义上的 “创造性”。同时,若专利申请未能充分揭示 AI 模型的训练和生成逻辑,也可能因 “公开不充分” 被驳回。

行动建议:多维度规避风险 筑牢知识产权防线

面对上述知识产权风险,相关研发团队可采取以下主动措施,提前做好防范:

行动目标

具体措施

合规使用数据库

建立数据库使用台账,记录每个训练数据源的 URL 和许可协议(如 CC-BY 4.0)。在使用成果时,严格履行署名等义务

强化人类贡献

在研发记录中,详细记载人类研究者的关键决策:如定义筛选条件、设计模型架构、对 AI 输出结果进行创造性解释与优化等。证明是人主导的 AI 辅助发明

专利策略前置

在提交专利申请前,与专利律师重点讨论如何撰写以突出人类发明步骤,并评估潜在风险。考虑对 AI 模型本身、新型多肽骨架或特定药物剂型进行并行保护

选择有利法域

关注不同国家 / 地区的司法动态。例如,美国的专利体系相对灵活,可能更早给出判例。同时,中国的司法实践也提出了在数据输入端构建合理使用制度的思路



总结:合规筑基 人类智慧赋能是破局关键

总体而言,使用公开数据库训练 AI 模型本身的风险可控,但由此生成的多肽序列能否获得稳定的专利权,是当前最大的法律不确定性所在。
未来在 AI 制药领域的胜出者,必将是那些能巧妙地将人类智慧深度融入 AI 设计循环,并能用法律语言清晰证明这一点的团队。
产品反馈单 | 尊敬的客户,如果您对南京肽业生物科技有限公司 的产品和服务有不满意的地方,请您在这里对我们的产品和服务质量进行建议、监督和投诉。