AI 制药这些年讲过许多故事。

一开始讲虚拟筛选,后来讲分子生成,再后来讲 AlphaFold、扩散模型、蛋白设计、抗体设计、干湿闭环。每一代故事都有自己的热闹,也有自己的贫乏。热闹在于工具越来越多,贫乏在于许多工具仍然像一排分工明确的工人:有人只会做小分子,有人只会做蛋白,有人只会预测结构,有人只会打分,有人只会生成。

它们各自忙碌,却未必真正理解同一个世界。

ODesign 的野心,正在这里。

它不是简单提出一个新的蛋白设计模型,也不是再做一个小分子生成器。它试图提出一个更大的命题:

能否用一个统一模型,描述蛋白、核酸、小分子之间的 all-to-all 相互作用,并在这个统一表征空间中完成可控分子设计?

在论文中,ODesign 被定义为一个 all-atom generative world model,用于 all-to-all biomolecular interaction design。它允许用户指定任意靶点上的表位,并生成不同类型的结合分子。模型覆盖蛋白、核酸和小分子,并支持 entity、token、atom 多层级的控制。

这句话如果只按宣传语读,很容易滑过去。
但如果认真拆开,它实际上触碰了 AIDD 里一个更根本的问题:

药物设计的对象,到底是分子本身,还是分子之间的相互作用?

传统 AI 制药常常按照分子类型划分世界。

小分子是一套模型。
蛋白是一套模型。
RNA 是一套模型。
抗体又是一套模型。
多肽、环肽、核酸适配体、分子胶、PROTAC,各自再分出新的工具链。

这种划分当然有现实理由。小分子是图结构,蛋白是氨基酸序列和三维折叠,核酸有碱基配对和磷酸骨架,抗体有 CDR、FR、免疫原性和可开发性。每一种对象都有自己的语法。

但生命系统不是按模型目录运行的。

细胞里真正发生的事情,是蛋白结合 DNA,RNA 结合蛋白,小分子插入 RNA 口袋,蛋白识别代谢物,抗体结合抗原,分子胶重塑蛋白-蛋白界面。生命不是一组孤立分子,而是一张相互作用网络。

ODesign 的第一层意义,就是把设计对象从“某一类分子”推进到“某一类相互作用”。

论文中也明确指出,已有模型虽然在各自领域取得进展,例如 RFDiffusion 用于蛋白设计、ResGen 用于蛋白-小分子生成、RhoDesign 用于 RNA 设计,但这些模型难以完成跨模态推理;而生物系统本身是由蛋白、核酸、小分子、离子等多种模态共同构成的动态网络。

这才是 ODesign 所谓 “all-to-all” 的真实含义。

它不是说模型可以机械地处理更多文件格式。而是:
模型要从专门学习某类分子的形状,转向学习不同分子之间如何彼此识别。

这是一个很重要的转向。

过去我们说 AI 药物设计,往往默认“我要设计一个分子”。
而 ODesign 暗示的问题是:
我真正要设计的,也许不是分子,而是一种可编程的相互作用。

在最近的采访中,张昊天把 ODesign 放在“分子世界模型”的叙事里。他提到“分子世界本质上由不同分子组成,而分子之间的相互作用,底层共享同一套 physical law。未来理想中的模型不应只做设计,还应能做结构预测、能量预测、稳定性预测,甚至模拟热力学涨落并估计结合自由能。”

这段话容易被误解。

所谓“分子世界模型”,不是把牛顿方程、薛定谔方程、力场项原封不动塞进神经网络。那是物理模拟,不是世界模型。

更准确地说,它想做的是:

用神经网络学习一个压缩后的分子世界,使模型在这个内部世界中理解结构、界面、能量偏好和生成约束。

这个世界不是显式的 MD 轨迹,也不是传统 docking score。它更像一种 learned simulator:模型看过足够多的复合物、构象、界面、几何约束和分子语法之后,形成一个内部表征。这个表征不一定严格等价于物理方程,但如果足够好,就能在设计时给出物理上更合理的候选。

这也是为什么 ODesign 建在全原子、三维结构、距离约束和扩散生成之上,而不是只做序列语言模型。

论文中,ODesign 采用五个核心模块:Embedding Module、Conditional Module、Pairformer Module、Conditional Diffusion Module 和 OInvFold Module。它先利用条件模块编码靶点三维结构,再通过 Pairformer 建模分子间相互作用,随后通过条件扩散模块生成全原子坐标,最后用 inverse folding 模块完成序列或原子类型设计。

这套结构说明了一点:
它不是在做“文本到分子”的想象。
它是在做“结构条件下的相互作用生成”。

世界模型的核心,不是会生成。
会生成的模型太多了。
真正的问题是:生成是否服从一个可复用、可迁移、可组合的相互作用世界。

这里有一个很容易犯的错误:既然蛋白、核酸、小分子的底层物理相同,那是不是可以把它们都当成原子汤,直接统一建模?

答案是不行。

采访中提到“原子汤”这个说法,很有启发性,但原子汤如果没有语法,就只是化学泥浆。

蛋白有蛋白的语法:氨基酸、肽键、主链二面角、二级结构、疏水核心。
核酸有核酸的语法:碱基配对、碱基堆叠、糖-磷酸骨架、离子屏蔽。
小分子有小分子的语法:芳香环、手性中心、官能团、可旋转键、拓扑约束。

底层都是原子,不代表可以忽略这些高层结构单位。

ODesign 论文对此有清楚表述:不同模态分子遵循不同组成原则,小分子由原子或官能团构成,蛋白由氨基酸残基构成,核酸由核苷酸链构成。如果只使用纯原子表示,模型很难保证生成结构符合目标分子模态,也容易忽略高阶结构单元中包含的化学和生物学先验。

因此,ODesign 的关键不是“把一切都打碎成原子”,而是做了一个折中:

在底层用原子级精度建模相互作用,在上层保留不同分子模态的结构语法。

它通过 unified generative token 统一不同分子模态的最小化学单元,并用模态后缀控制设计对象:蛋白为 -P,核酸为 -N,配体为 -L。

这点非常重要。

它说明 ODesign 并不是盲目地把不同分子混在一起训练。
它实际上采用的是一种“共享主干 + 模态条件”的策略。

模型主体学习共同的三维相互作用规律。
模态 token 告诉模型当前设计对象是什么。
解码阶段再回到不同分子自己的语法中。

所以它的哲学不是“万物皆同”。
而是:

万物在底层相通,但在形式上各有戒律。

这比单纯喊“多模态”要扎实得多。

如果只看架构,ODesign 很容易被理解成“AF3-like backbone + diffusion + inverse folding”。
但它真正有意思的地方,在于任务组织方式。

论文中,ODesign 引入了任务导向的 masking 策略,把 masking 分成 All、Entity、Token、Atom 四个层级,分别对应从完整自由生成、binder design、motif scaffolding 到 atomic motif scaffolding 的不同控制粒度。

这不是普通意义上的“遮住一部分让模型补全”。
它实际上是在把分子设计任务重新表述成一种统一问题:

给定某些条件,生成缺失的相互作用对象或局部结构。

比如:

给定靶点表位,生成一个结合蛋白。
给定一个小分子官能团,生成能稳定它的蛋白环境。
给定一个功能 motif,生成包裹它的 scaffold。
给定蛋白口袋,生成结合 ligand。
给定蛋白靶点,生成 RNA/DNA aptamer。

这背后的思想很像填空题。

但普通填空题填的是词。
ODesign 填的是结构、界面和相互作用。

这也是为什么它比单任务模型更接近“世界模型”的原因。
世界模型不应该只回答一个固定问题。它应该能在同一个内部表征中接受不同条件,完成不同类型的干预和补全。

论文称 ODesign 支持 rigid-target 和 flexible-target 两种模式。前者固定靶点结构,适用于保守界面;后者只使用内部距离等软约束,允许靶点与 binder 共同调整,适用于界面更柔性的目标。

这意味着它不只是“在一个死口袋里塞东西”。
它开始承认分子识别中的构象适应性。

当然,这离真正的诱导契合、构象选择、长时间尺度动力学还很远。
但方向已经不同。

为什么这件事对 AIDD 重要?因为药物发现越来越像界面工程

过去的小分子药物设计,经常围绕“口袋”展开。
有口袋,就 docking。
没有口袋,就说 undruggable。

但今天越来越多的药物形式,已经不满足于这个逻辑。

分子胶不是简单占据口袋,而是重塑蛋白-蛋白关系。
PROTAC 不是只结合一个靶点,而是诱导三元复合物。
环肽和蛋白 binder 更像界面占位。
RNA 小分子药物面对的是高度动态的核酸构象。
抗体、TCR mimic、适配体、双抗、ADC,本质上都在操控不同层级的分子识别。

这意味着 AIDD 的核心对象正在发生变化:

从 pocket-based binding,走向 interface-programmed function。

ODesign 的价值不只在于它可以生成蛋白、核酸、小分子。
更重要的是,它尝试把这些对象放进同一个“相互作用设计空间”里。

如果这个方向成立,未来药物设计中的问题就不再是:

“我能不能为这个靶点找一个 ligand?”

而会变成:

“我能不能设计一个分子实体,去改写某个生物相互作用?”

这个分子实体可以是小分子。
可以是蛋白。
可以是核酸。
可以是环肽。
也可以是某种现在还不被传统药物分类学认真对待的中间形态。

在这个意义上,ODesign 的真正对象不是某种分子。
它的对象是可编程的分子关系

采访里最锋利的一句话是:

如果管线可以带来智能,那么世界上最大的 CRO 公司就会取代 DeepMind。

这句话当然有情绪,但也有判断。

很多 AI biotech 讲“干湿闭环”,但现实中,闭环经常变成另一种项目管理语言:
做一个管线,测一批数据,回来微调模型,再讲模型越来越聪明。

问题是,数据并不自动产生智能。

如果数据是窄的,任务是窄的,假设是窄的,那么闭环只会让模型在一个窄问题上更熟练。它可能提高某条管线的 hit rate,却不必然产生跨任务、跨模态、跨机制的科学能力。

ODesign 的作者显然更相信另一条路:
先做 AI-native 的通用模型,让模型能力本身成为平台,再反过来承接不同设计任务。

这是一条更像 DeepMind 或 Isomorphic Labs 的路线,而不是传统 biotech 的路线。

但这里也要冷静。

“不做管线”并不等于“不需要验证”。
“不以管线为中心”也不等于“实验不重要”。

世界模型如果不能被实验世界校正,最后只会在自己的梦里越来越自洽。
这恰恰是所有生成式科学模型最危险的地方。

采访他中也承认,多模态湿实验验证非常困难。不同模态的实验 protocol、体系、阳性对照、binding/function readout 都不一样,验证成本不是线性增加,而是组合爆炸。

这正是 ODesign 最大的张力:

它提出的是一个通用相互作用模型。
但它最难证明的,也正是这种通用性。

论文项目页显示,其湿实验验证目前主要集中在 protein mini-binder design,8 个靶点中有 4 个获得 pM 级别最优 binder;而其他模态任务的湿实验结果仍标注为 coming soon。

这并不削弱它的意义。
但它提醒我们:
ODesign 目前更像一个通用分子世界模型的早期原型,而不是已经完成的分子世界本身。

ODesign 论文自己也写到,模型在某些 out-of-distribution 条件下性能仍会下降,例如 DNA aptamer 设计中,随着序列长度增加,designability 下降比 RNA aptamer 更快;它也缺少对蛋白二级结构组成、小分子芳香性等属性的细粒度语义控制。

如果站在 AIDD 专业视角,我们可以说得更直接一点。

ODesign 离真正的分子世界模型,至少还差三层能力。

第一,能量一致性
模型生成的结构看起来合理,不等于自由能上真正稳定。AF3 refolding、iPTM、iPAE、PoseBusters 等指标可以筛掉一部分坏结果,但不能替代结合热力学、动力学稳定性和可开发性评价。

第二,动力学理解
真实结合不是静态拼图,而是构象集合之间的选择和转移。尤其是 RNA、小分子、分子胶、柔性环肽、PPI 界面,单一构象往往不足以描述功能。

第三,因果干预能力
设计不是生成一个“像真的”分子,而是改变一个生物系统的状态。真正的世界模型应当知道:我改这个基团、这个环、这个侧链、这个界面水网络,会如何改变结合、选择性、稳定性、毒性和功能输出。

所以 ODesign 的下一步,不应只是生成更多模态。
更关键的是把生成、预测、模拟、打分、实验反馈、可开发性约束统一起来。

论文结论中也提到,未来 ODesign 可以进一步结合 physics-informed constraints、drug-likeness priors,并与 LLM-based reasoning agents 耦合,形成 design–evaluation–update 的闭环,向自主推理型分子世界模型演化。

这句话有些宏大,但方向是对的。

一个真正的分子世界模型,不应只是会“画分子”。
它应该能提出假设,执行设计,预判风险,解释失败,并在失败中更新自己。

否则,它只是一个更大的生成器。

可以用一句话概括 ODesign 的新意:

它不是消灭分子模态,而是把模态从模型边界降级为生成语法。

过去,蛋白、小分子、RNA 是不同模型的边界。
到了 ODesign 这里,它们更像同一个模型中的不同输出语法。

底层相互作用共享。
高层分子语法区分。
设计任务通过 masking 统一。
结构条件通过三维坐标和距离约束注入。
生成过程通过扩散完成。
最终再由 inverse folding 或 atom-type decoder 落回具体分子形式。

这个思路对 AIDD 很重要。

因为未来的药物发现可能不会老老实实待在传统分类里。
分子胶不像经典小分子。
环肽不像传统蛋白。
核酸适配体既像分子识别工具,又像药物实体。
抗体-drug conjugate 横跨蛋白工程、小分子毒素、连接子化学和靶向递送。
TCR mimic 抗体又把胞内抗原、MHC 呈递和抗体识别揉在一起。

新药物形式越复杂,按分子类别分割模型就越吃力。

ODesign 的启发在于:
也许我们不该先问“这是哪一类分子”,而该先问:

它要建立什么相互作用?
它要稳定什么状态?
它要破坏什么界面?
它要把系统推向哪个功能结局?

这才是 AI 制药真正要面对的问题。

分子只是手段。
相互作用才是语言。
功能才是目的。

旧秩序不会被一篇论文掀翻,但问题已经被重新提出

ODesign 不会立刻改变 AI 制药。

一篇论文不能替代实验验证。
一个模型不能消灭药物研发中的毒性、代谢、递送、免疫原性、CMC 和临床失败。
世界模型这个词,也不能过早变成新的营销外衣。

但它提出了一个值得认真对待的问题:

AI 制药到底是在做更多工具,还是在逼近一个可计算的分子世界?

如果只是更多工具,那么行业会继续分裂成无数局部模型:蛋白模型、小分子模型、RNA 模型、抗体模型、打分模型、对接模型、性质预测模型。每个模型都能在自己的 benchmark 上说几句漂亮话,然后在真实药物研发里接受漫长而沉默的检验。

如果是后者,那么模型必须开始学习跨模态的相互作用规律,必须在结构、能量、动力学、功能和实验反馈之间建立更深的统一。

ODesign 的意义,不在于它已经完成了这个统一。
它的意义在于,它把这个问题摆到了桌面上。

在一个习惯于讲管线、讲平台、讲闭环、讲估值的行业里,它重新问了一句更基础的话:

如果生命是由分子相互作用构成的,那么 AI 药物设计为什么还要被分子类型分割?

这个问题并不温和。
它也不一定马上有答案。
但科学中真正有价值的问题,往往不是让人立刻鼓掌的问题,而是让人无法继续装作没看见的问题。

我是沐籽李

在分子、数据和智能之间,寻找药物发现的新秩序

下一篇,我们继续聊

参考资料:

[1]. Zhang O, Zhang X, Lin H, Tan C, Wang Q, Mo Y, et al. ODesign: A World Model for Biomolecular Interaction Design. arXiv preprint arXiv:2510.22304, 2025.https://arxiv.org/abs/2510.22304

[2]. BioTender观测日志. 《对话Odin Zhang:00后创业者,用分子世界模型,掀翻AI制药旧秩序》. 2026-05-22.
https://mp.weixin.qq.com/s/LT3whGj54XLf460eimRxnw

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐