从 ODesign 到分子世界模型：AI 制药真正要学的，不是分子，而是相互作用

赶紧去写论文！

230人浏览 · 2026-05-24 21:22:42

赶紧去写论文！ · 2026-05-24 21:22:42 发布

AI 制药这些年讲过许多故事。

一开始讲虚拟筛选，后来讲分子生成，再后来讲 AlphaFold、扩散模型、蛋白设计、抗体设计、干湿闭环。每一代故事都有自己的热闹，也有自己的贫乏。热闹在于工具越来越多，贫乏在于许多工具仍然像一排分工明确的工人：有人只会做小分子，有人只会做蛋白，有人只会预测结构，有人只会打分，有人只会生成。

它们各自忙碌，却未必真正理解同一个世界。

ODesign 的野心，正在这里。

它不是简单提出一个新的蛋白设计模型，也不是再做一个小分子生成器。它试图提出一个更大的命题：

能否用一个统一模型，描述蛋白、核酸、小分子之间的 all-to-all 相互作用，并在这个统一表征空间中完成可控分子设计？

在论文中，ODesign 被定义为一个 all-atom generative world model，用于 all-to-all biomolecular interaction design。它允许用户指定任意靶点上的表位，并生成不同类型的结合分子。模型覆盖蛋白、核酸和小分子，并支持 entity、token、atom 多层级的控制。

这句话如果只按宣传语读，很容易滑过去。
但如果认真拆开，它实际上触碰了 AIDD 里一个更根本的问题：

药物设计的对象，到底是分子本身，还是分子之间的相互作用？

传统 AI 制药常常按照分子类型划分世界。

小分子是一套模型。
蛋白是一套模型。
RNA 是一套模型。
抗体又是一套模型。
多肽、环肽、核酸适配体、分子胶、PROTAC，各自再分出新的工具链。

这种划分当然有现实理由。小分子是图结构，蛋白是氨基酸序列和三维折叠，核酸有碱基配对和磷酸骨架，抗体有 CDR、FR、免疫原性和可开发性。每一种对象都有自己的语法。

但生命系统不是按模型目录运行的。

细胞里真正发生的事情，是蛋白结合 DNA，RNA 结合蛋白，小分子插入 RNA 口袋，蛋白识别代谢物，抗体结合抗原，分子胶重塑蛋白-蛋白界面。生命不是一组孤立分子，而是一张相互作用网络。

ODesign 的第一层意义，就是把设计对象从“某一类分子”推进到“某一类相互作用”。

论文中也明确指出，已有模型虽然在各自领域取得进展，例如 RFDiffusion 用于蛋白设计、ResGen 用于蛋白-小分子生成、RhoDesign 用于 RNA 设计，但这些模型难以完成跨模态推理；而生物系统本身是由蛋白、核酸、小分子、离子等多种模态共同构成的动态网络。

这才是 ODesign 所谓 “all-to-all” 的真实含义。

它不是说模型可以机械地处理更多文件格式。而是：
模型要从专门学习某类分子的形状，转向学习不同分子之间如何彼此识别。

这是一个很重要的转向。

过去我们说 AI 药物设计，往往默认“我要设计一个分子”。
而 ODesign 暗示的问题是：
我真正要设计的，也许不是分子，而是一种可编程的相互作用。

在最近的采访中，张昊天把 ODesign 放在“分子世界模型”的叙事里。他提到“分子世界本质上由不同分子组成，而分子之间的相互作用，底层共享同一套 physical law。未来理想中的模型不应只做设计，还应能做结构预测、能量预测、稳定性预测，甚至模拟热力学涨落并估计结合自由能。”

这段话容易被误解。

所谓“分子世界模型”，不是把牛顿方程、薛定谔方程、力场项原封不动塞进神经网络。那是物理模拟，不是世界模型。

更准确地说，它想做的是：

用神经网络学习一个压缩后的分子世界，使模型在这个内部世界中理解结构、界面、能量偏好和生成约束。

这个世界不是显式的 MD 轨迹，也不是传统 docking score。它更像一种 learned simulator：模型看过足够多的复合物、构象、界面、几何约束和分子语法之后，形成一个内部表征。这个表征不一定严格等价于物理方程，但如果足够好，就能在设计时给出物理上更合理的候选。

这也是为什么 ODesign 建在全原子、三维结构、距离约束和扩散生成之上，而不是只做序列语言模型。

论文中，ODesign 采用五个核心模块：Embedding Module、Conditional Module、Pairformer Module、Conditional Diffusion Module 和 OInvFold Module。它先利用条件模块编码靶点三维结构，再通过 Pairformer 建模分子间相互作用，随后通过条件扩散模块生成全原子坐标，最后用 inverse folding 模块完成序列或原子类型设计。

这套结构说明了一点：
它不是在做“文本到分子”的想象。
它是在做“结构条件下的相互作用生成”。

世界模型的核心，不是会生成。
会生成的模型太多了。
真正的问题是：生成是否服从一个可复用、可迁移、可组合的相互作用世界。

这里有一个很容易犯的错误：既然蛋白、核酸、小分子的底层物理相同，那是不是可以把它们都当成原子汤，直接统一建模？

答案是不行。

采访中提到“原子汤”这个说法，很有启发性，但原子汤如果没有语法，就只是化学泥浆。

蛋白有蛋白的语法：氨基酸、肽键、主链二面角、二级结构、疏水核心。
核酸有核酸的语法：碱基配对、碱基堆叠、糖-磷酸骨架、离子屏蔽。
小分子有小分子的语法：芳香环、手性中心、官能团、可旋转键、拓扑约束。

底层都是原子，不代表可以忽略这些高层结构单位。

ODesign 论文对此有清楚表述：不同模态分子遵循不同组成原则，小分子由原子或官能团构成，蛋白由氨基酸残基构成，核酸由核苷酸链构成。如果只使用纯原子表示，模型很难保证生成结构符合目标分子模态，也容易忽略高阶结构单元中包含的化学和生物学先验。

因此，ODesign 的关键不是“把一切都打碎成原子”，而是做了一个折中：

在底层用原子级精度建模相互作用，在上层保留不同分子模态的结构语法。

它通过 unified generative token 统一不同分子模态的最小化学单元，并用模态后缀控制设计对象：蛋白为 -P，核酸为 -N，配体为 -L。

这点非常重要。

它说明 ODesign 并不是盲目地把不同分子混在一起训练。
它实际上采用的是一种“共享主干 + 模态条件”的策略。

模型主体学习共同的三维相互作用规律。
模态 token 告诉模型当前设计对象是什么。
解码阶段再回到不同分子自己的语法中。

所以它的哲学不是“万物皆同”。
而是：

万物在底层相通，但在形式上各有戒律。

这比单纯喊“多模态”要扎实得多。

如果只看架构，ODesign 很容易被理解成“AF3-like backbone + diffusion + inverse folding”。
但它真正有意思的地方，在于任务组织方式。

论文中，ODesign 引入了任务导向的 masking 策略，把 masking 分成 All、Entity、Token、Atom 四个层级，分别对应从完整自由生成、binder design、motif scaffolding 到 atomic motif scaffolding 的不同控制粒度。

这不是普通意义上的“遮住一部分让模型补全”。
它实际上是在把分子设计任务重新表述成一种统一问题：

给定某些条件，生成缺失的相互作用对象或局部结构。

比如：

给定靶点表位，生成一个结合蛋白。
给定一个小分子官能团，生成能稳定它的蛋白环境。
给定一个功能 motif，生成包裹它的 scaffold。
给定蛋白口袋，生成结合 ligand。
给定蛋白靶点，生成 RNA/DNA aptamer。

这背后的思想很像填空题。

但普通填空题填的是词。
ODesign 填的是结构、界面和相互作用。

这也是为什么它比单任务模型更接近“世界模型”的原因。
世界模型不应该只回答一个固定问题。它应该能在同一个内部表征中接受不同条件，完成不同类型的干预和补全。

论文称 ODesign 支持 rigid-target 和 flexible-target 两种模式。前者固定靶点结构，适用于保守界面；后者只使用内部距离等软约束，允许靶点与 binder 共同调整，适用于界面更柔性的目标。

这意味着它不只是“在一个死口袋里塞东西”。
它开始承认分子识别中的构象适应性。

当然，这离真正的诱导契合、构象选择、长时间尺度动力学还很远。
但方向已经不同。

为什么这件事对 AIDD 重要？因为药物发现越来越像界面工程

过去的小分子药物设计，经常围绕“口袋”展开。
有口袋，就 docking。
没有口袋，就说 undruggable。

但今天越来越多的药物形式，已经不满足于这个逻辑。

分子胶不是简单占据口袋，而是重塑蛋白-蛋白关系。
PROTAC 不是只结合一个靶点，而是诱导三元复合物。
环肽和蛋白 binder 更像界面占位。
RNA 小分子药物面对的是高度动态的核酸构象。
抗体、TCR mimic、适配体、双抗、ADC，本质上都在操控不同层级的分子识别。

这意味着 AIDD 的核心对象正在发生变化：

从 pocket-based binding，走向 interface-programmed function。

ODesign 的价值不只在于它可以生成蛋白、核酸、小分子。
更重要的是，它尝试把这些对象放进同一个“相互作用设计空间”里。

如果这个方向成立，未来药物设计中的问题就不再是：

“我能不能为这个靶点找一个 ligand？”

而会变成：

“我能不能设计一个分子实体，去改写某个生物相互作用？”

这个分子实体可以是小分子。
可以是蛋白。
可以是核酸。
可以是环肽。
也可以是某种现在还不被传统药物分类学认真对待的中间形态。

在这个意义上，ODesign 的真正对象不是某种分子。
它的对象是可编程的分子关系。

采访里最锋利的一句话是：

如果管线可以带来智能，那么世界上最大的 CRO 公司就会取代 DeepMind。

这句话当然有情绪，但也有判断。

很多 AI biotech 讲“干湿闭环”，但现实中，闭环经常变成另一种项目管理语言：
做一个管线，测一批数据，回来微调模型，再讲模型越来越聪明。

问题是，数据并不自动产生智能。

如果数据是窄的，任务是窄的，假设是窄的，那么闭环只会让模型在一个窄问题上更熟练。它可能提高某条管线的 hit rate，却不必然产生跨任务、跨模态、跨机制的科学能力。

ODesign 的作者显然更相信另一条路：
先做 AI-native 的通用模型，让模型能力本身成为平台，再反过来承接不同设计任务。

这是一条更像 DeepMind 或 Isomorphic Labs 的路线，而不是传统 biotech 的路线。

但这里也要冷静。

“不做管线”并不等于“不需要验证”。
“不以管线为中心”也不等于“实验不重要”。

世界模型如果不能被实验世界校正，最后只会在自己的梦里越来越自洽。
这恰恰是所有生成式科学模型最危险的地方。

采访他中也承认，多模态湿实验验证非常困难。不同模态的实验 protocol、体系、阳性对照、binding/function readout 都不一样，验证成本不是线性增加，而是组合爆炸。

这正是 ODesign 最大的张力：

它提出的是一个通用相互作用模型。
但它最难证明的，也正是这种通用性。

论文项目页显示，其湿实验验证目前主要集中在 protein mini-binder design，8 个靶点中有 4 个获得 pM 级别最优 binder；而其他模态任务的湿实验结果仍标注为 coming soon。

这并不削弱它的意义。
但它提醒我们：
ODesign 目前更像一个通用分子世界模型的早期原型，而不是已经完成的分子世界本身。

ODesign 论文自己也写到，模型在某些 out-of-distribution 条件下性能仍会下降，例如 DNA aptamer 设计中，随着序列长度增加，designability 下降比 RNA aptamer 更快；它也缺少对蛋白二级结构组成、小分子芳香性等属性的细粒度语义控制。

如果站在 AIDD 专业视角，我们可以说得更直接一点。

ODesign 离真正的分子世界模型，至少还差三层能力。

第一，能量一致性。
模型生成的结构看起来合理，不等于自由能上真正稳定。AF3 refolding、iPTM、iPAE、PoseBusters 等指标可以筛掉一部分坏结果，但不能替代结合热力学、动力学稳定性和可开发性评价。

第二，动力学理解。
真实结合不是静态拼图，而是构象集合之间的选择和转移。尤其是 RNA、小分子、分子胶、柔性环肽、PPI 界面，单一构象往往不足以描述功能。

第三，因果干预能力。
设计不是生成一个“像真的”分子，而是改变一个生物系统的状态。真正的世界模型应当知道：我改这个基团、这个环、这个侧链、这个界面水网络，会如何改变结合、选择性、稳定性、毒性和功能输出。

所以 ODesign 的下一步，不应只是生成更多模态。
更关键的是把生成、预测、模拟、打分、实验反馈、可开发性约束统一起来。

论文结论中也提到，未来 ODesign 可以进一步结合 physics-informed constraints、drug-likeness priors，并与 LLM-based reasoning agents 耦合，形成 design–evaluation–update 的闭环，向自主推理型分子世界模型演化。

这句话有些宏大，但方向是对的。

一个真正的分子世界模型，不应只是会“画分子”。
它应该能提出假设，执行设计，预判风险，解释失败，并在失败中更新自己。

否则，它只是一个更大的生成器。

可以用一句话概括 ODesign 的新意：

它不是消灭分子模态，而是把模态从模型边界降级为生成语法。

过去，蛋白、小分子、RNA 是不同模型的边界。
到了 ODesign 这里，它们更像同一个模型中的不同输出语法。

底层相互作用共享。
高层分子语法区分。
设计任务通过 masking 统一。
结构条件通过三维坐标和距离约束注入。
生成过程通过扩散完成。
最终再由 inverse folding 或 atom-type decoder 落回具体分子形式。

这个思路对 AIDD 很重要。

因为未来的药物发现可能不会老老实实待在传统分类里。
分子胶不像经典小分子。
环肽不像传统蛋白。
核酸适配体既像分子识别工具，又像药物实体。
抗体-drug conjugate 横跨蛋白工程、小分子毒素、连接子化学和靶向递送。
TCR mimic 抗体又把胞内抗原、MHC 呈递和抗体识别揉在一起。

新药物形式越复杂，按分子类别分割模型就越吃力。

ODesign 的启发在于：
也许我们不该先问“这是哪一类分子”，而该先问：

它要建立什么相互作用？
它要稳定什么状态？
它要破坏什么界面？
它要把系统推向哪个功能结局？

这才是 AI 制药真正要面对的问题。

分子只是手段。
相互作用才是语言。
功能才是目的。

旧秩序不会被一篇论文掀翻，但问题已经被重新提出

ODesign 不会立刻改变 AI 制药。

一篇论文不能替代实验验证。
一个模型不能消灭药物研发中的毒性、代谢、递送、免疫原性、CMC 和临床失败。
世界模型这个词，也不能过早变成新的营销外衣。

但它提出了一个值得认真对待的问题：

AI 制药到底是在做更多工具，还是在逼近一个可计算的分子世界？

如果只是更多工具，那么行业会继续分裂成无数局部模型：蛋白模型、小分子模型、RNA 模型、抗体模型、打分模型、对接模型、性质预测模型。每个模型都能在自己的 benchmark 上说几句漂亮话，然后在真实药物研发里接受漫长而沉默的检验。

如果是后者，那么模型必须开始学习跨模态的相互作用规律，必须在结构、能量、动力学、功能和实验反馈之间建立更深的统一。

ODesign 的意义，不在于它已经完成了这个统一。
它的意义在于，它把这个问题摆到了桌面上。

在一个习惯于讲管线、讲平台、讲闭环、讲估值的行业里，它重新问了一句更基础的话：

如果生命是由分子相互作用构成的，那么 AI 药物设计为什么还要被分子类型分割？

这个问题并不温和。
它也不一定马上有答案。
但科学中真正有价值的问题，往往不是让人立刻鼓掌的问题，而是让人无法继续装作没看见的问题。

我是沐籽李

在分子、数据和智能之间，寻找药物发现的新秩序

下一篇，我们继续聊

参考资料：

[1]. Zhang O, Zhang X, Lin H, Tan C, Wang Q, Mo Y, et al. ODesign: A World Model for Biomolecular Interaction Design. arXiv preprint arXiv:2510.22304, 2025.https://arxiv.org/abs/2510.22304

[2]. BioTender观测日志. 《对话Odin Zhang：00后创业者，用分子世界模型，掀翻AI制药旧秩序》. 2026-05-22.
https://mp.weixin.qq.com/s/LT3whGj54XLf460eimRxnw

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Gemini Omni Flash 完整指南：Google AI 视频生成器深度解析

AtomGit开源社区

基于神经网络的带输出三相逆变器模型预测控制LC滤波器附Matlab代码

在三相逆变器系统中，输出滤波器对于提高电能质量起着关键作用。LC 滤波器因其结构简单、成本低等优点被广泛应用。然而，传统的 LC 滤波器设计方法往往基于固定的系统参数和工况，在实际运行中，系统参数的变化以及负载的不确定性会影响滤波器的性能。模型预测控制（MPC）作为一种先进的控制策略，能够考虑系统的未来动态行为，实现对逆变器的有效控制。将神经网络与模型预测控制相结合，应用于带输出 LC 滤波器的三