Latent-Y：经实验室验证的从头药物设计自主智能体

tzc_fly

85人浏览 · 2026-05-17 21:29:58

tzc_fly · 2026-05-17 21:29:58 发布

《Latent-Y: A Lab-Validated Autonomous Agent for De Novo Drug Design》（Latent-Y：经实验室验证的用于从头药物设计的自主智能体），展示了人工智能在生物制药领域的重大突破。它介绍了世界上首个能够根据自然语言提示（Text Prompts）全自动完成抗体设计，并得到湿实验（Wet-lab）验证的AI智能体系统——Latent-Y。

fig1

Latent-Y 可从文本提示出发，自主设计可直接用于实验室实验的抗体与多肽。

以下是对这篇论文的详细深度解读：

一、核心亮点与总体概述

研发痛点： 传统的早期药物发现高度依赖拥有博士学位的领域专家，步骤繁琐、难以并行且耗时极长（通常需要数周甚至数月来进行文献调研、靶点分析和计算设计）。
解决方案： 论文提出了 Latent-Y。这是一个基于大语言模型（LLMs）的自主智能体系统，它就像一个全能的“AI药物设计科学家”。
核心成就： 给定一段文本描述或一篇科研论文，Latent-Y 能自主完成文献调研、靶点分析、表位（Epitope）识别、分子生成、计算验证和序列优选。其设计的纳米抗体在湿实验中实现了 67%（9个靶点中命中6个） 的成功率，结合亲和力达到了个位数纳摩尔（nM）级别。
效率提升： 与人类专家相比，Latent-Y 将原本需要两周的纯计算设计工作流压缩到了 5小时内，效率提升了 56倍。

fig1a

三项独立的 VHH 设计任务，每项均由单一自然语言提示启动，分别靶向 IL‑6、PRL 与 IL‑6R。图中展示了最优结合物‑靶点复合物的设计结构及结合界面细节，内嵌图突出显示结合界面处经设计的非共价相互作用（粉色虚线）。所有设计均通过表面等离子体共振（SPR）完成实验验证。

二、 Latent-Y 的工作原理与系统架构

Latent-Y 并不是一个单纯的“结构生成模型”，而是一个能够推理和使用工具的 Agent（智能体）。

输入端： 研究人员只需输入自然语言（例如：“设计一个能结合人类IL-6并阻断其与IL-6R相互作用的VHH抗体”），或者直接给它喂一篇相关的科学文献。
“大脑”与子智能体（Subagents）： Latent-Y 采用“探索-利用（Explore-then-exploit）”策略。它包含多个专职的子智能体：
- 热点研究员（Hotspot researcher）： 负责目标结构表征和表位分析。
- 质控智能体（QA subagent）： 负责多样性过滤、序列相似性分析（筛除已有的专利序列）、以及成药性风险评估（如去除可能引发糖基化的突变）。
工具箱： 它原生集成了 Latent-X2（Latent Labs 研发的原子级生物制剂生成模型）、生物信息学工具（如序列对齐）、外部数据库API（PDB结构库、UniProt、科研文献等）。
工作模式： 支持全自动模式（端到端输出最终序列）和人机协作模式（人类专家可以在中途提供反馈、纠正策略或注入生物学背景知识）。

fig3

本图为本文所报道、经实验室验证的 IL‑6 结合剂的完整 Latent‑Y 设计流程精简推理轨迹，完整推理过程近 10,000 行。轨迹展示智能体执行以下关键步骤：接收用户高层指令、靶点识别、通过专用sub-agent进行热点分析、迭代试点与扩批生成，以及最终质量保证并筛选出可直接用于实验的候选分子。灰色框为用户提示，紫色框突出显示工具调用与sub-agent调用。为简洁起见，省略部分推理步骤（以省略号表示）。

三、核心实验结果与突破验证

论文在三种截然不同的复杂场景下对 Latent-Y 进行了评估，并全部通过了湿实验（SPR，表面等离子共振技术）的验证：

1. 完全自主的低纳摩尔亲和力抗体设计（Epitope Discovery）

任务： 仅提供靶点的宏观抑制目标（如 IL-6, PRL, IL-6R 等），让其自主寻找结合表位并生成纳米抗体（VHH）。
结果： Latent-Y 自主识别出了符合机制的结合位点。在实验室验证中，获得了针对 PRL（5.44 nM）、IL-6（12.5 nM）和 IL-6R（517 nM）的高亲和力结合物。值得一提的是，这是首个经实验验证的、完全从头（de novo）设计的 IL-6 结合物。

2. 自主编写代码解决“跨物种”难题（Cross-species Extension）

任务： 在免疫肿瘤学中，候选药物通常需要同时结合人类靶点及其在实验动物（如食蟹猴 cyno）上的同源物。论文要求 Latent-Y 设计能同时结合人类和食蟹猴 TNFL9 的抗体。
难点： 系统本身没有预置“跨物种设计”的功能，且食蟹猴 TNFL9 甚至没有现成的三维结构。
突破： 仅凭人类专家的一句自然语言提示，Latent-Y 自主编写了定制化的生成代码（Python），完成了食蟹猴结构的预测、比对，并锁定了未发生突变的三聚体表位。最终生成的 40 个候选序列中，有 3 个在实验室中被证实能同时成功结合两个物种的靶点。

3. 直接将“科学论文”转化为候选药物（Literature-inferred Design）

任务： 直接给 Latent-Y 提供 21 篇顶级期刊（Nature, Science, Cell等）的论文 PDF，只告诉它靶点名称，让它根据论文里描述的机制去设计抗体。
结果： 在这 21 个任务中，Latent-Y 100% 准确提取了正确的靶点和结合表位。
验证： 研究人员挑选了其中一个针对 hTfR1（用于跨越血脑屏障）的项目进行湿实验。在选出的 40 个候选抗体中，有 11 个成功结合（命中率高达 28%）。这证明了系统能够直接阅读前沿文献并将其转化为实质性的药物发现成果。

fig6a

在严格的 10,000 个样本预算内，Latent‑Y 针对 19 个治疗靶点成功得到计算合格的从头设计 VHH 结合物复合物结构。所有 VHH 均完全依据所提供同行评审论文的文本信息进行设计，采用统一提示词评估。左上角的 hTfR1 任务经过实验验证，高通量 SPR（HT‑SPR）测得结合命中率为 11/40。其余任务未进行实验测试。

方法

Latent‑Y 是一套智能体 AI 系统，以前沿大语言模型作为推理引擎，并通过模型上下文协议（MCP） 服务与 Latent Labs 平台实现原生集成；该协议服务负责管理对 Latent‑X2 推理、计算打分、平台工具及 Latent Labs 算力基础设施的调用权限。该智能体控制层不依赖特定模型厂商，我们评估了多款主流前沿大语言模型，发现其在不同模型上均表现稳定，这与近期前沿推理模型的研究结论一致。该控制层还可与通用代码智能体协同工作，进一步拓展智能体的行动空间。

高效的上下文管理是该智能体控制框架的核心设计原则，这一设计遵循了近期关于长时运行智能体系统的研究结论。专用sub-agent负责处理不同的分析任务，例如，专属热点研究子代理用于靶点表征与表位分析，质量保证子代理用于候选分子评估、多样性筛选及序列风险分析；主控代理与各子代理之间采用结构化方式进行上下文传递。该智能体可调用标准生物信息学工具、生物分子数据库与科学文献数据库的外部应用程序接口，以及针对蛋白质结合物设计项目特定需求而定制开发的工具。用户通常可在提示词中直接指定目标分子类型——纳米抗体、大环多肽或微型蛋白结合物；而智能体也可根据表位几何特征、药理学要求与模型实际表现，自主评估并切换分子类型。系统提示词整合了已积累的药物设计经验，引导智能体采用高效策略，同时保留动态调整的灵活性，这也印证了一项研究结论：对于复杂的开放式任务，柔性引导优于僵化的工作流程设定。

Latent‑Y 的推理遵循先探索、后利用的模式：它会发起针对性的计算实验，对中间结果进行推理分析，并随着项目推进将资源集中到高效方向上，这与近期自主研究智能体的相关工作思路一致。当标准工具无法满足需求时，智能体可根据自然语言描述自主生成定制化计算方法，从而扩展自身能力。每个项目都会生成完整的推理轨迹，记录所有决策、工具调用与策略更新。研究人员可在任意节点中断智能体，补充生物学背景、推翻既有决策或重新调整策略；智能体则会整合这些输入，并相应调整后续的推理与执行流程。

四、里程碑式的意义

突破“算力”到“脑力”的瓶颈： 随着 AlphaFold、RFdiffusion、Latent-X2 等生成模型的出现，生成蛋白质结构已经可以依靠计算机完成。但早期的药物发现瓶颈转移到了“拥有博士学位的专家数量有限，无法同时规划大量项目”。Latent-Y 通过自动化前期研究、假设检验和质量控制，打破了这一人力瓶颈。
极端的加速与并发： 56倍的速度提升意味着研究人员可以在一天内完成以前需要几个月的计算工作。而且由于是 AI，它可以同时并行跑几十个、上百个药物管线。
透明度与可解释性： 传统的 AI 模型往往是黑盒，但 Latent-Y 输出了一套完整的“推理轨迹（Reasoning trace）”，人类专家可以清楚地看到它查了什么文献、比对了什么结构、为什么舍弃某个表位，从而保证了药物研发的科学审计性。

总结

这篇论文展示了 AI for Science（特别是AI药物发现）进入了“Agent（智能体）”时代。Latent-Y 标志着计算生物学从单一的“预测结构/生成序列”工具，进化成了能够理解人类意图、查阅文献、自主写代码扩展能力，并最终交付实验室可用分子的“虚拟科学家”。虽然最后依然需要人类进行湿实验的临床前验证，但这无疑是走向“全自动生物学实验室”的巨大飞跃。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

从词嵌入到RNN（其一）

AtomGit开源社区

2025年AI编程工具Cost分析 — 每个开发者都该看的省钱攻略

不要为不需要的功能付费— 如果你不用终端 Agent，就不需要 Claude Code善用免费组合— Copilot Free + Cursor Free + DeepClaude 覆盖90%场景Token 是隐形成本— 关注 API 调用量，选择合适的模型和上下文窗口按团队规模选工具— 个人用轻量级，团队用企业级持续关注开源替代— DeepClaude 这类项目发展很快，每月都有新功能声明：本文