SynCraft：一键连线逆合成与毒性预警，将药物设计时间缩短 91%

生信之灵

409人浏览 · 2026-05-19 16:30:00

生信之灵 · 2026-05-19 16:30:00 发布

论文信息

标题：SynCraft: an integrated web server for ADMET-aware retrosynthesis and molecular design

SynCraft：一键连线逆合成与毒性预警，将药物设计时间缩短 91%

一句话速览 药物研发中，合成可行性与安全性评估长期被割裂为两个独立的流水线。中南大学与新疆大学的团队推出了 SynCraft，一个将模板化逆合成与基于多视图对比学习（MolMVC）的实时 ADMET 毒性评估融为一体的免费网络平台。在伊马替尼案例中，SynCraft 自动识别出了传统流程中极易被忽略的基因毒性中间体，为合成化学家提供了一条通往“安全且可合成”候选药物的高速公路。

背景与痛点：药物研发的“死亡之谷”与断裂的数据链

在药物从靶点发现到临床候选的漫长征途中，存在着一个被称为“死亡之谷”的瓶颈阶段。现代虚拟筛选技术可以轻松探索超过 10⁶⁰ 个分子的化学空间，但筛选出的苗头化合物真正转化为安全有效的药物却步履蹒跚。问题究竟出在哪儿？

数据显示，约 40% 的临床前候选分子因药代动力学和毒性（即 ADMET）性质不达标而失败，而且这些问题常常在开发后期才被发现。这背后一个关键的技术原因在于：合成可行性与安全性的评估被长期割裂了。

具体来说，化学家们现在手头有一流但“偏科”的工具。像 AiZynthFinder 这样的逆合成规划器，能快速设计出合成路线，但它们只管“能不能合成”，对中间体是否有毒一概不问。另一边，SwissADME 这样的 ADMET 预测平台又能精确评估分子的毒性，但它只接“终成品”，不会主动审查路线上的每一个中间产物。

这就形成了一个传统的“接力赛”模式：化学家用逆合成软件设计路线 -> 导出中间体 -> 手动粘贴到 ADMET 平台逐一评估 -> 发现有毒 -> 再回到起点修改路线。这个“设计-制造-测试-分析”的循环充满了手动数据导出、格式转换和跨平台切换，费时费力，且极易因“惰性”而跳过对每个中间体的毒性筛查，埋下安全隐患。历史上著名的缬沙坦、雷尼替丁召回事件，就与合成工艺中产生的基因毒性杂质未被早期发现直接相关。

SynCraft 的团队瞄准的正是这个痛点：如何将两条断裂的流水线焊接成一条自动化、智能化的管道？

核心方法：一场逆合成与安全评估的“联姻”

SynCraft 的设计哲学可以概括为一句话：让路径搜索的每一步，都带着“安全度”的雷达。

1. 核心算法：广度优先搜索 + 实时毒性检测

SynCraft 的逆合成引擎采用广度优先搜索策略，而不是更复杂、随机性更强的蒙特卡洛树搜索。这种选择很务实——BFS 保证了结果的可复现性和可控的搜索深度。

最关键的是，在搜索树的每一个节点，即每一个分解出的中间体分子，系统都会无缝调用其内部的 ADMET 评估引擎——MolMVC。这相当于在修路的同时，给每一段路轨安装了实时应力监测器。

2. 安全引擎：MolMVC 的多视角“看”分子

这是该工作的核心技术贡献之一。传统的分子性质预测模型往往只看分子的“一维”或“二维”画像，例如只看 SMILES 字符串（1D）或分子拓扑图（2D），但这会丢失与生物活性、毒性密切相关的立体化学信息。

MolMVC 则不同，它会从 三个视角同时审视一个分子：

1D 视角：通过 Transformer 处理分子指纹序列，粗暴理解为“看简历”。
2D 视角：通过图神经网络理解原子的连接关系，粗暴理解为“看社交关系网”。
3D 视角：通过 SchNet 模型分析分子的三维构象，粗暴理解为“看真人立体形象”。

通过一个名为“自适应多视图对比损失”的技术，模型将这三种视角的信息对齐融合，从而做出比单一视角模型更精准的预测。在分子性质预测的权威基准 MoleculeNet 上的六项测试中，MolMVC 全面超越 11 种主流方法，尤其是在 ClinTox 毒性预测任务上，它的 ROC-AUC 得分达到了近乎完美的 0.984，比之前最好的模型 (Mole-BERT) 高出近 20%。

3. 路径评分：一个多目标的决策天平

仅仅找出有毒中间体还不够，SynCraft 还需要对所有路线进行综合打分。系统设计了一个多目标评分函数，同时考虑了四个维度：

合成可行性：包括合成可及性分数（SA）和合成复杂度（SC）。
安全性：路线中最低的 ADMET 分数。
路径长度：更短的步骤拥有更高的评分。

这个加权评分机制（Route Score）就像一个天平，帮助化学家在“最易合成”和“最安全”之间找到最佳平衡点，而不是单纯追求极致的合成简易性。

实验结果：90 分钟 vs. 90 秒，效率与安全的双重革命

这款工具的效果究竟如何？团队的实验结果给出了极具说服力的答案：

效率革命：时间缩短 91%

在 10 个药物分子上进行的对比测试显示：

传统流程：使用 AiZynthFinder 做逆合成，再手动将每个中间体提交至 SwissADME 评估，平均耗时约 1230-1410 秒（约 20-23 分钟），期间需要手工导出和合并数据。
SynCraft：一条龙完成逆合成与所有中间体的 ADMET 评估，平均耗时仅 84-114 秒（约 1.5-2 分钟）。总时间减少了 91% 以上，且完全消除了一个化学家需要手动进行的 9 次文件导出和 2 次工具切换。

安全价值：伊马替尼的“解毒”试验

最具说服力的是对癌症药物伊马替尼的案例研究。伊马替尼的传统合成路线都会经过一个关键中间体——4-甲基-1,2-苯二胺（Compound 16）。这是一个著名的 ICH M7 2 类致突变杂质，其含量在粗品中可能超出安全限值百倍以上。

当将伊马替尼输入 SynCraft 时，系统瞬间标记出所有包含 Compound 16 的传统路线。在交互界面中，该中间体被亮起清晰的红灯，并附带详细的毒性报告（ClinTox 100% 风险，ToxCast 0.18）。

更精彩的是，SynCraft 的搜索结果中还自动列出了多条已发表的、避开了 Compound 16 的更安全的替代合成路线。这不仅仅是“找出问题”，更是“提供答案”。团队将这一过程比作一个自动化的安全顾问，在化学生产之前就将潜在危险扼杀在摇篮里。

意义与展望：一次“模式切换”，而非“工具升级”

SynCraft 的意义远不止于又快又准。

它改变的，是药物化学家与数据交互的模式。传统工具是孤立的，需要人来“搬砖”；而 SynCraft 是集成的，信息如同一个流动的生态系统，自动到达该去的地方。这种从“人找数据”到“数据找人”的转变，有望从根本上重塑早期药物研发的工作流。

对于学术界，它是一个强大的教学和科研工具，让高校团队也能轻松开展高标准的“安全性感知”合成路线设计。对于工业界，它直接瞄准了降低临床候选药物后期开发失败率的目标，有望帮助制药巨头节省数亿美元因后期毒性问题而导致的损失。它的实时毒性预警功能，也为解决制药行业挥之不去的基因毒性杂质监管难题，提供了工程化的一步。

局限性与未来展望

尽管表现惊艳，但该研究也坦诚地指出了局限性。首先，它的逆合成搜索深度最多为 6 步，虽然覆盖了大部分小分子，但对于极其复杂的天然产物，可能力不从心。其次，目前的 ADMET 预测模型虽然在多个基准上优秀，但与任何预测模型一样，仍不可能达到 100% 的准确率，其预测值需要化学家的专业判断进行最终确认。最后，目前仅支持单分子输入，尚不具备批处理能力，这可能会限制其在超大规模虚拟筛选场景下的应用。开发团队表示，批处理能力和用户反馈驱动的迭代将是未来的重点方向。

当 AI 真的能像一个药剂师前辈那样，在我们设计路线时就及时提醒：“嘿，这个中间体可是个‘定时炸弹’，试试旁边那条更绿的路吧”——这究竟是解放了创造力，还是让化学家变成了只点击“绿色路线”的“操作员”？在这个过程中，化学家应该如何驾驭日益强大的生成式工具，而不是被算法的偏好所驯化？这或许是 SynCraft 带给我们的，最值得深思的“路标”。