SynCraft:一键连线逆合成与毒性预警,将药物设计时间缩短 91%
论文信息
标题:SynCraft: an integrated web server for ADMET-aware retrosynthesis and molecular design
SynCraft:一键连线逆合成与毒性预警,将药物设计时间缩短 91%

一句话速览 药物研发中,合成可行性与安全性评估长期被割裂为两个独立的流水线。中南大学与新疆大学的团队推出了 SynCraft,一个将模板化逆合成与基于多视图对比学习(MolMVC)的实时 ADMET 毒性评估融为一体的免费网络平台。在伊马替尼案例中,SynCraft 自动识别出了传统流程中极易被忽略的基因毒性中间体,为合成化学家提供了一条通往“安全且可合成”候选药物的高速公路。
背景与痛点:药物研发的“死亡之谷”与断裂的数据链
在药物从靶点发现到临床候选的漫长征途中,存在着一个被称为“死亡之谷”的瓶颈阶段。现代虚拟筛选技术可以轻松探索超过 10⁶⁰ 个分子的化学空间,但筛选出的苗头化合物真正转化为安全有效的药物却步履蹒跚。问题究竟出在哪儿?
数据显示,约 40% 的临床前候选分子因药代动力学和毒性(即 ADMET)性质不达标而失败,而且这些问题常常在开发后期才被发现。这背后一个关键的技术原因在于:合成可行性与安全性的评估被长期割裂了。
具体来说,化学家们现在手头有一流但“偏科”的工具。像 AiZynthFinder 这样的逆合成规划器,能快速设计出合成路线,但它们只管“能不能合成”,对中间体是否有毒一概不问。另一边,SwissADME 这样的 ADMET 预测平台又能精确评估分子的毒性,但它只接“终成品”,不会主动审查路线上的每一个中间产物。
这就形成了一个传统的“接力赛”模式:化学家用逆合成软件设计路线 -> 导出中间体 -> 手动粘贴到 ADMET 平台逐一评估 -> 发现有毒 -> 再回到起点修改路线。这个“设计-制造-测试-分析”的循环充满了手动数据导出、格式转换和跨平台切换,费时费力,且极易因“惰性”而跳过对每个中间体的毒性筛查,埋下安全隐患。历史上著名的缬沙坦、雷尼替丁召回事件,就与合成工艺中产生的基因毒性杂质未被早期发现直接相关。
SynCraft 的团队瞄准的正是这个痛点:如何将两条断裂的流水线焊接成一条自动化、智能化的管道?
核心方法:一场逆合成与安全评估的“联姻”
SynCraft 的设计哲学可以概括为一句话:让路径搜索的每一步,都带着“安全度”的雷达。

1. 核心算法:广度优先搜索 + 实时毒性检测
SynCraft 的逆合成引擎采用广度优先搜索策略,而不是更复杂、随机性更强的蒙特卡洛树搜索。这种选择很务实——BFS 保证了结果的可复现性和可控的搜索深度。
最关键的是,在搜索树的每一个节点,即每一个分解出的中间体分子,系统都会无缝调用其内部的 ADMET 评估引擎——MolMVC。这相当于在修路的同时,给每一段路轨安装了实时应力监测器。
2. 安全引擎:MolMVC 的多视角“看”分子
这是该工作的核心技术贡献之一。传统的分子性质预测模型往往只看分子的“一维”或“二维”画像,例如只看 SMILES 字符串(1D)或分子拓扑图(2D),但这会丢失与生物活性、毒性密切相关的立体化学信息。
MolMVC 则不同,它会从 三个视角同时审视一个分子:
-
1D 视角:通过 Transformer 处理分子指纹序列,粗暴理解为“看简历”。
-
2D 视角:通过图神经网络理解原子的连接关系,粗暴理解为“看社交关系网”。
-
3D 视角:通过 SchNet 模型分析分子的三维构象,粗暴理解为“看真人立体形象”。
通过一个名为“自适应多视图对比损失”的技术,模型将这三种视角的信息对齐融合,从而做出比单一视角模型更精准的预测。在分子性质预测的权威基准 MoleculeNet 上的六项测试中,MolMVC 全面超越 11 种主流方法,尤其是在 ClinTox 毒性预测任务上,它的 ROC-AUC 得分达到了近乎完美的 0.984,比之前最好的模型 (Mole-BERT) 高出近 20%。

3. 路径评分:一个多目标的决策天平
仅仅找出有毒中间体还不够,SynCraft 还需要对所有路线进行综合打分。系统设计了一个多目标评分函数,同时考虑了四个维度:
-
合成可行性:包括合成可及性分数(SA)和合成复杂度(SC)。
-
安全性:路线中最低的 ADMET 分数。
-
路径长度:更短的步骤拥有更高的评分。
这个加权评分机制(Route Score)就像一个天平,帮助化学家在“最易合成”和“最安全”之间找到最佳平衡点,而不是单纯追求极致的合成简易性。
实验结果:90 分钟 vs. 90 秒,效率与安全的双重革命
这款工具的效果究竟如何?团队的实验结果给出了极具说服力的答案:
效率革命:时间缩短 91%
在 10 个药物分子上进行的对比测试显示:
-
传统流程:使用 AiZynthFinder 做逆合成,再手动将每个中间体提交至 SwissADME 评估,平均耗时约 1230-1410 秒(约 20-23 分钟),期间需要手工导出和合并数据。
-
SynCraft:一条龙完成逆合成与所有中间体的 ADMET 评估,平均耗时仅 84-114 秒(约 1.5-2 分钟)。总时间减少了 91% 以上,且完全消除了一个化学家需要手动进行的 9 次文件导出和 2 次工具切换。

安全价值:伊马替尼的“解毒”试验
最具说服力的是对癌症药物伊马替尼的案例研究。伊马替尼的传统合成路线都会经过一个关键中间体——4-甲基-1,2-苯二胺(Compound 16)。这是一个著名的 ICH M7 2 类致突变杂质,其含量在粗品中可能超出安全限值百倍以上。
当将伊马替尼输入 SynCraft 时,系统瞬间标记出所有包含 Compound 16 的传统路线。在交互界面中,该中间体被亮起清晰的红灯,并附带详细的毒性报告(ClinTox 100% 风险,ToxCast 0.18)。

更精彩的是,SynCraft 的搜索结果中还自动列出了多条已发表的、避开了 Compound 16 的更安全的替代合成路线。这不仅仅是“找出问题”,更是“提供答案”。团队将这一过程比作一个自动化的安全顾问,在化学生产之前就将潜在危险扼杀在摇篮里。

意义与展望:一次“模式切换”,而非“工具升级”
SynCraft 的意义远不止于又快又准。
它改变的,是药物化学家与数据交互的模式。传统工具是孤立的,需要人来“搬砖”;而 SynCraft 是集成的,信息如同一个流动的生态系统,自动到达该去的地方。这种从“人找数据”到“数据找人”的转变,有望从根本上重塑早期药物研发的工作流。
对于学术界,它是一个强大的教学和科研工具,让高校团队也能轻松开展高标准的“安全性感知”合成路线设计。对于工业界,它直接瞄准了降低临床候选药物后期开发失败率的目标,有望帮助制药巨头节省数亿美元因后期毒性问题而导致的损失。它的实时毒性预警功能,也为解决制药行业挥之不去的基因毒性杂质监管难题,提供了工程化的一步。
局限性与未来展望
尽管表现惊艳,但该研究也坦诚地指出了局限性。首先,它的逆合成搜索深度最多为 6 步,虽然覆盖了大部分小分子,但对于极其复杂的天然产物,可能力不从心。其次,目前的 ADMET 预测模型虽然在多个基准上优秀,但与任何预测模型一样,仍不可能达到 100% 的准确率,其预测值需要化学家的专业判断进行最终确认。最后,目前仅支持单分子输入,尚不具备批处理能力,这可能会限制其在超大规模虚拟筛选场景下的应用。开发团队表示,批处理能力和用户反馈驱动的迭代将是未来的重点方向。
当 AI 真的能像一个药剂师前辈那样,在我们设计路线时就及时提醒:“嘿,这个中间体可是个‘定时炸弹’,试试旁边那条更绿的路吧”——这究竟是解放了创造力,还是让化学家变成了只点击“绿色路线”的“操作员”?在这个过程中,化学家应该如何驾驭日益强大的生成式工具,而不是被算法的偏好所驯化?这或许是 SynCraft 带给我们的,最值得深思的“路标”。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)