让AI替你搭Simulink模型?SimuAgent来了

论文解读 | 用大模型自动化Simulink/Simscape建模


你是否想象过:给AI一段文字描述,它就能帮你把整个物理系统模型搭好?

这不是科幻——来自上交、上汽、商汤的研究者已经把它变成了现实。


一句话总结

SimuAgent 是首个能够自动化完成 Simulink/Simscape 物理系统建模 的 AI Agent,在 2000 个测试任务上全面超越 GPT-4o。


🔬 研究背景:为什么需要自动化建模?

在工程领域,Simulink/Simscape 是用于多物理域系统仿真的核心工具。但模型创建过程极其繁琐:

  • 需要从数百个专业模块库中挑选组件
  • 要正确连接不同物理域的端口
  • 需要设置海量参数

传统方式下,一个复杂的电池热管理模型可能需要工程师花 数小时甚至数天 才能完成。

痛点即机会——研究者提出了一个灵魂拷问:

能否让大模型理解物理系统描述,自动完成建模?


🎯 核心贡献

1. SimuAgent:会「建模」的AI Agent

SimuAgent 采用工具增强的 LLM 架构,支持三大核心能力:

能力 功能描述
🔍 search_blocks 从 Simscape 库中搜索目标模块
📖 read_blocks 读取现有模型的组件和参数
✏️ write_blocks 添加新模块、设置参数、建立连接

2. SimuBench:2000题评测基准

首个覆盖多物理域的 Simscape 建模评测集:

  • Creation:根据描述创建新模型
  • Modification:修改现有模型
  • QA:回答模型相关技术问题

3. ReGRPO:适应性反思强化学习

训练方法的核心创新——让 Agent 学会在遇到错误时停下来思考

标准 GRPO:直接生成 → 评估 → 反馈
ReGRPO:    生成 → 反思 → 调整 → 再生成 → 评估

💡 技术亮点

Python 字典:Agent的「建模语言」

SimuAgent 不直接生成 MATLAB 代码,而是使用 Python 抽象

sys_dict = {
    "Blocks": {
        "DC Machine": {"Type": "DC Machine"},
        "Converter": {"Type": "Three-Level NPC Converter"}
    },
    "Connections": [
        {"Src": "DC Machine/1", "Dst": "Converter/1"},
        {"Src": "Converter/2", "Dst": "DC Load/1"}
    ]
}

这种结构化表示让 Agent 更容易规划复杂系统的组件和连接关系。

两阶段课程学习

Stage 1: 单模块添加(≤12个模块)
    ↓
Stage 2: 完整系统构建(>12个模块)

从简单任务逐步过渡到复杂系统,降低学习难度。


📊 实验结果

全面超越 GPT-4o

模型 Creation Modification QA 平均
GPT-4o 23.0% 42.8% 56.5% 41.9%
SimuAgent 30.1% 55.1% 64.1% 51.9%
提升 +7.1% +12.3% +7.6% +10%

消融实验:哪些组件最关键?

组件 影响
适应性反思 -3.05%(去掉后下降最多)
两阶段课程 -7.51%
格式奖励 -5.67%

结论:适应性反思机制是 SimuAgent 的「灵魂」——让它学会了在错误后停下来重新思考。


🔍 失败分析:Agent还在哪些地方「翻车」?

失败类型 占比 根因
拓扑/连接错误 33.9% 物理域端口规则复杂
模块选择错误 28.5% 库层级深、命名相似
参数遗漏 17.7% 大字典条目易忽略
过早终止 12.5% 自我评估不足
上下文超限 7.3% 大型系统超出窗口

启示:复杂多物理域建模仍是LLM的短板,尤其是跨域约束(如能量守恒)和深层库导航。


📝 案例对比:SimuAgent vs GPT-4o

任务:在燃料电池冷却系统中添加温度传感器

GPT-4o 的尝试

add_block('simscape/Foundation/Temperature Sensors/Temperature Sensor', ...)

❌ 报错:找不到这个路径

SimuAgent 的做法

  1. 先用 search_blocks 查询正确的库路径
  2. 发现正确路径是 fl_lib/Thermal/Thermal Sensors/Temperature Sensor
  3. 正确连接 Thermal Port 和 PS-Simulink Converter
  4. ✅ 成功执行

🚀 意义与展望

现实价值

  • 工程研发周期大幅缩短
  • 让非Simulink专家也能快速建模
  • 为数字孪生、MBSE工作流注入AI能力

局限性

  • 超大系统(>12模块)仍具挑战
  • 跨物理域约束(如能量守恒)理解不足
  • 上下文窗口限制复杂场景

未来方向

  • 引入物理先验知识增强
  • 扩展到更多物理域(流体、光学等)
  • 结合代码执行验证闭环

📚 论文信息

  • 标题:SimuAgent: Automating Simscape Modeling with LLM-based Agent
  • 机构:上海交通大学、上汽集团、商汤科技
  • arXiv:2601.05187

如果你觉得这篇解读有帮助,欢迎转发给做汽车仿真、控制系统开发的朋友们!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐