【重大更新】三脑架构 AI 工作流:对手脑提前踩坑+双模型仲裁,支持本地Ollama
前言
大家好,我是一名大一的生物医药数据科学专业学生。昨天我开源了一个反主流的 AI 工作流框架 AI Flow Architect,收到了很多开发者的反馈。
今天我马不停蹄地更新了核心架构,新增了独家的 Opponent Brain(对手脑)机制,把质量控制提前到了执行之前,从根本上解决 AI 幻觉问题。
今天正式发布 v0.1 版本,完整实现了「规划→挑战→审批→执行→仲裁」的全流程质量控制。
一、所有 AI 框架都没解决的根本问题
我相信每一个用过 AI Agent 的人都遇到过这种噩梦:你让 GPT-4o 设计一个用户认证系统,它返回的代码看起来干净漂亮,API、数据库、中间件一应俱全。你扫了一眼觉得没问题,直接上线了。
一周后你才发现:密码哈希用的是 MD5,登录接口没有任何限流。
这不是 prompt 写得不好的问题,这是所有主流 AI 框架的基因缺陷:
它们都默认 "AI 能自己监督自己"。但同一个模型,永远看不到自己的盲区。
让 AI 自己审核自己的输出,本质上就是让学生自己改卷子。它会用完美的逻辑自圆其说自己的幻觉,你根本挑不出错。
调 prompt 解决不了这个问题,加再多的角色也解决不了这个问题。这是架构层面的缺陷。
二、我的解决方案:三脑架构 + 人在回路
我设计了一个五层三脑强制流程,没有任何捷径可以跳过。核心 slogan 是:
AI proposes. AI challenges. You decide.
AI 负责提出方案和挑战方案,人只负责做最终的决策。

整个流程分为 5 个强制阶段:
- ZONE1 用户输入:你只用说一句 "设计一个用户管理系统",不用写几十行 prompt
- ZONE2 规划脑(Brain1):用强模型(GPT-4o/Claude Sonnet)生成详细的任务蓝图,明确每一步的交付标准
- ZONE3 对手脑(Opponent Brain):独家功能!从 5 个完全对立的角度挑战蓝图,提前找出所有漏洞
- ZONE4 专家团队执行:所有专家都是完全独立的会话,互相不知道对方存在,彻底杜绝角色混淆
- ZONE5 仲裁脑(Brain2):用完全不同的模型,逐项对比蓝图和交付物,不合格直接打回
在整个流程中,有三个不可跳过的人在回路节点:
- 审批规划脑生成的蓝图
- 审核对手脑发现的问题
- 确认仲裁脑的质量报告
AI 永远不会替你做决定,它只会帮你把所有选项和风险都摆在你面前。
三、独家功能:对手脑(Opponent Brain)
这是本次更新最大的亮点,也是所有其他框架都没有的功能。
在蓝图生成之后、执行之前,我加了一个专门的对手脑。它的唯一任务就是:挑错。

对手脑会从 5 个完全独立的角度,对蓝图进行全方位的攻击:
- 🔒 安全审计:检查有没有 SQL 注入、XSS、权限绕过等安全漏洞
- 💰 成本分析:评估方案的 Token 消耗、服务器成本、运维成本
- 📊 数据严谨性:检查数据模型是否合理、有没有数据丢失风险
- 👤 用户体验:评估流程是否符合用户习惯、有没有反人类的设计
- 🌿 极简主义:检查有没有不必要的功能、能不能用更简单的方案实现
就像上面的例子,对手脑会直接指出:"WARNING: Password hashing not specified -- verify bcrypt/argon2"。
在你花一分钱执行任务之前,AI 已经帮你把所有能想到的坑都踩了一遍。
四、与主流框架的本质区别
所有其他框架都在追求 "无限灵活性",而我在追求 "绝对可靠性"。

| 维度 | AI Flow Architect | LangChain | CrewAI |
|---|---|---|---|
| 设计理念 | 内置质量控制 | 手动实现 | 手动实现 |
| 质量控制 | 三脑全流程内置 | 完全自己写 | 可选单模型自审 |
| 模型隔离 | 架构层面强制 | 不强制 | 不强制 |
| Token 节省 | 4 种机制零配置 | 手动优化 | 手动优化 |
| 最佳场景 | 需要可靠输出的生产任务 | 高度定制化流程 | 多角色模拟 |
我主动放弃了自由编排,用 "不灵活" 换可预测性。90% 的普通开发者根本不需要无限的灵活性,我们需要的是一个能稳定输出高质量结果、不会乱烧钱、出了问题能快速定位的工具。
五、零配置 Token 节省,实测省 60%
除了质量,成本是所有开发者最关心的问题。我内置了 4 种零配置的 Token 节省机制,开箱即用,不用你写一行代码:
| 机制 | 效果 | 成本节省 |
|---|---|---|
| 语义缓存 | 相同专家 + 相同任务直接跳过 API 调用 | 0 API 调用 |
| 上下文自动压缩 | 历史超过阈值自动精简 | ~60% 输入 Token |
| 本地规则预检查 | 无效任务直接拦截,不发起任何请求 | 0 成本 |
| 智能跳过 | 步骤失败自动终止后续流程 | 0 无效消耗 |
实测同样是 "设计并实现一个用户管理系统" 的任务,AI Flow Architect 的 Token 消耗只有 CrewAI 的 40%。
六、已支持的所有模型
目前已经支持所有主流模型提供商,新增模型只需要在models.yaml里加几行配置,不用改任何 Python 代码:
✅ 生产就绪:OpenAI(全系列)、Anthropic(全系列)🔄 社区验证中:通义千问、智谱 GLM、月之暗面、DeepSeek、本地 Ollama
七、工程化保障
作为一个个人项目,我特别注重稳定性:
- ✅ 114 个单元测试覆盖所有核心模块
- ✅ 三级错误处理:指数退避重试→自动模型降级→用户决策
- ✅ 三层提示系统:保证输出格式 100% 一致
- ✅ 字段过滤:只传递专家必需的字段,避免信息过载
八、路线图
- 三脑核心架构(规划脑 + 对手脑 + 仲裁脑)
- 单密钥开箱即用
- 4 种零配置 Token 节省机制
- PyPI 包(本周发布,直接 pip install)
- CLI 命令行工具
- 并行执行支持
- Web UI 可视化编辑器
- 更多内置专家模板
写在最后
必须坦诚地说,它不是万能的,也绝对不是 LangChain 和 CrewAI 的替代品。
- 如果你需要高度定制化的复杂 Agent、需要调用各种工具链、需要无限灵活的流程,那 LangGraph 和 CrewAI 会更适合你
- 但如果你只是想让 AI 帮你完成那些重复无聊的任务,并且希望输出质量有保证、不会乱烧钱、出了问题能快速定位,那这个工具绝对值得一试
项目今天更新到 v0.1 版本,还有很多不完善的地方。有任何 bug 或者建议,都可以在 GitHub 提 issue,我会第一时间回复。
如果觉得这个项目对你有帮助,麻烦去 GitHub 点个 Star,这对真的非常非常重要。谢谢大家🙏
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)