我把 AI Flow Architect 从一个框架，做成了一个生态

2601_96113992

519人浏览 · 2026-05-22 21:06:24

2601_96113992 · 2026-05-22 21:06:24 发布

几天前，我在 GitHub 上开源了 AI Flow Architect。

当时的想法很朴素：让 AI 做事，别让它自己检查自己。用两个独立的大脑，一个生成，一个审查，中间加一道对抗评审。114 个单元测试，项目跑通了。

但最近我意识到，我做的这件事，定位从一开始就错了。

我以为我在做一个框架。实际上，我在做的是一层信任中间件。

这两件事，差别很大。

为什么需要"信任"

你用 GPT-4 写了一段登录逻辑。它给你的代码看起来很干净——API 设计合理，数据库 schema 整洁，中间件也到位了。你扫了一遍，感觉不错，合进主分支。

三周后，安全扫描报警：密码哈希用的是 MD5，登录接口没有限速。

这不是 GPT-4 在撒谎。它只是没有机制发现自己的盲点。

同一个模型检查自己的输出，等于什么都没检查。这是结构性问题，不是提示词问题，换再好的 prompt 也绕不过去。

从"框架"到"生态"——我的认知转变

AI Flow Architect 最初的设计是：你把任务扔进来，它跑完整的三阶段流水线——Brain#1 规划、专家团队执行、Brain#2 仲裁。全自动，有质量保证。

这个设计本身没有问题。但它有一个隐含假设：你愿意换掉现有工作流。

现实是：大多数人有自己的 LangChain 链、自己的 Cursor 工作流、自己的 CI/CD 流程。没有人想因为引入一个质量工具就重写整个项目。

所以我做了一个决定：把 TrustEngine 从框架里剥离出来，做成独立的审计层。

你不需要用 FlowArchitect。你只需要：

from ai_flow_architect import TrustEngine

engine = TrustEngine(brain2="claude-3-5-sonnet")
report = engine.audit(
    requirement="实现带限速的密码重置接口",
    ai_output=your_generated_code
)
print(report.verdict)   # "pass" | "review" | "reject"

三行代码，任何地方都能加进去。你的框架不变，你的工作流不变。

生态架构图——三层设计

现在整个项目分三层：

底层：TrustEngine（信任引擎） 这是核心，也是最小可用单元。三个审查员并行跑（BrainTwo 多元仲裁），BrainOpponent 做反例攻防，最后输出带证据链的 TrustReport。它是无状态的，没有副作用，你可以把它插进任何地方。

关键设计：它会告诉你它不确定什么。

## Uncertainty
- [HIGH] 并发安全：仲裁员意见分歧（60 vs 90），建议人工复查
- [MEDIUM] 边缘情况：未覆盖负数输入场景

一个永远输出"通过"的审计工具没有意义。TrustEngine 会诚实地承认自己的局限。

中层：包装层（三种接入方式）

API：FastAPI 服务，一次部署，团队共享
Skill：IDE 插件形式，一条命令调用
GitHub Action：PR 自动触发审查，merge 前拦截

入乡随俗。你用什么工作流，就用什么方式接进来。

上层：FlowArchitect（完整框架） 完整的三阶段流水线，BrainOne 规划 → 专家执行 → TrustEngine 审查 → 全程可追溯记录。适合需要完整质量保证的场景。

TrustReport——审计结果长什么样

这是一次真实审查的输出。被审的是一个银行系统的登录服务。

三个仲裁员，三种视角：

GPT-4o（严格审计员）：评分 60，REJECT——发现了 SQL 注入和竞态条件
Claude-3.5-Sonnet（架构师）：评分 85，PASS——架构整体合理
DeepSeek-Chat（代码审查员）：评分 70，PASS——有问题但可接受

最终判决：REJECT，置信度 40/100

置信度低不是系统的失败，是系统在告诉你：仲裁员之间存在严重分歧，这件事需要你人工决定，不能交给 AI 自动处理。

这是我认为最重要的设计哲学：AI 该做的是把问题摆到你面前，而不是替你做决定。

证据链是 SHA-256 哈希 + UTC 时间戳，每次审查结果都可追溯、可复现。

当前状态和下一步

项目目前的状态：

177 个单元测试，全部通过
支持 OpenAI + Anthropic 生产验证，另有 5 个 OpenAI 兼容协议提供商（DashScope、GLM、Moonshot、DeepSeek、Ollama）等待社区验证
TrustEngine 已独立可用
FlowArchitect 完整流水线可运行

接下来在做的：

PyPI 包（pip install ai-flow-architect）
CLI 接口（ai-flow audit your_code.py）
并行执行（当前专家串行，独立步骤可以并发）

结尾

我不想造一个让大家都来用我框架的工具。

我想造的是一层每个人都能插进自己工作流里的东西——不管你用 LangChain、用 Cursor、用自己写的脚本，都能在 AI 输出和你信任它之间，加一道真正有用的检查。

幻觉的问题不会因为模型变强就消失。它会因为你有了独立的、诚实的审计机制而变得可管理。

GitHub：https://github.com/wdnmd1265/ai-flow-architect

如果你也在用 AI 生成代码，欢迎试试，有问题直接开 issue。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AtomGit 2026年6月三方库下载量排行榜重磅发布！双榜格局稳固，生态深耕持续发力

AtomGit开源社区

AtomGit 6 月：AtomCode CodingPlan 上线 GLM-5.2！

AtomGit开源社区

腾讯 Hy3 上线 AtomGit AI，更强、更稳、更落地的开源国产大模型

AtomGit开源社区

所有评论(0)

查看更多评论

2601_96113992

@2601_96113992

已为社区贡献8条内容

我把 AI Flow Architect 从一个框架，做成了一个生态

2601_96113992

所有评论(0)

温馨提示：您尚未绑定手机号

2601_96113992