AgentCrew | Enterprise Multi-Agent Collaboration Framework

我在一台服务器上部署了一个openclaw实例

我有很多token,所以我决定让它为我干点事情

我想到,让它去瞎写代码,然后上传到github上,是一条途径

但是,由于open claw自身架构限制,加上大模型的能力有限,经常出现遗忘我的要求,遗忘工作流程的问题

最关键的是,一旦离开我的push,它便很不自觉的停止工作,那就和claude/codex/cline等agent没啥差别了

还有另外的问题,我希望它能调研、能创建、能开发、能测试、能巡检此前工作、能不断深化仓库开发,但是如果都糅在一个上下文里面,会很脏,很低效

于是我让他,尝试创建一个agent team,供给它指挥调度,team里面的其他agent,利用各类skill,开发则调claude,相当于我的claw又组织起了一堆员工。

但是问题随之而来——

这team建是建了,干起活来却像个没头的苍蝇。

Developer-A让它写个接口,它咔咔一顿操作,代码是写出来了,一跑,boom,报错了。QA-B让它改,它说是QA的事。QA让它修Bug,它说这是架构问题。Architect让它优化,它说没时间。推来推去,最后还是得我来写提示词擦屁股。

这不叫团队协作,这叫互踢皮球。

我一看,这不对。团队是有了,但没有流程、没有分工、没有标准。它以为把一堆Agent放在一起,就能自动协作了?天真。


任务拆分:从一盘散沙到流水线

于是我让它学会了任务拆分

一个简单的大任务,拆成十个中任务,十个中任务拆成一百个小任务。每个小任务都要明确:谁来做?做什么?用什么skill?交付标准是什么?

比如"开发一个用户登录模块":

  • Architect-001 先出技术方案,选型、数据库设计、接口规范
  • Developer-A 写 user model、controller
  • Developer-B 写 service、middleware
  • QA-001 写 test case、performance test
  • TechWriter 写 API 文档

每个人只做自己那一段,做完就交给下一个。像富士康的流水线,而不是小作坊。

具体到每个任务的描述也要清晰:

Task: 实现用户注册接口
- Skill: code + read + write
- Input: POST /api/v1/users/register
- Validation: email格式、password长度
- Output: user_id, token
- Test: 正常case、异常case、并发case

这样,每个Agent拿到任务一看就知道要干什么,不用再问来问去。


但它还是记不住事

任务拆分是学会了,但还有另一个问题——它记不住事

今天让它优化一下数据库索引。第二天再问,它完全忘了这回事。前脚刚说完"以后代码要加类型注解",后脚又给我写出一堆any。问就是"抱歉,我忘了"。

这不叫AI,这叫金鱼。

我反思了一下,问题在于:上下文窗口有限,它记不了那么多东西。新任务一来,旧记忆就被挤出去了。像我大脑一样——刚背的单词,睡一觉就忘了。

于是我让它长了记性。

三层记忆体系

第一层:短期记忆

当前任务的上下文,用完就焚。像草稿纸,写完就扔。

每次执行任务前,它会把任务描述、已知信息、用户要求都加载到短期记忆里。任务执行过程中,随时存取。任务一结束,短期记忆立即清空,不影响下一个任务。

第二层:长期记忆

重要的事情,刻进骨子里。

  • 用户偏好:喜欢什么编码风格、注释写到什么程度、测试覆盖率要求多少
  • 工作流程:提pr要有哪些步骤、code review要注意什么、commit message怎么写
  • 关键决策:为什么选这个技术栈、这个设计模式的考量是什么

这些记忆用 SQLite 持久化存储,重启也不会丢。每次启动时,先把长期记忆加载一遍——"哦对,用户喜欢用中文写注释"。

第三层:向量记忆

这是最神奇的一层。

它会把每次执行的经验都用向量存起来。下次遇到类似的问题,不用精确匹配,用语义搜索就能"想起来"——"哎我好像在哪见过这种情况"。

比如上次遇到过"数据库连接池耗尽"的问题,这次再遇到类似的,它会自己翻向量记忆:"哦对,上次也是这样,后来是改了max_connections参数解决的"。

像个人了。


每次任务结束,都要复盘

但光有记忆还不够,还得强制复盘

每次任务执行完毕,不管成功失败,都要过一遍:

  1. 这次做了什么?
  2. 遇到什么问题?
  3. 怎么解决的?
  4. 有什么教训下次注意?
  5. 有没有遗留问题?

回答不上来?不许结束。

回答完了,自动写入长期记忆。下次遇到类似场景,自动调取。

这叫什么?吃一堑长一智。


它太懒了

但还有第三个问题——它太懒了

我不在服务器上,它就不动。我不push,它就躺着。我不在的日子,它比我还清闲。早上起来一看,github贡献又是0,coding plan的token消耗也是0%,不知道的以为这是个静态博客。

这不叫自主决策,这叫等着吃饭。

我需要的是:一个不需要我催、主动找活干的员工。而不是一个大爷。

于是我让它学会了主动执行

自动巡逻

每三十分钟,自动巡逻一圈。

  • 检查任务队列:有没有待办事项?有没有卡住的任务?
  • 检查异常:最近有没有报错?有没有超时?有没有crash?
  • 检查健康:依赖库有没有新版本?代码有没有警告?

发现问题,不用我催,自己记到待办列表里。

不用催,自己干

发现问题怎么办?干它。

  • 依赖过期了?自己升级
  • 测试失败了?自己排查
  • 代码有警告?自己修
  • 有垃圾文件?自己清理

有些问题它能自己解决,有些需要我确认。但不管怎样,不用我催第二步

干完要汇报

但也不能闷头干活不吱声。

每次主动执行完,要生成报告:

[主动执行报告]
时间: 2026-03-12 10:30:00
发现: 3个问题
- test_user.py 有2个测试失败
- package.json 有1个依赖过期
- logs/ 目录有500MB旧日志

处理: 3个问题
- 修复了 test_user.py 的测试失败
- 升级了过期依赖
- 清理了旧日志,释放了500MB

遗留: 0个问题

我只需要偶尔来看看它的报告,就知道它在干什么。


它也会犯错

一开始我还不放心,在后台偷偷看它干活。

结果发现它真的在动——自己巡检、自己修复、自己写报告。像模像样的。

但问题来了——它也会犯错

让它清理日志,它把正在用的日志也删了。让它升级依赖,它把主版本也升了,导致兼容性报错。让它修bug,它修一个的同时又引入了三个。

这不叫员工,这叫熊孩子。

于是我加了几道保险:

危险操作确认

删除、覆盖、升级主版本这类操作,不能让它直接执行。必须生成操作计划,让我确认同意后才能动手。

回滚机制

每次重要操作前,先打快照。出了问题,一键回滚。

增量验证

让它每次只改一点,验证通过再改下一处。像写测试一样——小步前进,及时反馈。

这回,它再犯错也在可控范围内了。


但最大的问题是:它不会进步

修bug谁不会?清理日志谁不会?但它修完就完了,下次遇到同样的问题,还是不会。

这不叫学习,这叫应激反应。

于是我让它学会了自我进化

CodeInspector:定期巡检

每周一次,扫描整个代码库:

  • 过时的依赖
  • 不安全的写法
  • 未处理的异常
  • 未使用的变量
  • 可以简化的代码
  • 可以提取的重复逻辑

扫描结果存起来,按严重程度排序。

AutoFixer:能自己修的自己修

巡检完了,不是扔给我就算了。

  • 能自动修复的,自己动手
  • 需要我确认的,生成修复建议
  • 不确定的,标记出来让我看

比如:

  • "未使用的变量"——直接删
  • "可以用列表推导式"——直接改
  • "这个异常捕获太宽泛"——生成建议,等我确认
  • "这段逻辑复杂度太高"——标记出来,让我决定是否重构

EvolutionHistory:记录每一次进化

每次巡检、修复、学习,都要记下来:

[进化记录]
时间: 2026-03-12
巡检: 发现26个问题
- 15个已自动修复
- 8个待确认
- 3个需人工处理

学习: 
- 新增经验:数据库连接池配置
- 更新偏好:测试覆盖率需>80%
- 修正错误:之前对异常处理的理解有误

下次遇到类似场景,自动调取这些经验。


到后来,很多事它自己就做了

一开始,我还要每天看它的报告,给它派活。

后来,很多事情它自己就发现了、自己就修了:

  • 依赖过期?自己升
  • 测试失败?自己修
  • 代码警告?自己消
  • 日志满了?自己清

我只需要偶尔来看看它干得怎么样,给它一个大致方向就够了。

像一个真正的甩手掌柜


它不再需要我了

不是抛弃我的意思。

而是很多事情,它自己能做决定、自己能执行、自己能改进。我只需要在关键节点把控一下方向,其他时候它自己就能转起来。

就像一个成熟的团队,不需要老板天天盯着打卡。


现在

现在,它还在那台服务器上跑着。

我偶尔会去看看它,看它在干什么。大部分时候,它都在忙:

  • 巡检代码质量
  • 优化项目结构
  • 补充测试用例
  • 清理过期数据
  • 更新文档
  • 提交pr

现在commit是它自己写的,bug是它自己修的。很多时候,我甚至不知道它在干活,直到某天上去一看——哎,coverage怎么从60%涨到85%了?

像一个真正会自己干活的人。

而我,终于可以安心去做别的事了。

有时候我会想,这东西真的有在"思考"吗?还是只是看起来像在思考?

我不知道。

但我知道,它在干活,而且干得比我预期的好。

这就够了。


未完待续。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐