我的龙虾当起了赛博包工头 OpenClaw-AgentCrew
AgentCrew | Enterprise Multi-Agent Collaboration Framework
我在一台服务器上部署了一个openclaw实例
我有很多token,所以我决定让它为我干点事情
我想到,让它去瞎写代码,然后上传到github上,是一条途径
但是,由于open claw自身架构限制,加上大模型的能力有限,经常出现遗忘我的要求,遗忘工作流程的问题
最关键的是,一旦离开我的push,它便很不自觉的停止工作,那就和claude/codex/cline等agent没啥差别了
还有另外的问题,我希望它能调研、能创建、能开发、能测试、能巡检此前工作、能不断深化仓库开发,但是如果都糅在一个上下文里面,会很脏,很低效
于是我让他,尝试创建一个agent team,供给它指挥调度,team里面的其他agent,利用各类skill,开发则调claude,相当于我的claw又组织起了一堆员工。
但是问题随之而来——
这team建是建了,干起活来却像个没头的苍蝇。
Developer-A让它写个接口,它咔咔一顿操作,代码是写出来了,一跑,boom,报错了。QA-B让它改,它说是QA的事。QA让它修Bug,它说这是架构问题。Architect让它优化,它说没时间。推来推去,最后还是得我来写提示词擦屁股。
这不叫团队协作,这叫互踢皮球。
我一看,这不对。团队是有了,但没有流程、没有分工、没有标准。它以为把一堆Agent放在一起,就能自动协作了?天真。
任务拆分:从一盘散沙到流水线
于是我让它学会了任务拆分。
一个简单的大任务,拆成十个中任务,十个中任务拆成一百个小任务。每个小任务都要明确:谁来做?做什么?用什么skill?交付标准是什么?
比如"开发一个用户登录模块":
- Architect-001 先出技术方案,选型、数据库设计、接口规范
- Developer-A 写 user model、controller
- Developer-B 写 service、middleware
- QA-001 写 test case、performance test
- TechWriter 写 API 文档
每个人只做自己那一段,做完就交给下一个。像富士康的流水线,而不是小作坊。
具体到每个任务的描述也要清晰:
Task: 实现用户注册接口
- Skill: code + read + write
- Input: POST /api/v1/users/register
- Validation: email格式、password长度
- Output: user_id, token
- Test: 正常case、异常case、并发case
这样,每个Agent拿到任务一看就知道要干什么,不用再问来问去。
但它还是记不住事
任务拆分是学会了,但还有另一个问题——它记不住事。
今天让它优化一下数据库索引。第二天再问,它完全忘了这回事。前脚刚说完"以后代码要加类型注解",后脚又给我写出一堆any。问就是"抱歉,我忘了"。
这不叫AI,这叫金鱼。
我反思了一下,问题在于:上下文窗口有限,它记不了那么多东西。新任务一来,旧记忆就被挤出去了。像我大脑一样——刚背的单词,睡一觉就忘了。
于是我让它长了记性。
三层记忆体系
第一层:短期记忆
当前任务的上下文,用完就焚。像草稿纸,写完就扔。
每次执行任务前,它会把任务描述、已知信息、用户要求都加载到短期记忆里。任务执行过程中,随时存取。任务一结束,短期记忆立即清空,不影响下一个任务。
第二层:长期记忆
重要的事情,刻进骨子里。
- 用户偏好:喜欢什么编码风格、注释写到什么程度、测试覆盖率要求多少
- 工作流程:提pr要有哪些步骤、code review要注意什么、commit message怎么写
- 关键决策:为什么选这个技术栈、这个设计模式的考量是什么
这些记忆用 SQLite 持久化存储,重启也不会丢。每次启动时,先把长期记忆加载一遍——"哦对,用户喜欢用中文写注释"。
第三层:向量记忆
这是最神奇的一层。
它会把每次执行的经验都用向量存起来。下次遇到类似的问题,不用精确匹配,用语义搜索就能"想起来"——"哎我好像在哪见过这种情况"。
比如上次遇到过"数据库连接池耗尽"的问题,这次再遇到类似的,它会自己翻向量记忆:"哦对,上次也是这样,后来是改了max_connections参数解决的"。
像个人了。
每次任务结束,都要复盘
但光有记忆还不够,还得强制复盘。
每次任务执行完毕,不管成功失败,都要过一遍:
- 这次做了什么?
- 遇到什么问题?
- 怎么解决的?
- 有什么教训下次注意?
- 有没有遗留问题?
回答不上来?不许结束。
回答完了,自动写入长期记忆。下次遇到类似场景,自动调取。
这叫什么?吃一堑长一智。
它太懒了
但还有第三个问题——它太懒了。
我不在服务器上,它就不动。我不push,它就躺着。我不在的日子,它比我还清闲。早上起来一看,github贡献又是0,coding plan的token消耗也是0%,不知道的以为这是个静态博客。
这不叫自主决策,这叫等着吃饭。
我需要的是:一个不需要我催、主动找活干的员工。而不是一个大爷。
于是我让它学会了主动执行。
自动巡逻
每三十分钟,自动巡逻一圈。
- 检查任务队列:有没有待办事项?有没有卡住的任务?
- 检查异常:最近有没有报错?有没有超时?有没有crash?
- 检查健康:依赖库有没有新版本?代码有没有警告?
发现问题,不用我催,自己记到待办列表里。
不用催,自己干
发现问题怎么办?干它。
- 依赖过期了?自己升级
- 测试失败了?自己排查
- 代码有警告?自己修
- 有垃圾文件?自己清理
有些问题它能自己解决,有些需要我确认。但不管怎样,不用我催第二步。
干完要汇报
但也不能闷头干活不吱声。
每次主动执行完,要生成报告:
[主动执行报告]
时间: 2026-03-12 10:30:00
发现: 3个问题
- test_user.py 有2个测试失败
- package.json 有1个依赖过期
- logs/ 目录有500MB旧日志
处理: 3个问题
- 修复了 test_user.py 的测试失败
- 升级了过期依赖
- 清理了旧日志,释放了500MB
遗留: 0个问题
我只需要偶尔来看看它的报告,就知道它在干什么。
它也会犯错
一开始我还不放心,在后台偷偷看它干活。
结果发现它真的在动——自己巡检、自己修复、自己写报告。像模像样的。
但问题来了——它也会犯错。
让它清理日志,它把正在用的日志也删了。让它升级依赖,它把主版本也升了,导致兼容性报错。让它修bug,它修一个的同时又引入了三个。
这不叫员工,这叫熊孩子。
于是我加了几道保险:
危险操作确认
删除、覆盖、升级主版本这类操作,不能让它直接执行。必须生成操作计划,让我确认同意后才能动手。
回滚机制
每次重要操作前,先打快照。出了问题,一键回滚。
增量验证
让它每次只改一点,验证通过再改下一处。像写测试一样——小步前进,及时反馈。
这回,它再犯错也在可控范围内了。
但最大的问题是:它不会进步
修bug谁不会?清理日志谁不会?但它修完就完了,下次遇到同样的问题,还是不会。
这不叫学习,这叫应激反应。
于是我让它学会了自我进化。
CodeInspector:定期巡检
每周一次,扫描整个代码库:
- 过时的依赖
- 不安全的写法
- 未处理的异常
- 未使用的变量
- 可以简化的代码
- 可以提取的重复逻辑
扫描结果存起来,按严重程度排序。
AutoFixer:能自己修的自己修
巡检完了,不是扔给我就算了。
- 能自动修复的,自己动手
- 需要我确认的,生成修复建议
- 不确定的,标记出来让我看
比如:
- "未使用的变量"——直接删
- "可以用列表推导式"——直接改
- "这个异常捕获太宽泛"——生成建议,等我确认
- "这段逻辑复杂度太高"——标记出来,让我决定是否重构
EvolutionHistory:记录每一次进化
每次巡检、修复、学习,都要记下来:
[进化记录]
时间: 2026-03-12
巡检: 发现26个问题
- 15个已自动修复
- 8个待确认
- 3个需人工处理
学习:
- 新增经验:数据库连接池配置
- 更新偏好:测试覆盖率需>80%
- 修正错误:之前对异常处理的理解有误
下次遇到类似场景,自动调取这些经验。
到后来,很多事它自己就做了
一开始,我还要每天看它的报告,给它派活。
后来,很多事情它自己就发现了、自己就修了:
- 依赖过期?自己升
- 测试失败?自己修
- 代码警告?自己消
- 日志满了?自己清
我只需要偶尔来看看它干得怎么样,给它一个大致方向就够了。
像一个真正的甩手掌柜。
它不再需要我了
不是抛弃我的意思。
而是很多事情,它自己能做决定、自己能执行、自己能改进。我只需要在关键节点把控一下方向,其他时候它自己就能转起来。
就像一个成熟的团队,不需要老板天天盯着打卡。
现在
现在,它还在那台服务器上跑着。
我偶尔会去看看它,看它在干什么。大部分时候,它都在忙:
- 巡检代码质量
- 优化项目结构
- 补充测试用例
- 清理过期数据
- 更新文档
- 提交pr
现在commit是它自己写的,bug是它自己修的。很多时候,我甚至不知道它在干活,直到某天上去一看——哎,coverage怎么从60%涨到85%了?
像一个真正会自己干活的人。
而我,终于可以安心去做别的事了。
有时候我会想,这东西真的有在"思考"吗?还是只是看起来像在思考?
我不知道。
但我知道,它在干活,而且干得比我预期的好。
这就够了。
未完待续。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)