前言

各位码农兄弟姐妹们,有没有过这种抓狂时刻?你辛辛苦苦给AI Agent下了一个任务:“帮我修好这个登录模块”,它吭哧吭哧改了俩文件,突然弹窗问你:“接下来干啥?”——可bug还在满地打滚啊!不是说好一起肝到天亮吗?怎么刚到深夜就罢工?

别急,2026年春天,一位在澳洲草原上数羊的大叔Geoffrey Huntley,用三行看似“土得掉渣”的bash脚本,硬生生把整个AI编程界整不会了。这脚本名叫Ralph Loop,逻辑简单粗暴:只要任务没完成,就无限循环喂prompt,死磕到底!结果短短11天,OpenAI、Anthropic、Nous Research三大巨头齐刷刷上线/goal功能,仿佛连夜开了个“AI不能烂尾”紧急峰会。

更绝的是,三家方案各显神通:Codex靠数据库“不忘事”,Hermes拉群搞“AI团队作战”,Claude Code则请来小模型当“监工裁判”。这哪是技术更新?分明是AI从“会写代码”迈向“能把活干完”的成人礼!接下来,咱们就掰开揉碎,看看这三行代码如何撬动千亿级Agent工作流赛道——毕竟,真正的智能,不是多聪明,而是多靠谱!

1. 牧羊大叔的三行神咒:Ralph Loop横空出世

在澳洲某片风吹草低见牛羊的旷野上,程序员兼牧羊人Geoffrey Huntley正被自家AI气得薅羊毛——你让它修个bug,它干到一半突然弹窗:“亲,接下来咋整?”
Geoffrey一怒之下甩出三行bash,堪称赛博民间偏方:

while :; do
  cat PROMPT.md | claude-code --continue
done

这玩意儿没花里胡哨的架构,没智能调度,就一个字:莽。只要PROMPT.md还在,就往死里喂给Claude,干不完?重来!上下文爆了?开新进程接着啃!进度全靠Git和文件系统硬扛,糙得像Ralph Wiggum本人——《辛普森一家》里那个总说“Me fail English? That’s unpossible!”却永远不认输的憨憨小孩。

Geoffrey管这叫 Ralph Loop,意思是:哪怕搞不清状况,也绝不撂挑子。

别笑,这原始暴力的循环,恰恰戳中了2026年前所有AI编程工具的阿喀琉斯之踵——它们聪明如狐,却总在最后一公里躺平。而Ralph Loop不讲武德,只讲把事干完。结果?三行代码,11天引爆三大厂,堪称AI界的“土法炼钢,炼出了核弹”。

2. 三大厂集体‘抄作业’:11天内的技术闪电战

Geoffrey那三行“土法炼钢”的bash脚本,就像往AI编程池子里扔了颗深水炸弹——炸得三大厂连夜爬起来改代码。

4月30日,OpenAI第一个冲进战局,Codex直接上线 /goal,Greg Brockman在X上轻描淡写一句:“Codex现已内置Ralph loop++”,仿佛只是顺手加了个功能。可程序员都懂,这哪是顺手?这是把用户从“改俩文件就罢工”的泥潭里一把薅出来!

紧接着,Hermes Agent五天后跟上节奏,不声不响把多智能体调度和/goal绑成套餐;再过四天,Claude Code也坐不住了,Anthropic压轴登场。11天,三家巨头不约而同祭出同名指令,连命名都透着股心照不宣的默契——你抄我抄大家抄,抄的是Ralph那份死磕到底的憨劲儿。

以前你让AI修个登录模块,它兴高采烈改完auth.js就问:“主人还想要什么?”现在?设个/goal,它真能干到测试全绿、lint无错才肯撒手。这场闪电战打得快准狠,核心就一句话:别整那些花活,先把活干完!

这场罕见的同步行动,暴露出行业心照不宣的焦虑:用户早已厌倦了AI“半途撂挑子”的交互模式。就在三周前,开发者还在论坛上自嘲:“让Claude修个bug,它修完一半跑去给我写README,还问我要不要加个emoji。”如今,三大厂用11天时间集体转向——从争相展示生成速度,到竞相承诺交付闭环。连命名都刻意呼应原始创意,OpenAI的“Ralph loop++”不只是彩蛋,更是对那个牧羊大叔所代表的朴素信念的致敬:代码可以糙,活必须干完。

3. 各显神通:三巨头的/goal实现哲学大不同

3.1 Codex:断点续跑,关机都不怕

OpenAI的Codex走的是“稳如老狗”路线。你设个/goal修登录页的OAuth回调bug,哪怕中途合盖睡觉、断电重启,它都能从Git里扒出上次改到哪一行,接着肝。背后靠的是本地app-server层的状态快照——目标、上下文、token用量全塞进SQLite小本本记好。模型干一半token见底?不慌,触发“软着陆”,优雅存档而非直接摆烂。有哥们实测连跑14小时修设备驱动,中间去冲了三杯咖啡还遛了狗,回来发现Codex默默把最后两个test case跑绿了。这哪是AI编程,这是请了个永不断电的赛博牛马。

3.2 Hermes Agent:一人不行,就上团战

Hermes Agent直接把/goal玩成项目管理沙盘。你说“重构整个支付模块”,它反手就把任务拆成鉴权、对账、回调三个子卡,派三个Agent worker并行开干。每个worker都是独立进程,带身份证(role)、工作目录和专属模型配置。更狠的是五层防烂尾机制:心跳报到防失联,僵尸回收防挂机,退出拦截防摸鱼,幻觉拦截防嘴硬——你说文件建好了?系统当场ls一下,没看见就打回重练。最绝的是重试预算,超限自动喊人,绝不让AI在死循环里表演电子坐牢。这哪是写代码,这是搞了个AI天团在工位上卷KPI。

3.3 Claude Code:自己判自己?门儿都没有

Anthropic偏不信AI能客观验收成果。Claude干完一轮活,想喊“搞定啦”?不行!系统立马拉来小老弟Haiku当裁判。Haiku只看对话记录,对照你写的完成条件(比如“auth目录测试全过且不碰user.js”),冷酷打分。没过?必须吐出具体理由:“test_login.py还有两个AssertionError”,这理由直接塞进下轮上下文,逼Claude精准补刀。裁判模型不读磁盘不跑命令,纯靠文本验真——逼得开发者把验收标准写得比PRD还细。说白了,Anthropic信不过大模型自评,宁可搞个“代码纪检委”盯着,也要杜绝那种“我觉得我修好了”的职场幻觉。

4. 小命令大战场:/goal背后的Agent生态卡位战

4.1 一个小斜杠,撬动整个Agent江湖

别小看这行/goal,它根本不是功能,是钩子——专钓开发者习惯的鱼钩。谁先让用户敢设完目标就去刷剧、遛狗、放羊,谁就卡住了AI编程流水线的咽喉。

4.2 习惯一养成就难搬家

一旦你的项目跑通了断点续传、自动回滚、多Agent协同,再换工具?等于把整套数字工位拆了重装。迁移成本不是线性涨,是指数级爆炸。今天省你三分钟,明天锁你三年命。

4.3 护城河不在模型,在工作流

OpenAI、Anthropic、Hermes表面卷的是“干完活”,实则抢的是“不用管”。谁能成为开发者眼里的“电子监工”,谁就攥住了下一代编程基建的钥匙——毕竟,最贵的不是算力,是信任。

结语:不是模型更聪明,而是做事更靠谱

笔者觉得,Geoffrey Huntley压根没想颠覆谁——他只是烦了Agent干一半就撂挑子,顺手甩了个while循环,结果炸出了AGI落地最缺的那块拼图:靠谱。不是智商爆表,是死磕到底;不是生成惊艳代码,是默默跑完最后一轮测试。草根智慧,往往最懂打工人的心。

更魔幻的是,OpenAI、Anthropic和Hermes连犹豫都没犹豫,十一日内齐刷刷把这土法炼钢塞进核心功能。这哪是技术迭代?分明是行业顿悟:用户要的不是会说话的模型,是能交差的伙计。AI编程的终局,或许不拼谁更聪明,而拼谁更能扛住deadline不跑路。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐