从 AI协助者 到 AI管理者:解放你的注意力

在AI的浪潮中,许多人仍停留在把任务丢给AI的阶段:写文案、生成报表、改代码……AI产出之后,你还得一遍又一遍检查、修正。真正的AI自动化,其实不是让AI替你做事,而是让AI帮你守住注意力,让你从反复确认中彻底解放。

通过长时运行(Long-Running)AI Agent架构和明确的评分标准(Rubric),你可以让AI自主迭代直至达成目标,从「AI协助者」升级为「AI管理者」。


🔍 核心痛点与技术原理

1️⃣ AI偷懒的根源:Contexts Anxiety(上下文焦虑)

Anthropic 2025年的研究指出,LLM中途停滞的主因是Context Window快满时产生焦虑。模型害怕「上下文不够用」,于是提前结束或生成敷衍的总结。换句话说,AI也会出现「下班心态」。

2️⃣ /goal

功能的架构突破

Cloud Code、OpenAI Codex、Hermis Agent 等工具推出 /goal 功能,通过Executor + Reviewer双角色实现自我校正:

  • Executor(实作者):负责执行任务。
  • Reviewer(评审):每轮检查任务完成度,未达标则指出问题并强制实作者继续修改。

这个设计就像「悬在眼前的萝卜」,不断驱动Agent迭代直到目标完成。它延续了早期的 Rough Loop 精神,现在已成为官方标准功能。


📝 高效 Go Prompt 的五大关键要素

模糊目标只会让AI快速敷衍。一个高效的Go Prompt应包含:

  1. 完成状态(Goal)
    明确终点标准,例如:结账页响应时间 < 0.2 秒。
  2. 验证方式(Verification)
    通过客观工具或方法证明完成,例如:使用速度测试工具验证。
  3. 限制条件(Constraints)
    明确禁止修改的范围,例如:仅修改结账区块,其他功能保持原样。
  4. 迭代政策(Iteration Policy)
    每轮记录修改内容与测试结果,并决定下一步策略。
  5. 错误处理(Error Handling)
    当任务卡住时,暂停并回报已尝试的策略,等待指示。

🎨 知识/创意工作的 Rubric 套用逻辑

在这里插入图片描述

对于设计、写作、影片等主观工作,需将模糊品味拆解为可执行的评分标准(Rubric)

  • 案例:Anthropic网页设计研究
    将主观的「美感」拆解为四个维度:设计品质原创性技术执行可用性
    对AI容易侥幸通过的维度加重权重,并让评审直接检视最终产出而非代码。经过多轮迭代,AI可生成超预期的创意,例如 3D 空间网站。
  • 核心洞察
    关键不在 Prompt Engineering,而在 Evaluation/Rubric Engineering。清晰的评估标准,是评审Agent的指南针,确保迭代方向不偏离你的真实品味。

🛠️ 实战 SOP:6 步打造个人化 Rubric

  1. Baseline(基准测试):先丢任务让AI随机产出,了解当前能力基线。
  2. 提取皱眉点:逐份检视产出,记录不满原因(如缺乏 Hook、滥用破折号)。
  3. 分类围堵:将缺点归纳为评分维度(如逻辑断层、缺乏人味、开头无力)。
  4. 具体化案例:用绝对禁令 + 具体范例替代抽象描述。
    例如:「绝对不要用破折号连接短句」、「绝对不要使用『在AI时代』起手式」。
  5. 确保多样性:提供多种风格/案例,防止AI过度拟合单一范本。
  6. 实测与微调:将 Rubric 交给评审Agent跑 3-4 轮,若产出仍不符预期,回头修正 Rubric。

💡 结论与行动建议

  • Rubric 的本质是 「把脑中模糊的品味写成文字」。一旦明确,AI即可替你守门并大规模执行。
  • 练习建议:挑选最常做且高度依赖个人评味的任务(写贴文、回客户信、剪影片等),花 30 分钟套用 6 步法。跑通后,AI产出将更稳定、贴近你的预期。

通过长时运行的AI Agent + 明确的Rubric,你将不再是AI的监督者,而是真正的 AI管理者

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐