从AI协助者到AI管理者：解放你的注意力

草明

476人浏览 · 2026-06-12 11:13:16

草明 · 2026-06-12 11:13:16 发布

从 AI协助者到 AI管理者：解放你的注意力

在AI的浪潮中，许多人仍停留在把任务丢给AI的阶段：写文案、生成报表、改代码……AI产出之后，你还得一遍又一遍检查、修正。真正的AI自动化，其实不是让AI替你做事，而是让AI帮你守住注意力，让你从反复确认中彻底解放。

通过长时运行（Long-Running）AI Agent架构和明确的评分标准（Rubric），你可以让AI自主迭代直至达成目标，从「AI协助者」升级为「AI管理者」。

🔍 核心痛点与技术原理

1️⃣ AI偷懒的根源：Contexts Anxiety（上下文焦虑）

Anthropic 2025年的研究指出，LLM中途停滞的主因是Context Window快满时产生焦虑。模型害怕「上下文不够用」，于是提前结束或生成敷衍的总结。换句话说，AI也会出现「下班心态」。

2️⃣ `/goal`

功能的架构突破

Cloud Code、OpenAI Codex、Hermis Agent 等工具推出 /goal 功能，通过Executor + Reviewer双角色实现自我校正：

Executor（实作者）：负责执行任务。
Reviewer（评审）：每轮检查任务完成度，未达标则指出问题并强制实作者继续修改。

这个设计就像「悬在眼前的萝卜」，不断驱动Agent迭代直到目标完成。它延续了早期的 Rough Loop 精神，现在已成为官方标准功能。

📝 高效 Go Prompt 的五大关键要素

模糊目标只会让AI快速敷衍。一个高效的Go Prompt应包含：

完成状态（Goal）
明确终点标准，例如：结账页响应时间 < 0.2 秒。
验证方式（Verification）
通过客观工具或方法证明完成，例如：使用速度测试工具验证。
限制条件（Constraints）
明确禁止修改的范围，例如：仅修改结账区块，其他功能保持原样。
迭代政策（Iteration Policy）
每轮记录修改内容与测试结果，并决定下一步策略。
错误处理（Error Handling）
当任务卡住时，暂停并回报已尝试的策略，等待指示。

🎨 知识/创意工作的 Rubric 套用逻辑

在这里插入图片描述

对于设计、写作、影片等主观工作，需将模糊品味拆解为可执行的评分标准（Rubric）：

案例：Anthropic网页设计研究
将主观的「美感」拆解为四个维度：设计品质、原创性、技术执行、可用性。
对AI容易侥幸通过的维度加重权重，并让评审直接检视最终产出而非代码。经过多轮迭代，AI可生成超预期的创意，例如 3D 空间网站。
核心洞察
关键不在 Prompt Engineering，而在 Evaluation/Rubric Engineering。清晰的评估标准，是评审Agent的指南针，确保迭代方向不偏离你的真实品味。

🛠️ 实战 SOP：6 步打造个人化 Rubric

Baseline（基准测试）：先丢任务让AI随机产出，了解当前能力基线。
提取皱眉点：逐份检视产出，记录不满原因（如缺乏 Hook、滥用破折号）。
分类围堵：将缺点归纳为评分维度（如逻辑断层、缺乏人味、开头无力）。
具体化案例：用绝对禁令 + 具体范例替代抽象描述。
例如：「绝对不要用破折号连接短句」、「绝对不要使用『在AI时代』起手式」。
确保多样性：提供多种风格/案例，防止AI过度拟合单一范本。
实测与微调：将 Rubric 交给评审Agent跑 3-4 轮，若产出仍不符预期，回头修正 Rubric。

💡 结论与行动建议

Rubric 的本质是 「把脑中模糊的品味写成文字」。一旦明确，AI即可替你守门并大规模执行。
练习建议：挑选最常做且高度依赖个人评味的任务（写贴文、回客户信、剪影片等），花 30 分钟套用 6 步法。跑通后，AI产出将更稳定、贴近你的预期。

通过长时运行的AI Agent + 明确的Rubric，你将不再是AI的监督者，而是真正的 AI管理者。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Step3-VL 多模态模型主干代码九章排错与重写

Step3-VL多模态模型代码优化摘要原1074行代码经九章编程法重构为385行，修复20个核心缺陷（含6个致命崩溃级问题）。主要改进：缺陷修复：解决未初始化变量、维度硬编码、参数边界缺失等致命问题架构分层：拆分配置池(C)、数据池(B)、操作池(A)，实现物理隔离边界强化：新增参数校验、异常兜底机制，覆盖输入维度、索引范围等风险点代码精简：清理死代码冗余逻辑，函数职责单一化典型问题示