从 Prompt 到智能体:深入理解 APE、Active-Prompt、DSP、PAL、ReAct 与 Reflexion
一、引言:Prompt Engineering 正在发生质变
在大语言模型(LLM)刚兴起时,Prompt Engineering 被简单理解为:
“如何写一句更好的提示词”
但随着模型能力不断增强,人们逐渐发现,仅靠单条 prompt 很难稳定解决复杂问题。模型可能:
- 推理不稳定
- 输出不可控
- 无法调用外部能力
- 无法自我修正
于是,Prompt Engineering 开始从“技巧”升级为“系统设计”。
今天我们常说的 Prompt 技术,已经不再是简单的提示词优化,而是逐渐形成了一整套体系,包括:
- 自动生成 Prompt(APE)
- 数据驱动优化(Active-Prompt)
- 输出控制(DSP)
- 工具增强推理(PAL)
- 推理+行动(ReAct)
- 自我反思学习(Reflexion)
本文将系统性拆解这六大核心技术,并重点分析它们之间的关系与工程落地方式。
二、APE:让模型自己写 Prompt
2.1 什么是 APE
APE(Automatic Prompt Engineer,自动提示工程)的核心思想是:
用模型来生成 Prompt,并通过评估机制筛选最优 Prompt
传统 Prompt Engineering 的问题在于:
- 依赖人工经验
- 调试成本高
- 不具备规模化能力
APE 将这个问题转化为一个优化问题:
在 Prompt 空间中搜索最优解
2.2 工作流程
APE 通常包含四个步骤:
- 生成候选 Prompt
- 在任务上运行
- 用评估函数打分
- 选择最优 Prompt
本质结构:
- Prompt Generator(生成器)
- Evaluator(评估器)
2.3 技术本质
APE 的本质其实非常接近:
- 神经架构搜索(NAS)
- 超参数优化
也就是说:
Prompt 不再是“写出来的”,而是“搜索出来的”
2.4 优势与局限
优势:
- 自动化程度高
- 可以发现人类难以想到的 prompt
- 适合大规模任务
局限:
- 计算成本高
- 依赖评估函数
- 不适合实时场景
三、Active-Prompt:只优化最关键的数据
3.1 核心思想
Active-Prompt 的核心是:
不优化所有数据,只优化“最难的数据”
它借鉴了主动学习(Active Learning)的思想。
3.2 工作流程
典型流程如下:
- 对同一个问题进行多次推理
- 计算输出的不确定性
- 找到最不确定的问题
- 人工标注这些问题
- 加入 few-shot 示例中
3.3 为什么有效?
因为:
- 简单问题 → 模型已经会
- 困难问题 → 才提供信息增量
因此:
用更少的数据,获得更高的性能提升
3.4 与 APE 的区别
| 维度 | APE | Active-Prompt |
|---|---|---|
| 优化对象 | Prompt | 示例数据 |
| 是否需要人工 | 不一定 | 需要 |
| 核心思想 | 搜索 | 选择 |
总结一句话:
APE 优化“说什么”,Active-Prompt 优化“举什么例子”
3.5 工程价值
适用于:
- 数据昂贵场景(医疗、法律)
- 高精度推理任务
- Few-shot 学习系统
四、DSP:让模型输出“听话”
4.1 什么是 DSP
DSP(Directional Stimulus Prompting,方向性刺激提示)的核心是:
通过约束,引导模型输出方向
4.2 常见形式
DSP 常见的控制方式包括:
- 限制输出格式
- 强制使用结构化输出
- 禁止某些词汇
- 指定语气或风格
例如:
- “请用 JSON 格式输出”
- “不要使用专业术语”
- “必须分三点回答”
4.3 本质
DSP 的本质是:
给模型增加“约束条件”
它解决的问题是:
- 模型太“发散”
- 输出不稳定
- 难以工程化
4.4 技术意义
DSP 是整个 Prompt 技术体系中的:
控制层
没有 DSP:
- Agent 输出不可控
- 系统无法稳定运行
五、PAL:让模型用代码思考
5.1 核心思想
PAL(Program-Aided Language Models)的核心是:
不直接回答问题,而是生成代码来解决问题
5.2 为什么需要 PAL
LLM 在以下方面存在问题:
- 数学计算不稳定
- 多步推理容易出错
- 逻辑严谨性不足
PAL 的解决方式:
把计算交给程序执行
5.3 工作流程
- 模型理解问题
- 生成代码(通常是 Python)
- 执行代码
- 返回结果
5.4 本质
PAL 的核心架构是:
- LLM:负责理解和生成
- 程序:负责执行
也就是说:
LLM 不再直接给答案,而是“编排答案”
5.5 与 ReAct 的关系
PAL 可以看作是:
ReAct 的一个特化版本(专注代码执行)
六、ReAct:让模型学会“行动”
6.1 核心思想
ReAct(Reason + Act)的核心是:
模型不仅思考,还可以行动
6.2 标准循环
ReAct 的核心循环是:
Thought → Action → Observation → Thought
6.3 示例流程
例如一个查询任务:
- Thought:需要查天气
- Action:调用天气 API
- Observation:返回天气数据
- Thought:生成答案
6.4 本质
ReAct 本质是:
推理 + 工具调用 + 环境交互
6.5 解决的问题
传统 CoT(思维链):
- 只能推理
- 不能获取新信息
ReAct:
- 可以查资料
- 可以调用工具
- 可以动态调整
6.6 工程价值
ReAct 是:
AI Agent 的核心基础
应用场景:
- 智能助手
- 自动化流程
- 搜索问答系统
七、Reflexion:让模型学会反思
7.1 核心思想
Reflexion 的核心是:
让模型从错误中学习,而不是重新训练
7.2 三阶段结构
- 执行任务
- 自我反思
- 更新策略
7.3 示例流程
- 初始回答
- 发现问题
- 生成反思
- 修正答案
7.4 与 ReAct 的关系
ReAct:
- 负责“做”
Reflexion:
- 负责“复盘”
两者关系:
Reflexion = ReAct + 反馈学习
7.5 本质
Reflexion 实际上是一个简单的学习系统:
- Actor(执行)
- Evaluator(评估)
- Memory(记忆)
7.6 最大价值
Reflexion 解决的是:
- 错误累积
- Agent 卡死
- 无法持续优化
八、六大技术的整体关系
8.1 演进路径
这六个技术可以看作一个清晰的演进过程:
Prompt → 优化 → 控制 → 工具 → Agent → 自学习
对应关系:
| 阶段 | 技术 |
|---|---|
| Prompt生成 | APE |
| 数据优化 | Active-Prompt |
| 输出控制 | DSP |
| 工具增强 | PAL |
| Agent执行 | ReAct |
| 自我进化 | Reflexion |
8.2 分层结构
可以将整个体系抽象为六层:
- 生成层(APE)
- 数据层(Active-Prompt)
- 控制层(DSP)
- 执行层(PAL / Tool)
- Agent层(ReAct)
- 学习层(Reflexion)
8.3 核心总结
这六个技术本质上对应六种能力:
| 能力 | 技术 |
|---|---|
| 自动生成 Prompt | APE |
| 优化训练数据 | Active-Prompt |
| 控制输出行为 | DSP |
| 使用外部工具 | PAL |
| 执行复杂任务 | ReAct |
| 自我进化能力 | Reflexion |
九、工程落地:如何组合使用?
9.1 推荐组合
在实际系统中,最常见的组合是:
APE + Active-Prompt + DSP + ReAct + Reflexion
9.2 标准架构
一个典型 AI 系统可以设计为:
用户输入
→ DSP 约束
→ ReAct Agent
→ 工具调用(PAL/API)
→ 输出结果
→ Reflexion 反思
→ 更新 Prompt(APE/Active)
9.3 实际案例
以智能客服为例:
- DSP:控制语气(礼貌、专业)
- ReAct:查询知识库
- PAL:计算价格或数据
- Reflexion:修正错误回答
- Active-Prompt:选择难问题优化
- APE:自动生成更优 Prompt
十、未来趋势
10.1 Prompt 不再手写
未来趋势:
Prompt 将由系统自动生成(APE)
10.2 数据选择比数据规模更重要
Active-Prompt 会替代“大量标注”
10.3 Agent 将成为主流
ReAct + 工具调用 = 标准 AI 架构
10.4 AI 将具备自学习能力
Reflexion 是迈向通用智能的重要一步
十一、总结
如果用一句话总结这六大技术:
它们共同构成了从 Prompt 到智能体,再到自进化 AI 的完整路径
最终,一个成熟的 AI 系统应该具备:
- 自动生成策略(APE)
- 高效利用数据(Active-Prompt)
- 可控输出(DSP)
- 工具调用能力(PAL)
- 行动能力(ReAct)
- 自我进化能力(Reflexion)
结语
Prompt Engineering 已经不再是“写提示词”的技巧,而是:
一种构建智能系统的方法论
未来的 AI 系统,将不只是回答问题,而是:
- 会思考
- 会行动
- 会反思
- 会进化
而 APE、Active-Prompt、DSP、PAL、ReAct、Reflexion,正是这一进化路径上的关键基石。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)