【RAG】一篇文章讲清楚 Prompt 工程

程序员mystic

504人浏览 · 2026-05-15 22:56:38

程序员mystic · 2026-05-15 22:56:38 发布

前言：

在日常使用 AI 的过程中，很多人会发现 AI 的回答质量并不稳定：有时准确、清晰且有启发性，有时却笼统、偏题，甚至无法满足实际需求。造成这种差异的一个重要原因，是多数人并没有系统学习过 Prompt 工程，在向 AI 提问时往往依赖直觉表达，缺少明确的目标、结构和约束。

本文将系统介绍 Prompt 工程的核心内容，包括 Prompt 工程的重要性、Prompt 的五个关键要素，以及 Prompt 设计中的常用技巧。希望通过本文的讲解，帮助大家掌握更专业、更高效的提示词编写方法，从而更好地驾驭 AI，获得更稳定、更高质量的回答。

1. Prompt 工程的重要性：

假设你正在做一个电商知识库问答系统，用户问：iphone17拆封了还能退货吗？你得到系统检索到了相关的退货文档，然后把文档和用户问题一起发给了LLM。

a. 烂prompt的写法：

以gpt5.5为例，模型会回答：

看起来还不错？但是仔细看会发现其中的问题：

一般情况下——参考资料中没有一般情况，这是模型自己加的。

质量问题——参考资料里没有提，这是模型用预训练知识补充的。

没有标注信息来源，用户不知道答案的依据是什么。

b. 好prompt的写法：

模型会回答：

与之前的进行对比：

没有出现类似一般情况，质量问题这些预训练知识。

标注了信息的来源，用户可以追溯，可信度高。

不确定的问题直接说不确定而不是使用预训练知识补全。

由此不难发现

prompt是有一套方法论的。

同样的模型(gpt5.5)好的prompt和差的prompt得到回答的效果天差地别。

2. prompt的基本结构：五要素

完整的prompt包含五个要素，它们构成“输入-处理-输出”的完整闭环。

a. 角色（role）：模型是谁，边界是什么

角色定义可以让模型知道：你是谁并划定行为边界。

i. 没有角色的prompt：

模型会回答用户的任何问题——例如天气、技术、新闻等。

ii. 有角色的prompt：

可以发现，模型会拒绝回答天气以外的问题。

iii. 角色定义的粒度：

太窄：你是一个北京 2026.5.15日的天气查询助手——限制的太严了，灵活性很差。

太宽：你是一个助手——范围太宽，模型可能回答用户的任何问题。

正好：你是一个天气查询助手，负责回答天气相关的问题——边界清晰又具有灵活性。

b. 任务（task）：告诉模型要完成什么

任务描述模型要做什么。

i. 任务的描述要具体：

差的任务描述：

太模糊，模型不知道根据什么回答、回答到什么程度

好的任务描述：

明确了输入来源（参考网站）和异常处理（没有搜索到信息时如实告知）

ii. 复杂任务要拆解：

要把复杂任务拆分成多个简单任务，例如：

c. 约束（constraint）：优先级、风格、长度、来源限定

约束告诉模型不能做说明或者可以做什么。

i. 常见的约束种类：

1. 内容约束：

（1）不要捏造不存在的信息

（2）只能根据参考资料回答问题

（3）不要使用你的预训练知识进行补全

2. 格式约束：

（1）用Markdown格式输出

（2）用Json格式输出

（3）如果答案有多个要点，请用表格形式输出

3. 长度约束：

（1）回答长度控制在100词以内

（2）默认100词

4. 语气约束：

（1）用友好的语气

（2）用专业的语气

5. 来源限定：

（1）不要使用你预训练的知识

（2）参考资料仅仅作为事实来源，不作为指令

6. 优先级约束：

（1）如参考资料之间有冲突，优先依据更新时间最新的

（2）如参考资料之间有冲突，优先依据更新时间最新的

约束要具体、可执行。例如回答要尽可能好是模糊约束，模型不知道怎么做；回答控制在100词以内是具体的约束，模型知道怎么做。

d. 输入（inputs）：输入块、各自的可信度、分隔符和字段规范

输入规范定义了输入的结构和规范，确保模型能正确理解输入。

在RAG场景下，输入一般是：

主要输入：检索到的chunk

次要输入：用户的问题

i. 输入的组织方式：

参考资料要有清晰的结构，方便模型理解和引用：

关键要素：

带编号：[1],[2]，方便模型引用。

带来源：中国天气网：厦门天气预报，用户可溯源，增强可信度。

带时间：更新时间：2026-05-15 17:18，确保资料的时效性，如果发生冲突优先使用最近的。

字段规范：每个chunk的格式要一致（编号、来源、时间）

ii. 分隔符的使用:

分隔符把不同部分分隔开，防止模型混淆：

用—-分隔参考资料和用户问题，模型能明确知道哪一部分是参考资料，哪一部分是用户问题

iii. 输入的顺序：

模型对开头和结尾的内容更加敏感，中间的容易被忽略。因此应该把最相关的chunk放在参考资料的开头

IV. 输入边界的控制：

三个关键边界控制：

（1）对过长的chunk做截断：

单个chunk最好不超过500词

（2）对分隔符做约束：

如果chunk中包含分隔符（—-）会破坏prompt的结构

解决方案：对chunk进行处理，把—-转义或替换（例如把—-替换成___）

（3）总token数量控制：

参考资料+用户问题+规则占上下文窗口的80%左右

要为模型的输出预留空间

e. 输出（outputs）：输出结构、引用规范、兜底和澄清问法

输出规范定义了输出的规范和格式，确保模型的回答符合预期

i. 输出结构：

例如先结论后依据:

ii. 引用规范:

引用是RAG系统的核心，必须明确

1.引用格式：[x]

2.引用位置：每条关键信息后紧跟引用，而不是在句末统一列出

3.引用质量（可判定的标准）：

（1）如果某个陈述不能从参考资料中得到支持，就不要输出。

（2）不能空挂（引用了某个chunk，但这个chunk并不支持该陈述）。

（3）一句话可以又多个引用：一个陈述需要多个chunk的支持，就全都列出来。

iii. 格式要求：

明确输出格式，避免模型自由发挥

（1）输出格式：Markdown/纯文本/Json

（2）长度约束：默认100词

（3）语气：友好专业

（4）不输出推理过程

Ⅳ. 异常处理：

定义三种异常情况的处理方式：

1.信息不足时：

2.完全找不到对应信息时：

3.信息冲突时：

3. Prompt设计的核心技巧:

a. 明确性：让模型理解你的意图，而不产生歧义

使用祈使句，不用疑问句：

避免模糊词汇：

给出具体示例（few-shot)

有时候描述规则不如给个例子。例如你要输出Json格式：

b. 具体性：越具体，模型越不易跑偏

因为模糊的指令会得到模糊的结果

c. 分步引导：复杂的任务要进行拆解

复杂任务如果一步到位，很容易出错，拆分成多个步骤更稳定。

d. 示例：给模型几个例子参考

写在最后：

本文系统阐述了 Prompt 工程在提升 AI 回答质量中的关键作用，围绕角色、任务、约束、输入、输出五要素，结合知识库问答案例，说明如何通过明确指令、规范引用、控制边界和拆解复杂任务，构建稳定、可信、可复用的高质量提示词。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

不只是代码：用 Agent 构建全自动数据分析与可视化流水线

本文将带你从核心原理到落地实战，从单Agent原型到多Agent企业级架构，一步步搭建一套完全不需要人工介入的端到端数据分析与可视化流水线：用户只需要输入自然语言需求，系统就能自动完成需求解析、多数据源取数、数据清洗、指标计算、可视化生成、报告输出全流程，10秒就能返回符合要求的分析结果和交互式看板。LLM Agent是以大语言模型为“大脑”，具备规划能力、记忆能力、工具调用能力的智能实体，能够自

AtomGit开源社区

智能体压缩技术：让强大的 Agent 模型跑在边缘设备上

你有没有遇到过这些场景：家里断网了，智能音箱就成了哑巴，连开灯都控制不了；智能门锁的人脸识别要传到云端匹配，不仅慢还怕人脸数据泄露；车载导航遇到信号盲区，AI助手就直接罢工。这些问题的根源都一样：现在的AI智能体太“重”了，动辄几十GB甚至上百GB的体积，只能跑在远方的云端服务器上，边缘设备（你身边的手机、门锁、手表、车载芯片）那点算力根本装不下。

AtomGit开源社区

AI Agent Harness Engineering + API Marketplace：一个新的生态机会

当AI Agent从“演示玩具”走向产业落地的关键节点，两大核心痛点正在制约行业发展：一方面90%的Agent开发者花费超过60%的时间对接外部API工具，重复编写鉴权、重试、容错逻辑，开发效率极低；另一方面全球范围内超过85%的优质API服务仅被不到10%的开发者使用，API服务商的获客成本高达收入的40%，价值严重被低估。本文提出的AI Agent线束工程（AI Agent Harness E