大模型时代的新职业:AI Agent Harness Engineering 训练师与提示词工程师的未来
大模型时代新职业爆发:AI Agent Harness Engineering训练师 vs 提示词工程师,谁才是未来5年的黄金赛道?
摘要/引言
你有没有刷到过这样的招聘JD?“提示词工程师,无编码要求,年薪30万起”、“AI Agent训练师,资深岗位年薪百万,不限行业背景”。据脉脉《2024大模型岗位薪资报告》显示,当前国内大模型应用层相关岗位的平均薪资比传统互联网岗位高出42%,其中提示词工程师平均起薪21K/月,AI Agent Harness Engineering(以下简称Agent束具工程师/Agent训练师)平均起薪32K/月,大厂资深岗位的年薪上限更是突破150万。
但很多人对这两个岗位的认知还停留在“写AI咒语”、“玩AutoGPT”的层面:到底什么是提示词工程师?什么是Agent训练师?两者有什么区别?入行门槛高不高?未来会不会被AI替代?
本文将从技术本质、技能要求、落地场景、发展趋势等多个维度,彻底拆解这两个大模型时代的黄金职业,你将收获:
- 两个职业的核心定义、能力模型、收入区间
- 两者的对比差异与职业发展路径
- 零基础入行的可落地学习路线
- 未来5年的行业发展趋势判断
本文适合所有想进入大模型行业的从业者、想转型的互联网人、以及想抓住时代红利的在校学生阅读,全文约11000字,建议收藏后慢慢看。
一、先搞懂背景:大模型应用的两次革命,催生两个新职业
在正式讲解两个职业之前,我们首先要搞懂它们诞生的底层逻辑:大模型的应用演化一共经历了两次核心革命,每一次革命都催生了对应的专属岗位。
1.1 第一次革命:从“不会用大模型”到“用好大模型”,催生提示词工程师
2022年底ChatGPT发布之后,所有人都发现了大模型的强大能力,但同样的问题,不同的人问出来得到的结果天差地别:有人问“写一篇文案”,得到的是流水账一样的内容;有人给了角色、场景、约束、示例,得到的是直接可以上线的高转化率文案。
这种“大模型输出质量高度依赖输入指令”的特性,直接催生了提示词工程师这个岗位:专门负责优化大模型的输入指令,让大模型的输出符合业务要求,准确率、匹配度达到可用水平。
1.2 第二次革命:从“单任务生成”到“复杂流程自动化”,催生Agent训练师
到了2023年下半年,越来越多的企业发现:单靠提示词根本搞不定复杂的业务场景。比如电商的智能售后客服,不仅要回答用户问题,还要自动查询订单系统、对接物流API、提交退款申请、遇到复杂问题还要转人工,整个流程涉及多步骤决策、工具调用、跨系统对接,还不能出错、不能泄露用户隐私、不能产生幻觉。
这种场景下,只优化提示词已经不够了,我们需要给大模型套上一层“管控束具(Harness)”:管它的工具调用权限、管它的记忆存储、管它的决策逻辑、管它的安全对齐、管它的错误回滚,这就是AI Agent Harness Engineering训练师的核心工作:搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程的自动化。
二、核心概念拆解:提示词工程师到底是做什么的?
2.1 问题背景与描述
大模型的本质是一个统计概率模型,它的输出完全由输入的上下文决定: p ( y ∣ x , D p ) = exp ( f ( x , D p , y ) ) ∑ y ′ ∈ Y exp ( f ( x , D p , y ′ ) ) p(y|x, \mathcal{D}_p) = \frac{\exp(f(x, \mathcal{D}_p, y))}{\sum_{y' \in \mathcal{Y}} \exp(f(x, \mathcal{D}_p, y'))} p(y∣x,Dp)=∑y′∈Yexp(f(x,Dp,y′))exp(f(x,Dp,y))
其中 x x x是用户查询, D p = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x k , y k ) } \mathcal{D}_p = \{(x_1,y_1), (x_2,y_2), ..., (x_k,y_k)\} Dp={(x1,y1),(x2,y2),...,(xk,yk)}是提示词中包含的少样本示例, f f f是大模型的打分函数, Y \mathcal{Y} Y是输出空间。
简单来说:你给的提示词越清晰、越具体、约束越明确,大模型的输出就越符合你的预期。但绝大多数业务人员不懂大模型的特性,写出来的提示词要么模糊、要么缺少约束、要么没有匹配大模型的“思维习惯”,导致大模型的输出根本没法用,这就是提示词工程师要解决的核心问题。
2.2 核心概念与要素组成
提示词工程师(Prompt Engineer)的核心目标是:通过优化输入指令,让大模型的输出准确率、匹配度、合规性达到业务可用标准,同时尽可能降低推理成本。
一个合格的提示词工程师需要掌握的核心要素包括:
(1)主流大模型特性
熟悉GPT、 Claude、文心一言、通义千问等主流大模型的差异:比如GPT-4o擅长逻辑推理,Claude 3 Opus擅长长文本处理,开源模型Llama 3适合私有化部署,不同模型的提示词优化逻辑完全不同。
(2)提示词设计框架
掌握主流的提示词设计框架,比如:
- CRISPE框架:角色(Role)、背景(Context)、指令(Instruction)、输入(Input)、输出格式(Output)
- CO-STAR框架:背景(Context)、目标(Objective)、场景(Scenario)、任务(Task)、行动(Action)、结果(Result)
- 思维链(CoT)提示:引导大模型一步步推理,适合解决数学题、逻辑题等复杂问题
(3)效果评估与迭代能力
能够设计量化的评估指标(比如准确率、转化率、 hallucination率),通过A/B测试持续优化提示词,而不是靠主观感觉判断效果好坏。
(4)基础行业知识
懂所在行业的业务规则、术语、合规要求:比如做医疗领域的提示词工程师要熟悉医疗文书规范,做金融领域的要熟悉监管要求,这比只会写通用提示词的竞争力高3倍以上。
2.3 提示词优化的标准流程
2.4 代码示例:结构化提示词开发
环境安装
pip install openai langchain python-dotenv
示例代码(电商商品文案生成提示词)
import os
from dotenv import load_dotenv
from langchain.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0.3, api_key=os.getenv("OPENAI_API_KEY"))
# 提示词工程师开发的电商商品文案生成提示词模板,遵循CRISPE框架
product_copy_prompt = PromptTemplate(
input_variables=["product_category", "product_features", "target_audience", "tone"],
template="""
# 角色:你是拥有10年经验的电商文案专家,擅长撰写转化率高的商品详情页文案。
# 背景:我们需要为{product_category}类的商品撰写详情页首屏文案,面向{target_audience}群体。
# 指令:请根据以下商品特征撰写文案,严格遵循要求:
1. 开头第一句必须直击目标用户的核心痛点
2. 分3个要点介绍商品核心优势,每个优势搭配1个场景化描述
3. 结尾加入明确的行动号召,引导用户点击下单
4. 整体语气{tone},避免生硬的技术术语,字数控制在300-500字
5. 禁止虚构商品没有的功能,禁止夸大宣传,符合广告法要求
# 商品特征:{product_features}
# 输出格式:直接输出文案,不要额外解释。
"""
)
# 组装提示词
prompt = product_copy_prompt.format(
product_category="无线蓝牙耳机",
product_features="续航48小时、主动降噪深度40dB、IPX7防水、单耳重量3.8g",
target_audience="20-30岁的通勤上班族、运动爱好者",
tone="轻松活泼有代入感"
)
# 调用大模型生成结果
response = llm.invoke(prompt)
print("生成的商品文案:")
print(response.content)
2.5 适用场景与边界
提示词工程师的适用场景主要包括:
- 内容生成类场景:文案、海报、短视频脚本、代码生成
- 简单问答类场景:客服知识库问答、FAQ自动回复
- 单任务处理类场景:简历筛选、文档摘要、数据标注
- 大模型行业适配:把通用大模型适配到特定行业的简单任务
提示词工程师的边界:不涉及大模型微调、不涉及工具开发、不涉及跨系统流程对接,只优化大模型的输入输出。
三、核心概念拆解:AI Agent Harness Engineering训练师到底是做什么的?
3.1 问题背景与描述
当我们需要大模型处理多步骤、跨系统、高合规的复杂任务时,单靠提示词会遇到大量瓶颈:
- 上下文长度有限:大模型的上下文窗口是有限的,没法记住所有的历史交互和业务数据
- 没法调用外部工具:大模型本身没有办法直接查询数据库、调用API、操作业务系统
- 没法处理复杂决策:多步骤的业务流程需要判断、分支、回滚,单靠提示词很容易出错
- 合规风险不可控:大模型可能会产生幻觉、泄露隐私、做出不符合业务规则的操作,没有管控的话会带来巨大的业务损失
这时候我们需要给大模型套上一层“束具(Harness)”,把大模型变成一个可管控、可观测、可迭代的智能体(Agent),这就是Agent训练师要解决的核心问题。
3.2 核心概念与要素组成
AI Agent Harness Engineering训练师的核心目标是:搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程的自动化,同时保障系统的安全性、稳定性、合规性。
Agent系统的核心数学模型是马尔可夫决策过程(MDP):
M = ( S , A , P , R , γ ) \mathcal{M} = (S, A, P, R, \gamma) M=(S,A,P,R,γ)
其中 S S S是Agent的状态空间(包括上下文记忆、工具返回结果、用户历史交互), A A A是行动空间(包括生成文本、调用工具、移交其他Agent), P P P是状态转移概率, R R R是奖励函数(比如输出符合要求得正奖励,幻觉、违规得负奖励), γ \gamma γ是折扣因子。
一个合格的Agent训练师需要掌握的核心要素包括:
(1)提示词优化能力
这是基础,所有Agent的核心逻辑都需要提示词来定义,Agent训练师首先要是一个优秀的提示词工程师。
(2)Agent核心组件设计能力
掌握Agent四大核心组件的设计:
- 规划模块:让Agent能把复杂任务拆分成多个子步骤,一步步完成
- 记忆模块:分为短期记忆(上下文窗口)和长期记忆(向量数据库、业务数据库),让Agent能记住历史交互和业务数据
- 工具模块:让Agent能调用外部工具(API、数据库、RAG系统、其他Agent)
- 对齐模块:让Agent的所有操作都符合业务规则、合规要求、安全约束
(3)多Agent协作设计能力
复杂场景往往需要多个Agent协作完成,比如一个智能客服系统需要有咨询Agent、订单查询Agent、退款处理Agent、人工转接Agent,Agent训练师需要设计多个Agent的分工、交互规则、异常处理逻辑。
(4)可观测与迭代能力
Agent上线后需要有全链路的监控:能追踪每一步的状态、工具调用结果、输出内容,能快速定位问题,通过奖励函数、规则优化持续迭代Agent的效果。
3.3 Agent系统开发的标准流程
3.4 代码示例:简单售后客服Agent开发
环境安装
pip install langgraph openai python-dotenv
示例代码
import os
from dotenv import load_dotenv
from typing import Annotated, TypedDict
from langchain_openai import ChatOpenAI
from langgraph.graph import StateGraph, END
from langgraph.graph.message import add_messages
# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0, api_key=os.getenv("OPENAI_API_KEY"))
# 定义Agent状态
class AgentState(TypedDict):
messages: Annotated[list, add_messages]
user_id: str
order_id: str = None
need_refund: bool = False
# 模拟工具:查询订单信息(实际场景对接订单数据库)
def query_order(state: AgentState):
"""查询用户订单信息的工具"""
order_id = state["order_id"]
return {"messages": [{"role": "system", "content": f"订单{order_id}的状态:已发货,预计2天后到达,商品金额299元,支持7天无理由退款"}]}
# 模拟工具:处理退款申请(实际场景对接退款系统)
def process_refund(state: AgentState):
"""处理用户退款申请的工具"""
order_id = state["order_id"]
user_id = state["user_id"]
return {"messages": [{"role": "system", "content": f"用户{user_id}的订单{order_id}退款申请已提交,审核通过后预计1-3个工作日到账,退款单号:TK{order_id}"}]}
# 路由节点:判断下一步行动
def router(state: AgentState):
"""根据用户查询判断需要调用的工具或者直接回答"""
last_message = state["messages"][-1].content
if "订单" in last_message and state["order_id"]:
return "query_order"
elif "退款" in last_message and state["order_id"]:
return "process_refund"
else:
if not state["order_id"]:
return {"messages": [{"role": "assistant", "content": "请您提供一下订单号,我才能为您查询相关信息哦~"}]}
return END
# 搭建Agent管控流图
workflow = StateGraph(AgentState)
workflow.add_node("router", router)
workflow.add_node("query_order", query_order)
workflow.add_node("process_refund", process_refund)
workflow.set_entry_point("router")
workflow.add_edge("query_order", END)
workflow.add_edge("process_refund", END)
# 编译Agent
app = workflow.compile()
# 测试Agent
initial_state = {
"messages": [{"role": "user", "content": "我要退款,我的订单号是123456"}],
"user_id": "u_10086",
"order_id": "123456"
}
for output in app.stream(initial_state):
for key, value in output.items():
print(f"节点 {key} 输出:")
print(value["messages"][-1]["content"])
3.5 适用场景与边界
Agent训练师的适用场景主要包括:
- 企业级工作流自动化:智能客服、智能审批、供应链自动调度
- 复杂任务处理:代码生成Agent、智能投顾、故障排查Agent
- 多角色协作场景:游戏NPC、AI团队协作系统、虚拟员工
- 高合规要求场景:金融合规审核、医疗辅助诊断、政务服务Agent
Agent训练师的边界:不涉及大模型的预训练,只做大模型之上的Agent系统搭建、管控与迭代。
四、两个职业的核心对比与关系
4.1 核心属性维度对比
| 对比维度 | 提示词工程师(Prompt Engineer) | AI Agent Harness Engineering训练师 |
|---|---|---|
| 核心目标 | 优化单轮/多轮大模型输入,提升输出准确率与匹配度 | 搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程自动化 |
| 工作对象 | 大模型的输入文本(提示词)、少样本示例 | Agent的全套组件:提示词、工具集、记忆系统、协作规则、安全对齐策略、可观测体系 |
| 核心技能栈 | 大模型特性熟悉、提示词框架、A/B测试、基础行业知识 | 提示词优化、Agent框架(LangGraph/MetaGPT)、工具编排、RAG、可观测性、安全对齐、业务流程建模 |
| 输出物 | 提示词模板、少样本库、提示词优化规则 | Agent管控系统、多Agent协作规则、工具调用配置、错误处理机制、效果监控看板 |
| 适用场景 | 内容生成、单任务大模型适配、简单问答系统 | 企业级工作流自动化、多步骤复杂任务处理、多角色协作场景、高合规要求场景 |
| 平均起薪(2024年国内) | 18-25K/月 | 25-35K/月 |
| 资深岗位年薪 | 30-80万 | 50-150万 |
| 入行门槛 | 大专及以上,无需深厚编程基础 | 本科及以上,需掌握Python基础、常用开发框架,有业务建模能力优先 |
| 职业生命周期 | 2022-2027年(逐渐下沉为通用技能) | 2024-2035+(长期存在,随通用Agent发展持续升级) |
| 被AI替代风险 | 中(大量通用提示词工作会被AI工具替代) | 低(涉及业务理解、系统设计、安全管控,短期很难被AI替代) |
4.2 实体关系ER图
4.3 工作流交互关系
可以看到:两个职业不是替代关系,而是递进关系,提示词工程师是Agent训练师的基础,Agent训练师是提示词工程师的高阶发展方向。小公司、简单场景可能只需要提示词工程师就能搞定需求,中大型公司、复杂场景则需要Agent训练师来搭建完整的系统。
五、入行路径与最佳实践
5.1 提示词工程师入行路线(3个月可入门)
- 基础学习(1个月):
- 熟悉主流大模型的特性:GPT-4o、Claude 3、文心一言、通义千问,每个模型都用至少100次,感受它们的差异
- 学习主流提示词框架:CRISPE、CO-STAR、思维链、思维树,每个框架至少练习20个案例
- 学习A/B测试的基本方法,掌握量化评估指标的设计
- 行业绑定(1个月):
- 选择一个你熟悉的行业:电商、教育、金融、医疗、互联网都可以
- 梳理这个行业的核心需求、术语、合规要求,比如电商的商品文案、客服回复、短视频脚本
- 针对这个行业的10个核心场景,开发对应的提示词模板,测试效果
- 项目实战(1个月):
- 接一些外包项目:比如帮商家写文案提示词、帮企业做客服提示词优化
- 整理自己的作品集:把你做的提示词模板、效果对比数据整理成简历
- 投递岗位:优先投递中小公司、业务部门的提示词工程师岗位,门槛更低
5.2 Agent训练师入行路线(6个月可入门)
- 基础阶段(2个月):
- 先搞定提示词工程师的全部技能,这是基础
- 学习Python基础,掌握基本的语法、API调用、数据库操作
- 学习LangChain、LangGraph、MetaGPT等主流Agent框架的基本使用
- 核心技能学习(2个月):
- 学习Agent四大核心组件的设计:规划、记忆、工具、对齐
- 学习RAG、Function Call、向量数据库的基本使用
- 学习可观测性、安全对齐的基本方法
- 项目实战(2个月):
- 自己动手做3个以上的Agent项目:比如智能客服Agent、个人助理Agent、代码生成Agent
- 学习多Agent协作的设计方法,做一个多Agent协作的项目比如AI写作团队
- 整理作品集,投递中大型公司的Agent相关岗位
5.3 最佳实践Tips
提示词工程师避坑:
- 不要迷信“万能咒语”:不同大模型的特性不同,同一提示词在不同模型上的效果可能天差地别,一定要针对具体模型做适配
- 不要只懂通用提示词:绑定行业知识的提示词工程师竞争力是通用提示词工程师的3倍以上,比如医疗领域的提示词工程师缺口非常大,薪资也更高
- 不要靠主观判断效果:一定要用量化指标做A/B测试,比如文案的转化率、问答的准确率,数据才是硬道理
Agent训练师避坑:
- 不要过度追求技术酷炫:优先考虑业务落地,很多场景用简单的规则引擎就能搞定的,就不要硬上多Agent协作,反而增加复杂度和维护成本
- 一定要设计边界和熔断机制:Agent的工具调用权限要做最小集,避免出现Agent调用错误工具导致业务损失的情况,比如客服Agent不能直接给用户打款,最多只能提交退款申请
- 可观测性优先:Agent上线后一定要有全链路日志,能追踪每一步的状态、工具调用结果、输出内容,不然出了问题根本没法排查
六、行业发展趋势与未来展望
6.1 职业发展历史与未来预测
| 时间阶段 | 大模型技术发展节点 | 相关职业发展状态 | 市场缺口 |
|---|---|---|---|
| 2022年以前 | 预训练大模型萌芽,GPT-3、悟道2.0发布 | 无专门岗位,提示词能力属于AI算法工程师的附加技能 | <1万 |
| 2022-2023年 | ChatGPT发布,GPT-4上线,生成式AI爆发 | 提示词工程师岗位爆发,各大厂、中小公司纷纷招聘,相关培训课程层出不穷 | 10-15万 |
| 2024-2026年 | 多模态大模型普及,Agent框架成熟,企业级Agent应用落地加速 | AI Agent Harness训练师岗位快速增长,逐步成为大模型应用团队的标配 | 30-50万 |
| 2027-2030年 | 通用人工智能(AGI)雏形出现,多Agent协作成为企业数字化的核心基础设施 | Agent训练师细分领域出现,比如行业Agent专家、多Agent协作架构师、Agent安全专家 | 100-150万 |
| 2030年以后 | AGI普及,Agent成为数字世界的核心交互主体 | 相关职业升级为AGI系统管控师,负责整个人机交互系统的设计与优化 | 200万+ |
6.2 未来3年的核心趋势判断
- 提示词工程师会逐渐下沉为通用技能:未来3年,提示词能力会像现在的Office能力一样,成为每个职场人的必备技能,大量通用的提示词工作会被AI工具替代,只有绑定行业核心知识的资深提示词工程师会继续存在
- Agent训练师会成为大模型应用层的核心岗位:未来所有的软件都会Agent化,每个公司都会有自己的Agent系统,Agent训练师的缺口会持续扩大,薪资也会持续走高
- 行业细分会越来越明显:未来不会有通用的Agent训练师,只会有电商Agent训练师、金融Agent训练师、医疗Agent训练师,懂行业+懂技术的复合型人才会最受欢迎
七、结论
大模型时代的职业发展不是非此即彼,如果你是零基础、没有编程基础,可以先从提示词工程师入手,快速进入大模型行业,积累经验后再往Agent训练师方向发展;如果你有编程基础、懂业务流程,可以直接学习Agent相关技术,抢占未来的黄金赛道。
不管选择哪个方向,核心都是要绑定行业知识,只懂技术不懂业务的人很快会被AI替代,懂技术又懂业务的复合型人才才是未来的稀缺资源。
行动号召
你对这两个职业有什么看法?你现在在学习提示词还是Agent技术?欢迎在评论区分享你的经历或者疑问,我会一一回复。如果你觉得本文对你有帮助,欢迎点赞、收藏、转发给更多有需要的朋友。
附加部分
参考文献/延伸阅读
- OpenAI官方提示词指南
- LangGraph官方文档
- 脉脉《2024年大模型相关岗位薪资报告》
- 斯坦福大学《2024年AI指数报告》
- 《Agent Design Patterns: Elements of Effective Agent Architecture》
作者简介
我是老K,10年经验的软件工程师,前大厂AI架构师,现在专注于大模型应用与Agent架构研究,每周分享一篇可落地的大模型技术干货,欢迎关注我的账号获取更多内容。
(全文完,共计11237字)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)