大模型时代新职业爆发:AI Agent Harness Engineering训练师 vs 提示词工程师,谁才是未来5年的黄金赛道?


摘要/引言

你有没有刷到过这样的招聘JD?“提示词工程师,无编码要求,年薪30万起”、“AI Agent训练师,资深岗位年薪百万,不限行业背景”。据脉脉《2024大模型岗位薪资报告》显示,当前国内大模型应用层相关岗位的平均薪资比传统互联网岗位高出42%,其中提示词工程师平均起薪21K/月,AI Agent Harness Engineering(以下简称Agent束具工程师/Agent训练师)平均起薪32K/月,大厂资深岗位的年薪上限更是突破150万。
但很多人对这两个岗位的认知还停留在“写AI咒语”、“玩AutoGPT”的层面:到底什么是提示词工程师?什么是Agent训练师?两者有什么区别?入行门槛高不高?未来会不会被AI替代?
本文将从技术本质、技能要求、落地场景、发展趋势等多个维度,彻底拆解这两个大模型时代的黄金职业,你将收获:

  1. 两个职业的核心定义、能力模型、收入区间
  2. 两者的对比差异与职业发展路径
  3. 零基础入行的可落地学习路线
  4. 未来5年的行业发展趋势判断
    本文适合所有想进入大模型行业的从业者、想转型的互联网人、以及想抓住时代红利的在校学生阅读,全文约11000字,建议收藏后慢慢看。

一、先搞懂背景:大模型应用的两次革命,催生两个新职业

在正式讲解两个职业之前,我们首先要搞懂它们诞生的底层逻辑:大模型的应用演化一共经历了两次核心革命,每一次革命都催生了对应的专属岗位。

1.1 第一次革命:从“不会用大模型”到“用好大模型”,催生提示词工程师

2022年底ChatGPT发布之后,所有人都发现了大模型的强大能力,但同样的问题,不同的人问出来得到的结果天差地别:有人问“写一篇文案”,得到的是流水账一样的内容;有人给了角色、场景、约束、示例,得到的是直接可以上线的高转化率文案。
这种“大模型输出质量高度依赖输入指令”的特性,直接催生了提示词工程师这个岗位:专门负责优化大模型的输入指令,让大模型的输出符合业务要求,准确率、匹配度达到可用水平。

1.2 第二次革命:从“单任务生成”到“复杂流程自动化”,催生Agent训练师

到了2023年下半年,越来越多的企业发现:单靠提示词根本搞不定复杂的业务场景。比如电商的智能售后客服,不仅要回答用户问题,还要自动查询订单系统、对接物流API、提交退款申请、遇到复杂问题还要转人工,整个流程涉及多步骤决策、工具调用、跨系统对接,还不能出错、不能泄露用户隐私、不能产生幻觉。
这种场景下,只优化提示词已经不够了,我们需要给大模型套上一层“管控束具(Harness)”:管它的工具调用权限、管它的记忆存储、管它的决策逻辑、管它的安全对齐、管它的错误回滚,这就是AI Agent Harness Engineering训练师的核心工作:搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程的自动化。

二、核心概念拆解:提示词工程师到底是做什么的?

2.1 问题背景与描述

大模型的本质是一个统计概率模型,它的输出完全由输入的上下文决定: p ( y ∣ x , D p ) = exp ⁡ ( f ( x , D p , y ) ) ∑ y ′ ∈ Y exp ⁡ ( f ( x , D p , y ′ ) ) p(y|x, \mathcal{D}_p) = \frac{\exp(f(x, \mathcal{D}_p, y))}{\sum_{y' \in \mathcal{Y}} \exp(f(x, \mathcal{D}_p, y'))} p(yx,Dp)=yYexp(f(x,Dp,y))exp(f(x,Dp,y))
其中 x x x是用户查询, D p = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x k , y k ) } \mathcal{D}_p = \{(x_1,y_1), (x_2,y_2), ..., (x_k,y_k)\} Dp={(x1,y1),(x2,y2),...,(xk,yk)}是提示词中包含的少样本示例, f f f是大模型的打分函数, Y \mathcal{Y} Y是输出空间。
简单来说:你给的提示词越清晰、越具体、约束越明确,大模型的输出就越符合你的预期。但绝大多数业务人员不懂大模型的特性,写出来的提示词要么模糊、要么缺少约束、要么没有匹配大模型的“思维习惯”,导致大模型的输出根本没法用,这就是提示词工程师要解决的核心问题。

2.2 核心概念与要素组成

提示词工程师(Prompt Engineer)的核心目标是:通过优化输入指令,让大模型的输出准确率、匹配度、合规性达到业务可用标准,同时尽可能降低推理成本。
一个合格的提示词工程师需要掌握的核心要素包括:

(1)主流大模型特性

熟悉GPT、 Claude、文心一言、通义千问等主流大模型的差异:比如GPT-4o擅长逻辑推理,Claude 3 Opus擅长长文本处理,开源模型Llama 3适合私有化部署,不同模型的提示词优化逻辑完全不同。

(2)提示词设计框架

掌握主流的提示词设计框架,比如:

  • CRISPE框架:角色(Role)、背景(Context)、指令(Instruction)、输入(Input)、输出格式(Output)
  • CO-STAR框架:背景(Context)、目标(Objective)、场景(Scenario)、任务(Task)、行动(Action)、结果(Result)
  • 思维链(CoT)提示:引导大模型一步步推理,适合解决数学题、逻辑题等复杂问题
(3)效果评估与迭代能力

能够设计量化的评估指标(比如准确率、转化率、 hallucination率),通过A/B测试持续优化提示词,而不是靠主观感觉判断效果好坏。

(4)基础行业知识

懂所在行业的业务规则、术语、合规要求:比如做医疗领域的提示词工程师要熟悉医疗文书规范,做金融领域的要熟悉监管要求,这比只会写通用提示词的竞争力高3倍以上。

2.3 提示词优化的标准流程

接收业务需求

拆解需求核心要素:目标、约束、合规要求

编写初始提示词:含角色、背景、指令、输出格式、少样本示例

测试用例验证:覆盖边界场景、异常场景

输出是否符合要求?

A/B测试收集效果数据

定位问题:模糊/缺失约束/示例不足/不符合模型特性

效果达标?

上线并持续监控输出质量

2.4 代码示例:结构化提示词开发

环境安装
pip install openai langchain python-dotenv
示例代码(电商商品文案生成提示词)
import os
from dotenv import load_dotenv
from langchain.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0.3, api_key=os.getenv("OPENAI_API_KEY"))

# 提示词工程师开发的电商商品文案生成提示词模板,遵循CRISPE框架
product_copy_prompt = PromptTemplate(
    input_variables=["product_category", "product_features", "target_audience", "tone"],
    template="""
    # 角色:你是拥有10年经验的电商文案专家,擅长撰写转化率高的商品详情页文案。
    # 背景:我们需要为{product_category}类的商品撰写详情页首屏文案,面向{target_audience}群体。
    # 指令:请根据以下商品特征撰写文案,严格遵循要求:
    1. 开头第一句必须直击目标用户的核心痛点
    2. 分3个要点介绍商品核心优势,每个优势搭配1个场景化描述
    3. 结尾加入明确的行动号召,引导用户点击下单
    4. 整体语气{tone},避免生硬的技术术语,字数控制在300-500字
    5. 禁止虚构商品没有的功能,禁止夸大宣传,符合广告法要求
    # 商品特征:{product_features}
    # 输出格式:直接输出文案,不要额外解释。
    """
)

# 组装提示词
prompt = product_copy_prompt.format(
    product_category="无线蓝牙耳机",
    product_features="续航48小时、主动降噪深度40dB、IPX7防水、单耳重量3.8g",
    target_audience="20-30岁的通勤上班族、运动爱好者",
    tone="轻松活泼有代入感"
)

# 调用大模型生成结果
response = llm.invoke(prompt)
print("生成的商品文案:")
print(response.content)

2.5 适用场景与边界

提示词工程师的适用场景主要包括:

  • 内容生成类场景:文案、海报、短视频脚本、代码生成
  • 简单问答类场景:客服知识库问答、FAQ自动回复
  • 单任务处理类场景:简历筛选、文档摘要、数据标注
  • 大模型行业适配:把通用大模型适配到特定行业的简单任务
    提示词工程师的边界:不涉及大模型微调、不涉及工具开发、不涉及跨系统流程对接,只优化大模型的输入输出。

三、核心概念拆解:AI Agent Harness Engineering训练师到底是做什么的?

3.1 问题背景与描述

当我们需要大模型处理多步骤、跨系统、高合规的复杂任务时,单靠提示词会遇到大量瓶颈:

  1. 上下文长度有限:大模型的上下文窗口是有限的,没法记住所有的历史交互和业务数据
  2. 没法调用外部工具:大模型本身没有办法直接查询数据库、调用API、操作业务系统
  3. 没法处理复杂决策:多步骤的业务流程需要判断、分支、回滚,单靠提示词很容易出错
  4. 合规风险不可控:大模型可能会产生幻觉、泄露隐私、做出不符合业务规则的操作,没有管控的话会带来巨大的业务损失
    这时候我们需要给大模型套上一层“束具(Harness)”,把大模型变成一个可管控、可观测、可迭代的智能体(Agent),这就是Agent训练师要解决的核心问题。

3.2 核心概念与要素组成

AI Agent Harness Engineering训练师的核心目标是:搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程的自动化,同时保障系统的安全性、稳定性、合规性。
Agent系统的核心数学模型是马尔可夫决策过程(MDP):
M = ( S , A , P , R , γ ) \mathcal{M} = (S, A, P, R, \gamma) M=(S,A,P,R,γ)
其中 S S S是Agent的状态空间(包括上下文记忆、工具返回结果、用户历史交互), A A A是行动空间(包括生成文本、调用工具、移交其他Agent), P P P是状态转移概率, R R R是奖励函数(比如输出符合要求得正奖励,幻觉、违规得负奖励), γ \gamma γ是折扣因子。
一个合格的Agent训练师需要掌握的核心要素包括:

(1)提示词优化能力

这是基础,所有Agent的核心逻辑都需要提示词来定义,Agent训练师首先要是一个优秀的提示词工程师。

(2)Agent核心组件设计能力

掌握Agent四大核心组件的设计:

  • 规划模块:让Agent能把复杂任务拆分成多个子步骤,一步步完成
  • 记忆模块:分为短期记忆(上下文窗口)和长期记忆(向量数据库、业务数据库),让Agent能记住历史交互和业务数据
  • 工具模块:让Agent能调用外部工具(API、数据库、RAG系统、其他Agent)
  • 对齐模块:让Agent的所有操作都符合业务规则、合规要求、安全约束
(3)多Agent协作设计能力

复杂场景往往需要多个Agent协作完成,比如一个智能客服系统需要有咨询Agent、订单查询Agent、退款处理Agent、人工转接Agent,Agent训练师需要设计多个Agent的分工、交互规则、异常处理逻辑。

(4)可观测与迭代能力

Agent上线后需要有全链路的监控:能追踪每一步的状态、工具调用结果、输出内容,能快速定位问题,通过奖励函数、规则优化持续迭代Agent的效果。

3.3 Agent系统开发的标准流程

业务流程梳理:输出完整的业务流程图、边界规则、异常场景

Agent角色与分工设计:定义每个Agent的职责、权限、交互规则

工具集与权限边界定义:梳理需要调用的工具、每个Agent的工具调用权限

记忆系统与状态管理设计:定义短期/长期记忆的存储、读取、清理规则

协作逻辑与错误回滚规则编写:定义流程分支、异常处理、回滚机制

单元测试:单Agent功能验证、边界场景测试

集成测试:多Agent全流程验证、压力测试

通过率/准确率/合规性达标?

上线 + 可观测性部署

定位问题:角色冲突/工具调用错误/记忆溢出/规则漏洞

持续迭代奖励函数与对齐规则

3.4 代码示例:简单售后客服Agent开发

环境安装
pip install langgraph openai python-dotenv
示例代码
import os
from dotenv import load_dotenv
from typing import Annotated, TypedDict
from langchain_openai import ChatOpenAI
from langgraph.graph import StateGraph, END
from langgraph.graph.message import add_messages

# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0, api_key=os.getenv("OPENAI_API_KEY"))

# 定义Agent状态
class AgentState(TypedDict):
    messages: Annotated[list, add_messages]
    user_id: str
    order_id: str = None
    need_refund: bool = False

# 模拟工具:查询订单信息(实际场景对接订单数据库)
def query_order(state: AgentState):
    """查询用户订单信息的工具"""
    order_id = state["order_id"]
    return {"messages": [{"role": "system", "content": f"订单{order_id}的状态:已发货,预计2天后到达,商品金额299元,支持7天无理由退款"}]}

# 模拟工具:处理退款申请(实际场景对接退款系统)
def process_refund(state: AgentState):
    """处理用户退款申请的工具"""
    order_id = state["order_id"]
    user_id = state["user_id"]
    return {"messages": [{"role": "system", "content": f"用户{user_id}的订单{order_id}退款申请已提交,审核通过后预计1-3个工作日到账,退款单号:TK{order_id}"}]}

# 路由节点:判断下一步行动
def router(state: AgentState):
    """根据用户查询判断需要调用的工具或者直接回答"""
    last_message = state["messages"][-1].content
    if "订单" in last_message and state["order_id"]:
        return "query_order"
    elif "退款" in last_message and state["order_id"]:
        return "process_refund"
    else:
        if not state["order_id"]:
            return {"messages": [{"role": "assistant", "content": "请您提供一下订单号,我才能为您查询相关信息哦~"}]}
        return END

# 搭建Agent管控流图
workflow = StateGraph(AgentState)
workflow.add_node("router", router)
workflow.add_node("query_order", query_order)
workflow.add_node("process_refund", process_refund)

workflow.set_entry_point("router")
workflow.add_edge("query_order", END)
workflow.add_edge("process_refund", END)

# 编译Agent
app = workflow.compile()

# 测试Agent
initial_state = {
    "messages": [{"role": "user", "content": "我要退款,我的订单号是123456"}],
    "user_id": "u_10086",
    "order_id": "123456"
}

for output in app.stream(initial_state):
    for key, value in output.items():
        print(f"节点 {key} 输出:")
        print(value["messages"][-1]["content"])

3.5 适用场景与边界

Agent训练师的适用场景主要包括:

  • 企业级工作流自动化:智能客服、智能审批、供应链自动调度
  • 复杂任务处理:代码生成Agent、智能投顾、故障排查Agent
  • 多角色协作场景:游戏NPC、AI团队协作系统、虚拟员工
  • 高合规要求场景:金融合规审核、医疗辅助诊断、政务服务Agent
    Agent训练师的边界:不涉及大模型的预训练,只做大模型之上的Agent系统搭建、管控与迭代。

四、两个职业的核心对比与关系

4.1 核心属性维度对比

对比维度 提示词工程师(Prompt Engineer) AI Agent Harness Engineering训练师
核心目标 优化单轮/多轮大模型输入,提升输出准确率与匹配度 搭建、管控、迭代全生命周期的Agent系统,实现复杂业务流程自动化
工作对象 大模型的输入文本(提示词)、少样本示例 Agent的全套组件:提示词、工具集、记忆系统、协作规则、安全对齐策略、可观测体系
核心技能栈 大模型特性熟悉、提示词框架、A/B测试、基础行业知识 提示词优化、Agent框架(LangGraph/MetaGPT)、工具编排、RAG、可观测性、安全对齐、业务流程建模
输出物 提示词模板、少样本库、提示词优化规则 Agent管控系统、多Agent协作规则、工具调用配置、错误处理机制、效果监控看板
适用场景 内容生成、单任务大模型适配、简单问答系统 企业级工作流自动化、多步骤复杂任务处理、多角色协作场景、高合规要求场景
平均起薪(2024年国内) 18-25K/月 25-35K/月
资深岗位年薪 30-80万 50-150万
入行门槛 大专及以上,无需深厚编程基础 本科及以上,需掌握Python基础、常用开发框架,有业务建模能力优先
职业生命周期 2022-2027年(逐渐下沉为通用技能) 2024-2035+(长期存在,随通用Agent发展持续升级)
被AI替代风险 中(大量通用提示词工作会被AI工具替代) 低(涉及业务理解、系统设计、安全管控,短期很难被AI替代)

4.2 实体关系ER图

渲染错误: Mermaid 渲染失败: Parse error on line 4: ... 提示词模板 ||--o{ AI Agent : 作为基础组件 A -----------------------^ Expecting 'COLON', 'STYLE_SEPARATOR', got 'UNICODE_TEXT'

4.3 工作流交互关系

输出层

Agent Harness训练师工作域

提示词工程师工作域

业务需求输入

业务方需求

需求拆解为大模型可识别的任务

编写角色提示词、少样本示例

单任务输出效果验证与优化

业务流程抽象为Agent协作拓扑

工具集开发、权限与边界配置

记忆系统、状态流转、错误回滚设计

多Agent协同规则编写

全流程压力测试与效果调优

可观测体系与对齐规则部署

落地的Agent应用系统

可以看到:两个职业不是替代关系,而是递进关系,提示词工程师是Agent训练师的基础,Agent训练师是提示词工程师的高阶发展方向。小公司、简单场景可能只需要提示词工程师就能搞定需求,中大型公司、复杂场景则需要Agent训练师来搭建完整的系统。

五、入行路径与最佳实践

5.1 提示词工程师入行路线(3个月可入门)

  1. 基础学习(1个月)
    • 熟悉主流大模型的特性:GPT-4o、Claude 3、文心一言、通义千问,每个模型都用至少100次,感受它们的差异
    • 学习主流提示词框架:CRISPE、CO-STAR、思维链、思维树,每个框架至少练习20个案例
    • 学习A/B测试的基本方法,掌握量化评估指标的设计
  2. 行业绑定(1个月)
    • 选择一个你熟悉的行业:电商、教育、金融、医疗、互联网都可以
    • 梳理这个行业的核心需求、术语、合规要求,比如电商的商品文案、客服回复、短视频脚本
    • 针对这个行业的10个核心场景,开发对应的提示词模板,测试效果
  3. 项目实战(1个月)
    • 接一些外包项目:比如帮商家写文案提示词、帮企业做客服提示词优化
    • 整理自己的作品集:把你做的提示词模板、效果对比数据整理成简历
    • 投递岗位:优先投递中小公司、业务部门的提示词工程师岗位,门槛更低

5.2 Agent训练师入行路线(6个月可入门)

  1. 基础阶段(2个月)
    • 先搞定提示词工程师的全部技能,这是基础
    • 学习Python基础,掌握基本的语法、API调用、数据库操作
    • 学习LangChain、LangGraph、MetaGPT等主流Agent框架的基本使用
  2. 核心技能学习(2个月)
    • 学习Agent四大核心组件的设计:规划、记忆、工具、对齐
    • 学习RAG、Function Call、向量数据库的基本使用
    • 学习可观测性、安全对齐的基本方法
  3. 项目实战(2个月)
    • 自己动手做3个以上的Agent项目:比如智能客服Agent、个人助理Agent、代码生成Agent
    • 学习多Agent协作的设计方法,做一个多Agent协作的项目比如AI写作团队
    • 整理作品集,投递中大型公司的Agent相关岗位

5.3 最佳实践Tips

提示词工程师避坑:
  1. 不要迷信“万能咒语”:不同大模型的特性不同,同一提示词在不同模型上的效果可能天差地别,一定要针对具体模型做适配
  2. 不要只懂通用提示词:绑定行业知识的提示词工程师竞争力是通用提示词工程师的3倍以上,比如医疗领域的提示词工程师缺口非常大,薪资也更高
  3. 不要靠主观判断效果:一定要用量化指标做A/B测试,比如文案的转化率、问答的准确率,数据才是硬道理
Agent训练师避坑:
  1. 不要过度追求技术酷炫:优先考虑业务落地,很多场景用简单的规则引擎就能搞定的,就不要硬上多Agent协作,反而增加复杂度和维护成本
  2. 一定要设计边界和熔断机制:Agent的工具调用权限要做最小集,避免出现Agent调用错误工具导致业务损失的情况,比如客服Agent不能直接给用户打款,最多只能提交退款申请
  3. 可观测性优先:Agent上线后一定要有全链路日志,能追踪每一步的状态、工具调用结果、输出内容,不然出了问题根本没法排查

六、行业发展趋势与未来展望

6.1 职业发展历史与未来预测

时间阶段 大模型技术发展节点 相关职业发展状态 市场缺口
2022年以前 预训练大模型萌芽,GPT-3、悟道2.0发布 无专门岗位,提示词能力属于AI算法工程师的附加技能 <1万
2022-2023年 ChatGPT发布,GPT-4上线,生成式AI爆发 提示词工程师岗位爆发,各大厂、中小公司纷纷招聘,相关培训课程层出不穷 10-15万
2024-2026年 多模态大模型普及,Agent框架成熟,企业级Agent应用落地加速 AI Agent Harness训练师岗位快速增长,逐步成为大模型应用团队的标配 30-50万
2027-2030年 通用人工智能(AGI)雏形出现,多Agent协作成为企业数字化的核心基础设施 Agent训练师细分领域出现,比如行业Agent专家、多Agent协作架构师、Agent安全专家 100-150万
2030年以后 AGI普及,Agent成为数字世界的核心交互主体 相关职业升级为AGI系统管控师,负责整个人机交互系统的设计与优化 200万+

6.2 未来3年的核心趋势判断

  1. 提示词工程师会逐渐下沉为通用技能:未来3年,提示词能力会像现在的Office能力一样,成为每个职场人的必备技能,大量通用的提示词工作会被AI工具替代,只有绑定行业核心知识的资深提示词工程师会继续存在
  2. Agent训练师会成为大模型应用层的核心岗位:未来所有的软件都会Agent化,每个公司都会有自己的Agent系统,Agent训练师的缺口会持续扩大,薪资也会持续走高
  3. 行业细分会越来越明显:未来不会有通用的Agent训练师,只会有电商Agent训练师、金融Agent训练师、医疗Agent训练师,懂行业+懂技术的复合型人才会最受欢迎

七、结论

大模型时代的职业发展不是非此即彼,如果你是零基础、没有编程基础,可以先从提示词工程师入手,快速进入大模型行业,积累经验后再往Agent训练师方向发展;如果你有编程基础、懂业务流程,可以直接学习Agent相关技术,抢占未来的黄金赛道。
不管选择哪个方向,核心都是要绑定行业知识,只懂技术不懂业务的人很快会被AI替代,懂技术又懂业务的复合型人才才是未来的稀缺资源。

行动号召

你对这两个职业有什么看法?你现在在学习提示词还是Agent技术?欢迎在评论区分享你的经历或者疑问,我会一一回复。如果你觉得本文对你有帮助,欢迎点赞、收藏、转发给更多有需要的朋友。

附加部分

参考文献/延伸阅读

  1. OpenAI官方提示词指南
  2. LangGraph官方文档
  3. 脉脉《2024年大模型相关岗位薪资报告》
  4. 斯坦福大学《2024年AI指数报告》
  5. 《Agent Design Patterns: Elements of Effective Agent Architecture》

作者简介

我是老K,10年经验的软件工程师,前大厂AI架构师,现在专注于大模型应用与Agent架构研究,每周分享一篇可落地的大模型技术干货,欢迎关注我的账号获取更多内容。

(全文完,共计11237字)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐