大模型时代的新职业：AI Agent Harness Engineering 训练师与提示词工程师的未来

AI学长带你学AI

347人浏览 · 2026-05-22 21:37:22

AI学长带你学AI · 2026-05-22 21:37:22 发布

大模型时代新职业爆发：AI Agent Harness Engineering训练师 vs 提示词工程师，谁才是未来5年的黄金赛道？

摘要/引言

你有没有刷到过这样的招聘JD？“提示词工程师，无编码要求，年薪30万起”、“AI Agent训练师，资深岗位年薪百万，不限行业背景”。据脉脉《2024大模型岗位薪资报告》显示，当前国内大模型应用层相关岗位的平均薪资比传统互联网岗位高出42%，其中提示词工程师平均起薪21K/月，AI Agent Harness Engineering（以下简称Agent束具工程师/Agent训练师）平均起薪32K/月，大厂资深岗位的年薪上限更是突破150万。
但很多人对这两个岗位的认知还停留在“写AI咒语”、“玩AutoGPT”的层面：到底什么是提示词工程师？什么是Agent训练师？两者有什么区别？入行门槛高不高？未来会不会被AI替代？
本文将从技术本质、技能要求、落地场景、发展趋势等多个维度，彻底拆解这两个大模型时代的黄金职业，你将收获：

两个职业的核心定义、能力模型、收入区间
两者的对比差异与职业发展路径
零基础入行的可落地学习路线
未来5年的行业发展趋势判断
本文适合所有想进入大模型行业的从业者、想转型的互联网人、以及想抓住时代红利的在校学生阅读，全文约11000字，建议收藏后慢慢看。

一、先搞懂背景：大模型应用的两次革命，催生两个新职业

在正式讲解两个职业之前，我们首先要搞懂它们诞生的底层逻辑：大模型的应用演化一共经历了两次核心革命，每一次革命都催生了对应的专属岗位。

1.1 第一次革命：从“不会用大模型”到“用好大模型”，催生提示词工程师

2022年底ChatGPT发布之后，所有人都发现了大模型的强大能力，但同样的问题，不同的人问出来得到的结果天差地别：有人问“写一篇文案”，得到的是流水账一样的内容；有人给了角色、场景、约束、示例，得到的是直接可以上线的高转化率文案。
这种“大模型输出质量高度依赖输入指令”的特性，直接催生了提示词工程师这个岗位：专门负责优化大模型的输入指令，让大模型的输出符合业务要求，准确率、匹配度达到可用水平。

1.2 第二次革命：从“单任务生成”到“复杂流程自动化”，催生Agent训练师

到了2023年下半年，越来越多的企业发现：单靠提示词根本搞不定复杂的业务场景。比如电商的智能售后客服，不仅要回答用户问题，还要自动查询订单系统、对接物流API、提交退款申请、遇到复杂问题还要转人工，整个流程涉及多步骤决策、工具调用、跨系统对接，还不能出错、不能泄露用户隐私、不能产生幻觉。
这种场景下，只优化提示词已经不够了，我们需要给大模型套上一层“管控束具（Harness）”：管它的工具调用权限、管它的记忆存储、管它的决策逻辑、管它的安全对齐、管它的错误回滚，这就是AI Agent Harness Engineering训练师的核心工作：搭建、管控、迭代全生命周期的Agent系统，实现复杂业务流程的自动化。

二、核心概念拆解：提示词工程师到底是做什么的？

2.1 问题背景与描述

大模型的本质是一个统计概率模型，它的输出完全由输入的上下文决定： $\mathcal{D}_p) = \frac{\exp(f(x, \mathcal{D}_p, y))}{\sum_{y' \in \mathcal{Y}} \exp(f(x, \mathcal{D}_p, y'))}$
其中 $x$ 是用户查询， $\mathcal{D}_p = \{(x_1,y_1), (x_2,y_2), ..., (x_k,y_k)\}$ 是提示词中包含的少样本示例， $f$ 是大模型的打分函数， $\mathcal{Y}$ 是输出空间。
简单来说：你给的提示词越清晰、越具体、约束越明确，大模型的输出就越符合你的预期。但绝大多数业务人员不懂大模型的特性，写出来的提示词要么模糊、要么缺少约束、要么没有匹配大模型的“思维习惯”，导致大模型的输出根本没法用，这就是提示词工程师要解决的核心问题。

2.2 核心概念与要素组成

提示词工程师（Prompt Engineer）的核心目标是：通过优化输入指令，让大模型的输出准确率、匹配度、合规性达到业务可用标准，同时尽可能降低推理成本。
一个合格的提示词工程师需要掌握的核心要素包括：

（1）主流大模型特性

熟悉GPT、 Claude、文心一言、通义千问等主流大模型的差异：比如GPT-4o擅长逻辑推理，Claude 3 Opus擅长长文本处理，开源模型Llama 3适合私有化部署，不同模型的提示词优化逻辑完全不同。

（2）提示词设计框架

掌握主流的提示词设计框架，比如：

CRISPE框架：角色（Role）、背景（Context）、指令（Instruction）、输入（Input）、输出格式（Output）
CO-STAR框架：背景（Context）、目标（Objective）、场景（Scenario）、任务（Task）、行动（Action）、结果（Result）
思维链（CoT）提示：引导大模型一步步推理，适合解决数学题、逻辑题等复杂问题

（3）效果评估与迭代能力

能够设计量化的评估指标（比如准确率、转化率、 hallucination率），通过A/B测试持续优化提示词，而不是靠主观感觉判断效果好坏。

（4）基础行业知识

懂所在行业的业务规则、术语、合规要求：比如做医疗领域的提示词工程师要熟悉医疗文书规范，做金融领域的要熟悉监管要求，这比只会写通用提示词的竞争力高3倍以上。

2.3 提示词优化的标准流程

2.4 代码示例：结构化提示词开发

环境安装

pip install openai langchain python-dotenv

示例代码（电商商品文案生成提示词）

import os
from dotenv import load_dotenv
from langchain.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0.3, api_key=os.getenv("OPENAI_API_KEY"))

# 提示词工程师开发的电商商品文案生成提示词模板，遵循CRISPE框架
product_copy_prompt = PromptTemplate(
    input_variables=["product_category", "product_features", "target_audience", "tone"],
    template="""
    # 角色：你是拥有10年经验的电商文案专家，擅长撰写转化率高的商品详情页文案。
    # 背景：我们需要为{product_category}类的商品撰写详情页首屏文案，面向{target_audience}群体。
    # 指令：请根据以下商品特征撰写文案，严格遵循要求：
    1. 开头第一句必须直击目标用户的核心痛点
    2. 分3个要点介绍商品核心优势，每个优势搭配1个场景化描述
    3. 结尾加入明确的行动号召，引导用户点击下单
    4. 整体语气{tone}，避免生硬的技术术语，字数控制在300-500字
    5. 禁止虚构商品没有的功能，禁止夸大宣传，符合广告法要求
    # 商品特征：{product_features}
    # 输出格式：直接输出文案，不要额外解释。
    """
)

# 组装提示词
prompt = product_copy_prompt.format(
    product_category="无线蓝牙耳机",
    product_features="续航48小时、主动降噪深度40dB、IPX7防水、单耳重量3.8g",
    target_audience="20-30岁的通勤上班族、运动爱好者",
    tone="轻松活泼有代入感"
)

# 调用大模型生成结果
response = llm.invoke(prompt)
print("生成的商品文案：")
print(response.content)

2.5 适用场景与边界

提示词工程师的适用场景主要包括：

内容生成类场景：文案、海报、短视频脚本、代码生成
简单问答类场景：客服知识库问答、FAQ自动回复
单任务处理类场景：简历筛选、文档摘要、数据标注
大模型行业适配：把通用大模型适配到特定行业的简单任务
提示词工程师的边界：不涉及大模型微调、不涉及工具开发、不涉及跨系统流程对接，只优化大模型的输入输出。

三、核心概念拆解：AI Agent Harness Engineering训练师到底是做什么的？

3.1 问题背景与描述

当我们需要大模型处理多步骤、跨系统、高合规的复杂任务时，单靠提示词会遇到大量瓶颈：

上下文长度有限：大模型的上下文窗口是有限的，没法记住所有的历史交互和业务数据
没法调用外部工具：大模型本身没有办法直接查询数据库、调用API、操作业务系统
没法处理复杂决策：多步骤的业务流程需要判断、分支、回滚，单靠提示词很容易出错
合规风险不可控：大模型可能会产生幻觉、泄露隐私、做出不符合业务规则的操作，没有管控的话会带来巨大的业务损失
这时候我们需要给大模型套上一层“束具（Harness）”，把大模型变成一个可管控、可观测、可迭代的智能体（Agent），这就是Agent训练师要解决的核心问题。

3.2 核心概念与要素组成

AI Agent Harness Engineering训练师的核心目标是：搭建、管控、迭代全生命周期的Agent系统，实现复杂业务流程的自动化，同时保障系统的安全性、稳定性、合规性。
Agent系统的核心数学模型是马尔可夫决策过程（MDP）：
$\mathcal{M} = (S, A, P, R, \gamma)$
其中 $S$ 是Agent的状态空间（包括上下文记忆、工具返回结果、用户历史交互）， $A$ 是行动空间（包括生成文本、调用工具、移交其他Agent）， $P$ 是状态转移概率， $R$ 是奖励函数（比如输出符合要求得正奖励，幻觉、违规得负奖励）， $\gamma$ 是折扣因子。
一个合格的Agent训练师需要掌握的核心要素包括：

（1）提示词优化能力

这是基础，所有Agent的核心逻辑都需要提示词来定义，Agent训练师首先要是一个优秀的提示词工程师。

（2）Agent核心组件设计能力

掌握Agent四大核心组件的设计：

规划模块：让Agent能把复杂任务拆分成多个子步骤，一步步完成
记忆模块：分为短期记忆（上下文窗口）和长期记忆（向量数据库、业务数据库），让Agent能记住历史交互和业务数据
工具模块：让Agent能调用外部工具（API、数据库、RAG系统、其他Agent）
对齐模块：让Agent的所有操作都符合业务规则、合规要求、安全约束

（3）多Agent协作设计能力

复杂场景往往需要多个Agent协作完成，比如一个智能客服系统需要有咨询Agent、订单查询Agent、退款处理Agent、人工转接Agent，Agent训练师需要设计多个Agent的分工、交互规则、异常处理逻辑。

（4）可观测与迭代能力

Agent上线后需要有全链路的监控：能追踪每一步的状态、工具调用结果、输出内容，能快速定位问题，通过奖励函数、规则优化持续迭代Agent的效果。

3.3 Agent系统开发的标准流程

3.4 代码示例：简单售后客服Agent开发

环境安装

pip install langgraph openai python-dotenv

示例代码

import os
from dotenv import load_dotenv
from typing import Annotated, TypedDict
from langchain_openai import ChatOpenAI
from langgraph.graph import StateGraph, END
from langgraph.graph.message import add_messages

# 加载环境变量
load_dotenv()
llm = ChatOpenAI(model="gpt-4o", temperature=0, api_key=os.getenv("OPENAI_API_KEY"))

# 定义Agent状态
class AgentState(TypedDict):
    messages: Annotated[list, add_messages]
    user_id: str
    order_id: str = None
    need_refund: bool = False

# 模拟工具：查询订单信息（实际场景对接订单数据库）
def query_order(state: AgentState):
    """查询用户订单信息的工具"""
    order_id = state["order_id"]
    return {"messages": [{"role": "system", "content": f"订单{order_id}的状态：已发货，预计2天后到达，商品金额299元，支持7天无理由退款"}]}

# 模拟工具：处理退款申请（实际场景对接退款系统）
def process_refund(state: AgentState):
    """处理用户退款申请的工具"""
    order_id = state["order_id"]
    user_id = state["user_id"]
    return {"messages": [{"role": "system", "content": f"用户{user_id}的订单{order_id}退款申请已提交，审核通过后预计1-3个工作日到账，退款单号：TK{order_id}"}]}

# 路由节点：判断下一步行动
def router(state: AgentState):
    """根据用户查询判断需要调用的工具或者直接回答"""
    last_message = state["messages"][-1].content
    if "订单" in last_message and state["order_id"]:
        return "query_order"
    elif "退款" in last_message and state["order_id"]:
        return "process_refund"
    else:
        if not state["order_id"]:
            return {"messages": [{"role": "assistant", "content": "请您提供一下订单号，我才能为您查询相关信息哦~"}]}
        return END

# 搭建Agent管控流图
workflow = StateGraph(AgentState)
workflow.add_node("router", router)
workflow.add_node("query_order", query_order)
workflow.add_node("process_refund", process_refund)

workflow.set_entry_point("router")
workflow.add_edge("query_order", END)
workflow.add_edge("process_refund", END)

# 编译Agent
app = workflow.compile()

# 测试Agent
initial_state = {
    "messages": [{"role": "user", "content": "我要退款，我的订单号是123456"}],
    "user_id": "u_10086",
    "order_id": "123456"
}

for output in app.stream(initial_state):
    for key, value in output.items():
        print(f"节点 {key} 输出：")
        print(value["messages"][-1]["content"])

3.5 适用场景与边界

Agent训练师的适用场景主要包括：

企业级工作流自动化：智能客服、智能审批、供应链自动调度
复杂任务处理：代码生成Agent、智能投顾、故障排查Agent
多角色协作场景：游戏NPC、AI团队协作系统、虚拟员工
高合规要求场景：金融合规审核、医疗辅助诊断、政务服务Agent
Agent训练师的边界：不涉及大模型的预训练，只做大模型之上的Agent系统搭建、管控与迭代。

四、两个职业的核心对比与关系

4.1 核心属性维度对比

对比维度	提示词工程师（Prompt Engineer）	AI Agent Harness Engineering训练师
核心目标	优化单轮/多轮大模型输入，提升输出准确率与匹配度	搭建、管控、迭代全生命周期的Agent系统，实现复杂业务流程自动化
工作对象	大模型的输入文本（提示词）、少样本示例	Agent的全套组件：提示词、工具集、记忆系统、协作规则、安全对齐策略、可观测体系
核心技能栈	大模型特性熟悉、提示词框架、A/B测试、基础行业知识	提示词优化、Agent框架（LangGraph/MetaGPT）、工具编排、RAG、可观测性、安全对齐、业务流程建模
输出物	提示词模板、少样本库、提示词优化规则	Agent管控系统、多Agent协作规则、工具调用配置、错误处理机制、效果监控看板
适用场景	内容生成、单任务大模型适配、简单问答系统	企业级工作流自动化、多步骤复杂任务处理、多角色协作场景、高合规要求场景
平均起薪（2024年国内）	18-25K/月	25-35K/月
资深岗位年薪	30-80万	50-150万
入行门槛	大专及以上，无需深厚编程基础	本科及以上，需掌握Python基础、常用开发框架，有业务建模能力优先
职业生命周期	2022-2027年（逐渐下沉为通用技能）	2024-2035+（长期存在，随通用Agent发展持续升级）
被AI替代风险	中（大量通用提示词工作会被AI工具替代）	低（涉及业务理解、系统设计、安全管控，短期很难被AI替代）

4.2 实体关系ER图

 渲染错误: Mermaid 渲染失败: Parse error on line 4: ... 提示词模板 ||--o{ AI Agent : 作为基础组件 A -----------------------^ Expecting 'COLON', 'STYLE_SEPARATOR', got 'UNICODE_TEXT'

4.3 工作流交互关系

可以看到：两个职业不是替代关系，而是递进关系，提示词工程师是Agent训练师的基础，Agent训练师是提示词工程师的高阶发展方向。小公司、简单场景可能只需要提示词工程师就能搞定需求，中大型公司、复杂场景则需要Agent训练师来搭建完整的系统。

五、入行路径与最佳实践

5.1 提示词工程师入行路线（3个月可入门）

基础学习（1个月）：
- 熟悉主流大模型的特性：GPT-4o、Claude 3、文心一言、通义千问，每个模型都用至少100次，感受它们的差异
- 学习主流提示词框架：CRISPE、CO-STAR、思维链、思维树，每个框架至少练习20个案例
- 学习A/B测试的基本方法，掌握量化评估指标的设计
行业绑定（1个月）：
- 选择一个你熟悉的行业：电商、教育、金融、医疗、互联网都可以
- 梳理这个行业的核心需求、术语、合规要求，比如电商的商品文案、客服回复、短视频脚本
- 针对这个行业的10个核心场景，开发对应的提示词模板，测试效果
项目实战（1个月）：
- 接一些外包项目：比如帮商家写文案提示词、帮企业做客服提示词优化
- 整理自己的作品集：把你做的提示词模板、效果对比数据整理成简历
- 投递岗位：优先投递中小公司、业务部门的提示词工程师岗位，门槛更低

5.2 Agent训练师入行路线（6个月可入门）

基础阶段（2个月）：
- 先搞定提示词工程师的全部技能，这是基础
- 学习Python基础，掌握基本的语法、API调用、数据库操作
- 学习LangChain、LangGraph、MetaGPT等主流Agent框架的基本使用
核心技能学习（2个月）：
- 学习Agent四大核心组件的设计：规划、记忆、工具、对齐
- 学习RAG、Function Call、向量数据库的基本使用
- 学习可观测性、安全对齐的基本方法
项目实战（2个月）：
- 自己动手做3个以上的Agent项目：比如智能客服Agent、个人助理Agent、代码生成Agent
- 学习多Agent协作的设计方法，做一个多Agent协作的项目比如AI写作团队
- 整理作品集，投递中大型公司的Agent相关岗位

5.3 最佳实践Tips

提示词工程师避坑：

不要迷信“万能咒语”：不同大模型的特性不同，同一提示词在不同模型上的效果可能天差地别，一定要针对具体模型做适配
不要只懂通用提示词：绑定行业知识的提示词工程师竞争力是通用提示词工程师的3倍以上，比如医疗领域的提示词工程师缺口非常大，薪资也更高
不要靠主观判断效果：一定要用量化指标做A/B测试，比如文案的转化率、问答的准确率，数据才是硬道理

Agent训练师避坑：

不要过度追求技术酷炫：优先考虑业务落地，很多场景用简单的规则引擎就能搞定的，就不要硬上多Agent协作，反而增加复杂度和维护成本
一定要设计边界和熔断机制：Agent的工具调用权限要做最小集，避免出现Agent调用错误工具导致业务损失的情况，比如客服Agent不能直接给用户打款，最多只能提交退款申请
可观测性优先：Agent上线后一定要有全链路日志，能追踪每一步的状态、工具调用结果、输出内容，不然出了问题根本没法排查

六、行业发展趋势与未来展望

6.1 职业发展历史与未来预测

时间阶段	大模型技术发展节点	相关职业发展状态	市场缺口
2022年以前	预训练大模型萌芽，GPT-3、悟道2.0发布	无专门岗位，提示词能力属于AI算法工程师的附加技能	<1万
2022-2023年	ChatGPT发布，GPT-4上线，生成式AI爆发	提示词工程师岗位爆发，各大厂、中小公司纷纷招聘，相关培训课程层出不穷	10-15万
2024-2026年	多模态大模型普及，Agent框架成熟，企业级Agent应用落地加速	AI Agent Harness训练师岗位快速增长，逐步成为大模型应用团队的标配	30-50万
2027-2030年	通用人工智能（AGI）雏形出现，多Agent协作成为企业数字化的核心基础设施	Agent训练师细分领域出现，比如行业Agent专家、多Agent协作架构师、Agent安全专家	100-150万
2030年以后	AGI普及，Agent成为数字世界的核心交互主体	相关职业升级为AGI系统管控师，负责整个人机交互系统的设计与优化	200万+

6.2 未来3年的核心趋势判断

提示词工程师会逐渐下沉为通用技能：未来3年，提示词能力会像现在的Office能力一样，成为每个职场人的必备技能，大量通用的提示词工作会被AI工具替代，只有绑定行业核心知识的资深提示词工程师会继续存在
Agent训练师会成为大模型应用层的核心岗位：未来所有的软件都会Agent化，每个公司都会有自己的Agent系统，Agent训练师的缺口会持续扩大，薪资也会持续走高
行业细分会越来越明显：未来不会有通用的Agent训练师，只会有电商Agent训练师、金融Agent训练师、医疗Agent训练师，懂行业+懂技术的复合型人才会最受欢迎

七、结论

大模型时代的职业发展不是非此即彼，如果你是零基础、没有编程基础，可以先从提示词工程师入手，快速进入大模型行业，积累经验后再往Agent训练师方向发展；如果你有编程基础、懂业务流程，可以直接学习Agent相关技术，抢占未来的黄金赛道。
不管选择哪个方向，核心都是要绑定行业知识，只懂技术不懂业务的人很快会被AI替代，懂技术又懂业务的复合型人才才是未来的稀缺资源。

行动号召

你对这两个职业有什么看法？你现在在学习提示词还是Agent技术？欢迎在评论区分享你的经历或者疑问，我会一一回复。如果你觉得本文对你有帮助，欢迎点赞、收藏、转发给更多有需要的朋友。

附加部分

参考文献/延伸阅读

OpenAI官方提示词指南
LangGraph官方文档
脉脉《2024年大模型相关岗位薪资报告》
斯坦福大学《2024年AI指数报告》
《Agent Design Patterns: Elements of Effective Agent Architecture》

作者简介

我是老K，10年经验的软件工程师，前大厂AI架构师，现在专注于大模型应用与Agent架构研究，每周分享一篇可落地的大模型技术干货，欢迎关注我的账号获取更多内容。

（全文完，共计11237字）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

C++内存管理终极指南：从智能指针到RAII

AtomGit开源社区

LlamaFactory v0.9.5 发布：Qwen3.5/Qwen3.6/Gemma4 全面支持，Transformers v5 兼容性正式到位

代码地址：github.com/hiyouga/LlamaFactory总体来看，LlamaFactory v0.9.5 是一个覆盖面极广、工程含量很高的版本。它的重点并不只是“新增几个模型”，而是围绕这个核心目标，把模型支持、训练框架、分布式能力、多模态处理、模板配置、CI 环境、文档说明一起往前推进了一大步。Qwen3.5Qwen3.6Gemma4FSDP2DeepSpeed量化多模态v1 训