Agent 框架怎么选?一篇搞定主流框架选型指南,从 LangChain 到 Microsoft Agent Framework!
文章核心内容围绕 Agent 框架的选型展开,强调 Agent 框架并非越火越好,而是需根据场景选择。文章首先介绍了常见的 AI 应用路径和挑战,进而阐述了 Agent 框架的核心价值,即通过可编排、可调用工具、可多人协作、可观测、可上线的方式将大模型转化为智能应用系统。接着,文章详细解析了 8 个 Agent 应用核心组件及其作用,并指出成熟的 Agent 框架至少要解决任务拆解、工具调用、多 Agent 协作和结果评估等四类问题。文章还介绍了主流的 Agent 框架,包括 LangChain/LangGraph、AutoGen/Microsoft Agent Framework、CrewAI、MetaGPT、OpenAI Agents SDK、LlamaIndex 和 Semantic Kernel 等,并分析了它们各自的定位、优势和适用场景。最后,文章提出了 Agent 框架选型的 5 个关键问题和 8 个避坑点,为产品经理和技术负责人提供了实用的选型建议。
01 先给结论:Agent 框架不是越火越好,而是要按场景选
过去做 AI 应用,常见路径是:
用户输入 → Prompt → LLM → 返回答案
再进一步,是 RAG:
用户输入 → 检索知识库 → LLM 生成 → 返回答案
但到了企业级 Agent 场景,仅靠一次 LLM 调用或一个 RAG 链路就不够了。真实业务往往需要:
理解任务 → 拆解步骤 → 调用工具/API → 查询数据库 → 多轮推理 → 人工审批 → 执行动作 → 记录日志 → 评估效果
这时候,Agent 框架的价值就出现了。
一句话概括:
Agent 框架不是帮你“接一个大模型”,而是帮你把大模型变成可编排、可调用工具、可多人协作、可观测、可上线的智能应用系统。
如果只做知识库问答,用 LlamaIndex、LangChain、Dify 这类工具就够了;如果要做复杂流程、长任务、多 Agent 协作,就要关注 LangGraph、CrewAI、AutoGen/MicrosoftAgent Framework、OpenAI Agents SDK、MetaGPT 等框架。
02 Agent 框架到底解决什么问题?
一个 Agent 应用通常由 8 个核心组件组成:
Agent = LLM + Prompt + Memory + Tools + Planning + Workflow + Guardrails + Observability
拆开看:
| 组件 | 作用 | 没有它会怎样 |
|---|---|---|
| LLM | 负责理解、推理和生成 | 只能做传统规则系统 |
| Prompt / Instruction | 定义角色、任务、边界和输出格式 | 输出不稳定、不可控 |
| Memory | 保存上下文、历史偏好、长期状态 | 每次对话都像第一次见面 |
| Tools | 调用函数、API、数据库、搜索、代码执行等 | Agent 只能“说”,不能“做” |
| Planning | 拆解任务、决定下一步动作 | 复杂任务容易丢步骤 |
| Workflow | 控制执行顺序、分支、循环、暂停和恢复 | 难以承载企业流程 |
| Guardrails | 输入输出校验、安全约束、人工审批 | 容易幻觉、越权、误操作 |
| Observability | tracing、日志、评估、成本监控 | 出问题不知道错在哪里 |
所以,一个成熟 Agent 框架至少要帮你解决四类问题:
1. 任务如何被拆解?
用户说“帮我分析库存风险并给出补货建议”,背后可能需要查询库存、销量、采购周期、安全库存、供应商交期、历史促销等多个系统。
2. 工具如何被调用?
Agent 不能只生成文字,而要能调用:
get_inventory()
get_sales_trend()
search_policy_docs()
create_purchase_order()
send_approval_request()
3. 多个 Agent 如何协作?
例如:
主 Agent:理解目标与任务拆解
库存 Agent:判断缺货和滞销
定价 Agent:给出调价建议
采购 Agent:给出补货建议
风险 Agent:检查是否需要人工审批
报告 Agent:生成经营报告
4. 结果如何被评估和追踪?
企业不会因为“AI 很聪明”就付费,最终还是看:
是否提升效率?
是否降低成本?
是否减少风险?
是否增加收入?
是否可解释、可审计、可复盘?
03 Agent 框架全景图:主流框架怎么分层?
目前 Agent 框架大致可以分成 6 类。
| 类型 | 代表框架 | 核心定位 | 最适合场景 |
|---|---|---|---|
| 通用 Agent 编排框架 | LangChain / LangGraph | 模型、工具、状态图、流程编排 | 通用 Agent、复杂工作流、企业级应用 |
| 多 Agent 协作框架 | CrewAI、AutoGen、MetaGPT | 多角色协作、Agent 团队 | 研究、自动化任务、团队型 Agent |
| 企业级 Agent SDK | OpenAI Agents SDK、Microsoft Agent Framework、Semantic Kernel | 工具、会话、护栏、观测、企业集成 | 生产级 Agent、企业应用 |
| 知识增强与文档 Agent | LlamaIndex、Haystack | RAG、文档处理、检索增强 | 知识库、文档问答、企业搜索 |
| 软件工程 Agent | MetaGPT、SWE-agent、GPT Pilot 等 | 需求到代码、软件公司式协作 | 代码生成、软件项目自动化 |
| 低代码 / 产品化平台 | Dify、Coze、Flowise、Langflow 等 | 可视化搭建、工作流、插件 | 快速原型、业务验证、轻量交付 |
这篇文章重点解析开发者和产品经理最常遇到的几个框架:
LangChain / LangGraph
AutoGen / Microsoft Agent Framework
CrewAI
MetaGPT
OpenAI Agents SDK
LlamaIndex
Semantic Kernel
Haystack
04 LangChain / LangGraph:最通用的 Agent 基础设施
4.1 它是什么?
LangChain 最早是 LLM 应用开发框架,覆盖模型调用、Prompt、Chains、Tools、Retrievers、Agents 等能力。现在的 LangChain Agent 已经越来越多地和 LangGraph 结合:LangChain 文档中提到 create_agent 会构建基于 LangGraph 的图式 Agent Runtime,Agent 在图中的节点和边之间执行模型调用、工具调用和中间件处理。
LangGraph 则更偏底层编排。官方文档将它定位为用于构建、管理和部署长时间运行、具备状态的 Agent 的低层编排框架,强调 durable execution、streaming、human-in-the-loop、memory 等能力。
4.2 适合什么场景?
LangChain / LangGraph 适合:
1. 你要做通用 Agent;
2. 你希望灵活接入不同模型、工具、检索器;
3. 你需要复杂流程、分支、循环、状态管理;
4. 你需要做生产级 Agent 编排;
5. 你有工程团队,愿意写代码控制细节。
例如:
智能客服 Agent
企业知识库问答 Agent
数据分析 Agent
销售助理 Agent
供应链经营分析 Agent
合同审查 Agent
智能报告生成 Agent
4.3 LangChain 与 LangGraph 的关系
可以这样理解:
LangChain:提供构建 Agent 的积木
LangGraph:提供控制 Agent 运行路径的图式编排引擎
LangSmith:提供 tracing、调试、评估和观测能力
如果你只是做简单工具调用,LangChain Agent 就够;如果你要做复杂流程、可恢复任务、多节点状态机,就应该上 LangGraph。
4.4 最小代码示例:LangChain Agent
from langchain.agents import create_agent
def get_weather(city: str) -> str:
return f"{city} 今天晴,适合出行。"
agent = create_agent(
model="openai:gpt-4o-mini",
tools=[get_weather],
system_prompt="你是一个会调用工具的旅行助理。"
)
result = agent.invoke({
"messages": [
{"role": "user", "content": "北京今天天气怎么样?"}
]
})
print(result)
4.5 LangGraph 的核心思想
LangGraph 的思路不是“线性链条”,而是“状态图”。
START
↓
模型节点
↓
是否需要工具?
├── 是 → 工具节点 → 模型节点
└── 否 → END
这种结构可以天然支持:
分支
循环
中断
人工确认
状态持久化
任务恢复
多 Agent 编排
4.6 产品经理视角:什么时候选 LangGraph?
如果你要做的是企业级 Agent,尤其是以下情况,LangGraph 很值得优先考虑:
| 场景 | 为什么适合 LangGraph |
|---|---|
| 多步骤任务 | 图结构可以控制每一步执行 |
| 长任务 | 支持状态持久化和恢复 |
| 人工审批 | 支持 human-in-the-loop |
| 多 Agent 协作 | 可以把不同 Agent 设计为不同节点 |
| 复杂业务流程 | 可以做分支、循环和条件判断 |
| 需要可观测 | 可配合 LangSmith 做 tracing 和评估 |
一句话:
LangChain / LangGraph 更像 Agent 应用的“工程底座”,适合做复杂、可控、长期演进的企业 Agent。
05 AutoGen:多 Agent 对话协作的经典框架,但新项目要关注 Microsoft Agent Framework
5.1 它是什么?
AutoGen 是 Microsoft Research 推出的开源 Agent 框架,核心思想是让多个可对话 Agent 通过协作完成任务。官方文档中,AutoGen 包含 AgentChat、Core、Extensions、Studio 等部分,其中 AgentChat 用于构建单 Agent 和多 Agent 对话应用,Core 则是事件驱动的可扩展多 Agent 系统框架。
AutoGen 曾经非常适合做:
多 Agent 讨论
代码生成与执行
研究型 Agent
用户代理 + 助手代理协作
自动化任务探索
5.2 但要注意:AutoGen 当前状态发生了变化
AutoGen GitHub 仓库已经明确提示:AutoGen 现在处于 maintenance mode,不再接收新特性或增强,社区维护;新用户建议使用 Microsoft Agent Framework,既有用户建议迁移。官方仓库还说明 Microsoft Agent Framework 是 AutoGen 的 enterprise-ready successor。
这意味着:
如果是学习多 Agent 思想,可以继续研究 AutoGen;
如果是新项目生产落地,更建议评估 Microsoft Agent Framework;
如果公司已有 AutoGen 存量项目,应规划迁移路线。
5.3 AutoGen 的典型模式
最经典的是:
UserProxyAgent:代表用户,可执行代码、接收人工输入
AssistantAgent:负责思考、写代码、调用工具
GroupChat:多个 Agent 组成群聊,协作完成任务
一个典型任务:
用户:帮我分析这份 CSV 数据,画出销售趋势图。
AssistantAgent:写 Python 代码。
UserProxyAgent:执行代码并返回结果。
AssistantAgent:分析结果并生成结论。
5.4 产品经理视角:AutoGen 的价值
AutoGen 的价值在于,它让人非常直观地理解多 Agent 协作:
Agent 不是一个助手,而是一组角色;
协作不是函数调用,而是多轮对话和任务推进;
人可以参与其中,成为 Human-in-the-loop 的一部分。
5.5 AutoGen 适合什么?
| 适合 | 不太适合 |
|---|---|
| 学习多 Agent 协作思想 | 从 0 开始做长期企业项目 |
| 快速验证研究型 Agent | 对稳定 API 和长期支持要求高的系统 |
| 数据分析、代码执行 Demo | 强合规、强审计、强稳定生产系统 |
| 多 Agent 群聊实验 | 复杂企业系统集成 |
06 Microsoft Agent Framework:AutoGen + Semantic Kernel 的企业级演进方向
6.1 它是什么?
Microsoft Agent Framework 是 Microsoft 新一代 Agent 框架。官方文档明确说明,它结合了 AutoGen 的简单 Agent 抽象和 Semantic Kernel 的企业特性,包括 session-based state management、type safety、middleware、telemetry,并加入 graph-based workflows 用于显式控制多 Agent 编排。
它的定位很清楚:
面向企业级 Agent 应用;
兼顾单 Agent 和多 Agent;
强调工作流、状态管理、遥测、类型安全、生产级能力。
6.2 什么时候考虑它?
如果你的企业技术栈高度依赖:
Azure
Microsoft 生态
.NET / C#
企业级权限与合规
AI Foundry
Semantic Kernel 存量项目
AutoGen 存量项目
那么 Microsoft Agent Framework 很值得关注。
6.3 Agent vs Workflow:官方给出的关键判断
Microsoft 文档中有一个很重要的判断:当任务开放、对话式、需要自主工具使用与规划时,用 Agent;当流程步骤明确、需要显式控制执行顺序、多个 Agent 或函数必须协调时,用 Workflow。
这句话对产品经理非常重要。
翻译成产品语言:
能写死的流程,就不要交给 Agent 自由发挥;
需要开放判断的部分,再交给 Agent;
企业级产品应该是 Agent + Workflow 的混合架构。
07 CrewAI:最像“AI 团队管理”的多 Agent 框架
7.1 它是什么?
CrewAI 是一个面向多 Agent 协作和复杂工作流的开源框架。官方文档强调它可以构建 collaborative AI agents、crews 和 flows,并内置 guardrails、memory、knowledge、observability 等能力。
CrewAI 官方介绍中还将核心结构拆成两部分:
CrewAI Flows:结构化、事件驱动的工作流骨架,负责状态和执行控制;
CrewAI Crews:Flow 中的工作单元,由多个自治 Agent 协作完成任务。
官方文档称 CrewAI 将 Crews 的协作智能与 Flows 的精确控制结合,用于构建生产级多 Agent 系统。
7.2 它的核心概念
| 概念 | 解释 |
|---|---|
| Agent | 一个具备角色、目标、背景、工具的专业成员 |
| Task | 分配给 Agent 的具体任务 |
| Crew | 多个 Agent 组成的团队 |
| Process | Agent 执行任务的协作方式,如顺序、层级、混合 |
| Flow | 更可控的事件驱动工作流 |
| Tools | Agent 可调用的外部能力 |
| Memory / Knowledge | 上下文和知识增强 |
| Guardrails | 结果校验和安全约束 |
7.3 CrewAI 示例:研究员 + 作者团队
from crewai import Agent, Task, Crew, Process
researcher = Agent(
role="行业研究员",
goal="收集并分析 Agent 框架的最新资料",
backstory="你擅长技术调研和资料整理。"
)
writer = Agent(
role="技术作者",
goal="把研究资料整理成微信公众号文章",
backstory="你擅长写结构清晰、有传播力的技术文章。"
)
research_task = Task(
description="调研 LangChain、CrewAI、AutoGen、MetaGPT 的核心差异。",
agent=researcher,
expected_output="一份结构化调研报告。"
)
write_task = Task(
description="基于调研报告,写一篇技术公众号文章。",
agent=writer,
expected_output="一篇完整文章。"
)
crew = Crew(
agents=[researcher, writer],
tasks=[research_task, write_task],
process=Process.sequential
)
result = crew.kickoff()
print(result)
7.4 CrewAI 适合什么?
CrewAI 很适合做“角色型任务协作”:
内容生产团队
市场调研团队
销售资料生成团队
客服质检团队
投研分析团队
候选人筛选团队
竞品分析团队
经营报告团队
7.5 产品经理视角:CrewAI 的最大优势
CrewAI 的优势是它的心智模型非常接近真实团队:
角色
目标
背景
任务
流程
协作
输出
这对非底层工程背景的产品经理特别友好,因为你可以用“组织分工”的方式设计 Agent。
例如一个“AI 招聘筛选团队”:
JD 分析 Agent:拆解岗位能力要求
简历分析 Agent:提取候选人经历
匹配评分 Agent:给出匹配度
面试题生成 Agent:生成面试问题
报告 Agent:输出候选人评估报告
这就是 CrewAI 最自然的使用方式。
7.6 CrewAI 的边界
CrewAI 适合多角色协作,但如果你要做非常底层、复杂、强状态控制的图式工作流,LangGraph 可能更灵活。如果你要深度进入 Microsoft / Azure 生态,Microsoft Agent Framework 可能更合适。
08 MetaGPT:把软件公司 SOP 编进多 Agent 的代表框架
8.1 它是什么?
MetaGPT 是一个面向软件工程任务的多 Agent 框架,它的核心思想是:
Code = SOP(Team)
也就是把标准作业流程 SOP 编进由 LLM 组成的团队,让不同角色像软件公司一样协作。MetaGPT 的公开介绍中提到,它可以接受一行需求作为输入,然后输出用户故事、竞品分析、需求、数据结构、API、文档等;内部包含产品经理、架构师、项目经理、工程师等角色,并以软件公司的流程协作完成任务。
8.2 MetaGPT 的典型流程
用户输入:
做一个贪吃蛇小游戏
MetaGPT 内部可能会拆成:
产品经理:写 PRD / 用户故事
架构师:设计系统架构
项目经理:拆任务
工程师:写代码
测试角色:检查功能
文档角色:输出说明
8.3 MetaGPT 和 CrewAI 的区别
| 对比项 | MetaGPT | CrewAI |
|---|---|---|
| 核心思想 | SOP 化的软件公司 | 角色团队协作 |
| 典型场景 | 软件开发、需求到代码 | 通用多角色任务 |
| 角色设计 | 偏固定,如 PM、架构师、工程师 | 高度自定义 |
| 流程控制 | 强 SOP | 可顺序、层级、Flow |
| 产品心智 | 模拟公司 | 组建团队 |
| 适合对象 | 软件工程自动化 | 内容、运营、业务自动化、研究任务 |
8.4 MetaGPT 适合什么?
从需求生成 PRD
从 PRD 生成技术设计
从技术设计生成代码
自动生成 API 文档
生成软件项目骨架
模拟软件开发流程
8.5 产品经理视角:MetaGPT 的启发
MetaGPT 最大的启发不是“它能不能完全替代程序员”,而是:
复杂任务要流程化,流程要角色化,角色要产出标准化。
这句话对企业 Agent 产品设计非常重要。
例如供应链 Agent 也可以借鉴 SOP 思路:
用户提问
↓
需求识别
↓
数据查询
↓
库存分析
↓
定价建议
↓
风险审核
↓
报告输出
↓
人工审批
也就是说,MetaGPT 的真正价值,是让我们看到:
Multi-Agent 不应该自由聊天,而应该嵌入业务 SOP。
09 OpenAI Agents SDK:轻量、直接、工程友好的多 Agent SDK
9.1 它是什么?
OpenAI Agents SDK 是 OpenAI 官方开源的轻量 Agent 框架。GitHub README 中将它描述为用于构建 multi-agent workflows 的轻量但强大的框架,并且是 provider-agnostic,支持 OpenAI Responses、Chat Completions 以及其他 LLM。其核心概念包括 Agents、Sandbox Agents、Agents as tools / Handoffs、Tools、Guardrails、Human-in-the-loop、Sessions、Tracing 等。
9.2 它适合什么?
OpenAI Agents SDK 适合:
快速构建生产级 Agent
需要 handoff 的多 Agent
需要 guardrails 的安全校验
需要 tracing 的运行观测
需要 session 的多轮会话
需要工具调用和 MCP 集成
9.3 核心概念理解
| 概念 | 作用 |
|---|---|
| Agent | 配置了 instructions、tools、guardrails、handoffs 的 LLM 单元 |
| Tools | 函数、MCP、托管工具等可执行能力 |
| Handoffs | 把任务交给其他专业 Agent |
| Guardrails | 输入输出校验,防止越界和错误 |
| Sessions | 自动管理跨运行对话历史 |
| Tracing | 追踪 Agent 运行过程,便于调试和优化 |
| Human-in-the-loop | 在 Agent 运行过程中引入人工确认 |
| Sandbox Agents | 让 Agent 在隔离工作区处理长任务、文件、命令等 |
9.4 产品经理视角:OpenAI Agents SDK 的优势
如果你的技术团队已经在使用 OpenAI API,并希望快速构建 Agent,OpenAI Agents SDK 的上手成本较低,框架概念也相对清晰。
它尤其适合:
客服 Agent
销售助理 Agent
研究 Agent
文件处理 Agent
多角色转接 Agent
语音/实时 Agent
例如客服场景:
入口 Agent:判断用户问题
订单 Agent:处理订单问题
售后 Agent:处理退款退货
技术支持 Agent:处理故障排查
人工客服:处理高风险或复杂问题
Handoff 机制天然适合这类“路由 + 专家 Agent”架构。
10 LlamaIndex:知识增强与文档 Agent 的强项
10.1 它是什么?
LlamaIndex 早期以 RAG 和数据连接能力出名,现在也在强化 Agent Workflows。官方文档中,Agent Workflows 被描述为可以创建和编排一个或多个带工具的 Agent 来完成特定任务的系统,并建立在基础 Workflow 系统之上。
LlamaIndex Workflows 官方页面还强调多步骤编排、异步、事件驱动、最大控制等特性。
10.2 它最适合什么?
LlamaIndex 特别适合文档和知识类场景:
企业知识库问答
合同审查
财报分析
技术文档搜索
法规政策问答
论文阅读助手
复杂 PDF / 表格 / 图表解析
文档工作流自动化
10.3 LlamaIndex 与 LangChain 的区别
| 对比项 | LlamaIndex | LangChain / LangGraph |
|---|---|---|
| 强项 | 数据连接、文档解析、索引、RAG | 通用 Agent、工具、工作流编排 |
| 场景 | 知识增强、文档 Agent | 通用 Agent、复杂业务系统 |
| 数据能力 | 强 | 也有,但不是唯一核心 |
| 编排能力 | Workflows 增强中 | LangGraph 更底层可控 |
| 适合人群 | 做知识库、文档问答、企业搜索 | 做通用 Agent 和流程编排 |
10.4 选型建议
如果你的业务核心是:
大量文档
复杂表格
非结构化数据
PDF / PPT / 网页 / 知识库
需要高质量检索
优先考虑 LlamaIndex。
如果你的业务核心是:
多系统 API
复杂审批流
多 Agent 协作
业务流程自动化
优先考虑 LangGraph、CrewAI、Microsoft Agent Framework、OpenAI Agents SDK。
11 Semantic Kernel:Microsoft 生态下的 AI 编排 SDK
11.1 它是什么?
Semantic Kernel 是 Microsoft 的开源 SDK,面向 C#、Python、Java 等语言,将 LLM 与传统编程语言、插件、Memory、流程等结合。Microsoft Learn 文档中,Semantic Kernel 的核心概念包括 Kernel、Plugins、Memory,同时也提供 Process Framework、Agent Framework 以及 Observability、Security、Filters 等企业组件。
11.2 它适合什么?
Semantic Kernel 更适合企业工程团队,尤其是:
.NET / C# 技术栈
Microsoft / Azure 生态
企业级权限、安全、观测需求
已有传统系统,希望把 AI 能力作为插件接入
11.3 Semantic Kernel 的产品价值
它不像 CrewAI 那样天然强调“团队角色协作”,也不像 MetaGPT 那样强调“软件公司 SOP”,它更像是:
把 AI 能力嵌入企业软件工程体系的 SDK。
对于传统企业信息化团队,Semantic Kernel 的优势是工程化、可集成、企业友好。
12 Haystack:生产级 RAG 与搜索系统的代表
12.1 它是什么?
Haystack 是 deepset 推出的开源框架,长期专注于搜索、问答、RAG、Pipeline。其文档中也出现了 tool-using agents、provider-agnostic chat model support、retrievers、generators、summarizers、writers 等组件。
12.2 它适合什么?
Haystack 适合:
企业搜索
RAG 问答
知识库检索
文档处理 Pipeline
搜索增强生成
生产级检索系统
如果你的业务不是重点做多 Agent 协作,而是重点做“稳定、可控、高质量检索问答”,Haystack 是一个值得关注的框架。
12.3 Haystack 和 LlamaIndex 的差异
| 对比项 | Haystack | LlamaIndex |
|---|---|---|
| 背景 | 搜索 / QA / RAG Pipeline | 数据连接 / RAG / 文档 Agent |
| 风格 | Pipeline 工程化 | 数据索引和知识增强更丰富 |
| 适合 | 搜索系统、问答系统 | 文档智能、知识型 Agent |
| Agent 能力 | 有 tool-using agents | Agent Workflows 发展中 |
13 一张表看懂主流框架怎么选
| 框架 | 核心定位 | 优势 | 短板 | 最适合谁 |
|---|---|---|---|---|
| LangChain | 通用 LLM 应用开发 | 生态丰富、工具多、上手广 | 复杂项目需要较强工程治理 | 通用 AI 应用团队 |
| LangGraph | 状态图式 Agent 编排 | 可控、可恢复、适合复杂流程 | 学习曲线比简单 Chain 高 | 企业级 Agent / 工作流 |
| AutoGen | 多 Agent 对话协作 | 多 Agent 心智清晰、研究价值高 | 已进入维护模式,新项目需谨慎 | 学习、研究、存量项目 |
| Microsoft Agent Framework | 企业级 Agent + Workflow | 状态、类型、安全、遥测、Microsoft 生态 | 生态仍在演进 | Azure / .NET 企业 |
| CrewAI | 多角色 Agent 团队 | 角色和任务抽象直观,适合团队协作 | 极复杂底层控制不如 LangGraph | 内容、运营、业务自动化 |
| MetaGPT | SOP 化软件公司 | 软件工程流程很强 | 场景相对聚焦软件开发 | 需求到代码、自动开发 |
| OpenAI Agents SDK | 轻量多 Agent SDK | Handoff、Guardrails、Tracing、Session 清晰 | 深度定制需工程能力 | 使用 OpenAI API 的团队 |
| LlamaIndex | 知识增强 / 文档 Agent | RAG、文档、数据连接强 | 通用多 Agent 不是唯一核心 | 知识库、文档智能 |
| Semantic Kernel | 企业 AI 编排 SDK | Microsoft 生态、插件、企业集成 | 对非微软技术栈吸引力较弱 | .NET / Azure 企业 |
| Haystack | 搜索 / RAG Pipeline | 搜索和检索工程化强 | 多 Agent 协作不是主定位 | 企业搜索、RAG 系统 |
14 产品经理如何做 Agent 框架选型?
选型不要从“哪个框架最火”开始,而要从 5 个问题开始。
问题 1:你的任务是开放式还是流程式?
| 任务类型 | 推荐 |
|---|---|
| 开放式问答、工具调用 | LangChain、OpenAI Agents SDK |
| 强流程、可控步骤 | LangGraph、Microsoft Agent Framework、CrewAI Flows |
| 文档问答 | LlamaIndex、Haystack |
| 软件工程 SOP | MetaGPT |
| 多角色讨论 | CrewAI、AutoGen |
问题 2:你需要单 Agent 还是 Multi-Agent?
| 需求 | 推荐 |
|---|---|
| 单助手 + 工具调用 | LangChain、OpenAI Agents SDK |
| 多专家协作 | CrewAI、LangGraph、Microsoft Agent Framework |
| 多 Agent 对话实验 | AutoGen |
| 软件公司式协作 | MetaGPT |
问题 3:你的数据核心是结构化还是非结构化?
| 数据类型 | 推荐 |
|---|---|
| 文档、PDF、知识库 | LlamaIndex、Haystack |
| 数据库、API、业务系统 | LangGraph、OpenAI Agents SDK、Microsoft Agent Framework |
| 代码仓库、项目文档 | MetaGPT、OpenAI Agents SDK、LangGraph |
问题 4:你是做 Demo 还是生产系统?
| 阶段 | 推荐 |
|---|---|
| 快速 Demo | CrewAI、LangChain、OpenAI Agents SDK、Dify |
| 工程化落地 | LangGraph、Microsoft Agent Framework、Semantic Kernel |
| 知识型产品 | LlamaIndex、Haystack |
| 软件开发自动化 | MetaGPT |
问题 5:你的团队技术栈是什么?
| 技术栈 | 推荐 |
|---|---|
| Python 通用 | LangChain、LangGraph、CrewAI、LlamaIndex、OpenAI Agents SDK |
| TypeScript / 前端全栈 | LangChain JS、OpenAI Agents SDK JS、LlamaIndex TS |
| .NET / Azure | Microsoft Agent Framework、Semantic Kernel |
| 低代码产品团队 | Dify、Coze、Flowise、CrewAI AMP |
15 一个企业级 Agent 项目,该怎么从 0 到 1 落地?
下面用一个真实的案例:
案例:AI 供应链经营分析 Agent
15.1 业务目标
帮助企业运营和供应链团队完成:
库存风险诊断
补货建议
调价建议
异常预警
经营分析报告
用户提问:
帮我分析本月哪些商品存在库存风险,哪些需要补货,哪些适合降价清仓,并生成一份经营分析报告。
15.2 最小架构设计
用户
↓
入口 Agent:理解问题、拆解任务
↓
库存 Agent:分析库存天数、缺货、滞销
销售 Agent:分析销量、转化、趋势
定价 Agent:分析成本、价格、毛利、竞品
采购 Agent:计算补货数量和时点
风险 Agent:判断是否需要审批
报告 Agent:生成经营报告
↓
人工确认 / 审批流
↓
执行动作 / 输出报告
15.3 不同框架的实现思路
| 框架 | 实现方式 |
|---|---|
| LangGraph | 把每个 Agent 设计成图节点,状态中保存商品、库存、价格、风险等信息 |
| CrewAI | 把库存、定价、采购、报告设计成不同角色 Agent,通过 Crew 顺序或层级执行 |
| OpenAI Agents SDK | 用入口 Agent 做 handoff,把不同问题转交给专业 Agent |
| Microsoft Agent Framework | 用 Agent + Workflow 控制业务流程和审批节点 |
| LlamaIndex | 如果核心是文档规则和制度问答,可作为 RAG 层提供知识增强 |
| Haystack | 如果核心是企业搜索和知识库检索,可作为 RAG Pipeline |
| MetaGPT | 如果要生成系统设计、PRD、代码原型,可用于软件工程自动化部分 |
15.4 产品 PRD 应该怎么写?
Agent 产品 PRD 必须比普通 PRD 多写 6 块内容:
1. Agent 角色定义
2. 工具/API 调用清单
3. Prompt / Instruction 规则
4. 中间结果数据结构
5. 风控与人工审批机制
6. 评估指标与观测方案
示例:库存 Agent 设计表
| 字段 | 内容 |
|---|---|
| Agent 名称 | 库存分析 Agent |
| 目标 | 判断商品是否缺货、滞销或库存异常 |
| 输入 | SKU、当前库存、日均销量、在途库存、安全库存、供应商交期 |
| 工具 | WMS、ERP、订单系统 |
| 输出 | 库存天数、风险类型、风险等级、处理建议 |
| 规则 | 库存天数 < 供应商交期则标记高缺货风险 |
| 边界 | 不直接创建采购单,只输出建议 |
| 指标 | 风险识别准确率、预警提前量、业务采纳率 |
15.5 技术实现建议
最小可行版本不要一开始就做大而全。
建议分三期:
第一期:MVP
自然语言问答
库存数据查询
库存风险判断
报告生成
技术选型可以是:
LangChain / OpenAI Agents SDK + 简单工具函数 + 数据库查询
第二期:Multi-Agent
引入库存 Agent、销售 Agent、定价 Agent、报告 Agent
加入 Agent 调度
加入结构化输出
加入日志和 tracing
技术选型可以是:
LangGraph / CrewAI / OpenAI Agents SDK
第三期:生产化
权限控制
审批流
异常兜底
长期记忆
指标看板
灰度发布
成本监控
人工反馈闭环
技术选型可以是:
LangGraph + LangSmith
Microsoft Agent Framework
OpenAI Agents SDK + tracing
企业自研编排层
16 框架选型的 8 个避坑点
坑 1:把 Agent 当成 Chatbot
很多 Agent 项目失败,是因为它只是换了个名字的聊天机器人。
真正的 Agent 必须能:
理解任务
调用工具
执行步骤
处理异常
输出结构化结果
接受评估
坑 2:为了 Multi-Agent 而 Multi-Agent
不是每个任务都需要多个 Agent。
简单问答:RAG 即可
固定流程:Workflow 即可
复杂决策:Multi-Agent 才有价值
坑 3:没有结构化输出
如果 Agent 输出都是自然语言,后续很难进入系统。
建议中间结果尽量使用:
{
"risk_level": "high",
"reason": "库存可售天数低于供应商交期",
"suggestion": "建议补货 500 件",
"need_human_review": true
}
坑 4:没有工具权限边界
Agent 调用工具一定要控制权限:
能查什么?
能改什么?
能不能下单?
能不能发邮件?
能不能执行代码?
是否需要审批?
坑 5:没有人工审批
高风险动作绝不能直接交给 AI 自动执行。
例如:
调价
采购
退款
合同修改
财务付款
法律意见
医疗建议
必须 Human-in-the-loop。
坑 6:没有观测和评估
Agent 出错通常不是“模型坏了”,而是:
Prompt 不清楚
工具调用错了
检索内容错了
中间状态丢了
权限不够
流程设计不合理
所以 tracing 很重要。
坑 7:一开始就追求全自动
企业更容易接受的是:
AI 先做建议
人来确认
系统留痕
效果复盘
逐步自动化
坑 8:只讲技术,不讲 ROI
老板和客户最终关心:
省了多少人力?
减少多少错误?
缩短多少时间?
增加多少收入?
降低多少风险?
17 Agent 框架学习路线:从入门到精通
阶段 1:基础入门
掌握:
LLM
Prompt
RAG
Function Calling
Tool Calling
JSON Schema
Embedding
Vector Database
推荐练习:
做一个知识库问答 Bot
做一个能查天气的工具调用 Agent
做一个能查询数据库的问答 Agent
阶段 2:单 Agent 实战
掌握:
工具调用
记忆管理
结构化输出
异常兜底
Prompt 模板
推荐框架:
LangChain
OpenAI Agents SDK
LlamaIndex
阶段 3:Workflow 编排
掌握:
顺序执行
条件分支
循环
状态管理
人工审批
任务恢复
推荐框架:
LangGraph
CrewAI Flows
Microsoft Agent Framework
LlamaIndex Workflows
阶段 4:Multi-Agent 协作
掌握:
Agent 角色设计
主从式架构
Pipeline 架构
Debate 架构
Handoff
多 Agent 评估
推荐框架:
CrewAI
LangGraph
OpenAI Agents SDK
Microsoft Agent Framework
MetaGPT
阶段 5:生产化落地
掌握:
权限
审计
日志
Tracing
评估集
成本监控
安全护栏
灰度发布
SLA
Human-in-the-loop
推荐组合:
LangGraph + LangSmith
OpenAI Agents SDK + Tracing
Microsoft Agent Framework + Azure
LlamaIndex / Haystack + 自研业务系统
18 不同角色应该怎么学?
AI 产品经理
重点学:
Agent 产品架构
业务流程拆解
工具/API 清单
Agent 角色设计
PRD 写法
评估指标
商业化场景
不用一开始深挖底层代码,但必须能和研发讨论:
这个场景是否需要 Agent?
需要几个 Agent?
每个 Agent 的输入输出是什么?
是否需要人工审批?
如何评估效果?
算法 / 后端工程师
重点学:
工具调用
状态管理
异步任务
函数 schema
Graph 编排
错误处理
Tracing
部署
建议优先实操:
LangGraph
OpenAI Agents SDK
Microsoft Agent Framework
CrewAI
企业技术负责人
重点看:
框架稳定性
生态成熟度
权限与安全
观测能力
长期维护
云厂商绑定
团队学习成本
迁移风险
不要只看 Demo 效果。
19 最推荐的 5 种技术组合
组合 1:LangGraph + LangSmith + 自研业务系统
适合:
复杂企业流程
需要强状态控制
需要 tracing 和评估
有工程团队
组合 2:CrewAI + 业务工具 + 审批系统
适合:
多角色协作
内容生产
市场调研
运营分析
销售材料生成
组合 3:OpenAI Agents SDK + Handoff + Guardrails
适合:
客服
销售助理
多角色转接
实时交互
快速产品化
组合 4:LlamaIndex / Haystack + LangGraph
适合:
知识库 + 复杂流程
企业文档智能
法规 / 合同 / 技术文档分析
组合 5:Microsoft Agent Framework + Azure
适合:
大型企业
Microsoft 技术栈
Azure AI Foundry
.NET / C#
合规、安全、观测要求高
20 最后一张选型速查表
| 你要做什么 | 首选框架 |
|---|---|
| 快速做一个工具调用 Agent | OpenAI Agents SDK / LangChain |
| 做复杂状态图和长任务 | LangGraph |
| 做多角色团队协作 | CrewAI |
| 做软件公司式自动开发 | MetaGPT |
| 做研究型多 Agent 对话 | AutoGen |
| 做 Microsoft 企业级 Agent | Microsoft Agent Framework / Semantic Kernel |
| 做文档智能和知识库 | LlamaIndex |
| 做搜索/RAG Pipeline | Haystack |
| 做低代码业务验证 | Dify / Coze / Flowise |
| 做生产级企业 Agent | LangGraph / Microsoft Agent Framework / OpenAI Agents SDK |
21 总结:Agent 框架的终局不是“会聊天”,而是“能执行复杂业务”
Agent 框架的发展,正在从三个方向收敛:
第一,从 Prompt 工程走向系统工程
早期大家关注:
怎么写 Prompt?
怎么让回答更好?
现在真正的问题是:
怎么拆任务?
怎么接工具?
怎么控流程?
怎么做权限?
怎么评估效果?
怎么上线运营?
第二,从单 Agent 走向 Agent + Workflow
未来企业级 Agent 不会是完全自由的黑盒,而会是:
固定流程用 Workflow 控制
开放判断用 Agent 处理
高风险节点用人工审批
关键结果用规则和评估校验
第三,从 Demo 走向商业闭环
真正有价值的 Agent,不是能完成一次炫酷演示,而是能够持续创造业务价值:
提效
降本
增收
控风险
提升决策质量
沉淀组织知识
结语:抓住大模型时代的职业机遇
AI大模型的发展不是“替代人类”,而是“重塑职业价值”——它淘汰的是重复性、低附加值的工作,却催生了更多需要“技术+业务”交叉能力的高端岗位。对于求职者而言,想要在这波浪潮中立足,不仅需要掌握Python、TensorFlow/PyTorch等技术工具,更要深入理解目标行业的业务逻辑(如金融的风险控制、医疗的临床需求),成为“懂技术、懂业务”的复合型人才。
无论是技术研发岗(如算法工程师、研究员),还是业务落地岗(如产品经理、应用工程师),大模型都为不同背景的职场人提供了广阔的发展空间。只要保持学习热情,紧跟技术趋势,就能在AI大模型时代找到属于自己的职业新蓝海。
最近两年大模型发展很迅速,在理论研究方面得到很大的拓展,基础模型的能力也取得重大突破,大模型现在正在积极探索落地的方向,如果与各行各业结合起来是未来落地的一个重大研究方向
大模型应用工程师年包50w+属于中等水平,如果想要入门大模型,那现在正是最佳时机
2025年Agent的元年,2026年将会百花齐放,相应的应用将覆盖文本,视频,语音,图像等全模态
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
扫描下方csdn官方合作二维码获取哦!

给大家推荐一个大模型应用学习路线
这个学习路线的具体内容如下:
第一节:提示词工程
提示词是用于与AI模型沟通交流的,这一部分主要介绍基本概念和相应的实践,高级的提示词工程来实现模型最佳效果,以现实案例为基础进行案例讲解,在企业中除了微调之外,最喜欢的就是用提示词工程技术来实现模型性能的提升

第二节:检索增强生成(RAG)
可能大家经常会看见RAG这个名词,这个就是将向量数据库与大模型结合的技术,通过外部知识来增强改进提升大模型的回答结果,这一部分主要介绍RAG架构与组件,从零开始搭建RAG系统,生成部署RAG,性能优化等

第三节:微调
预训练之后的模型想要在具体任务上进行适配,那就需要通过微调来提升模型的性能,能满足定制化的需求,这一部分主要介绍微调的基础,模型适配技术,最佳实践的案例,以及资源优化等内容

第四节:模型部署
想要把预训练或者微调之后的模型应用于生产实践,那就需要部署,模型部署分为云端部署和本地部署,部署的过程中需要考虑硬件支持,服务器性能,以及对性能进行优化,使用过程中的监控维护等

第五节:人工智能系统和项目
这一部分主要介绍自主人工智能系统,包括代理框架,决策框架,多智能体系统,以及实际应用,然后通过实践项目应用前面学习到的知识,包括端到端的实现,行业相关情景等

学完上面的大模型应用技术,就可以去做一些开源的项目,大模型领域现在非常注重项目的落地,后续可以学习一些Agent框架等内容
上面的资料做了一些整理,有需要的同学可以下方添加二维码获取(仅供学习使用)

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)