文章核心内容围绕 Agent 框架的选型展开,强调 Agent 框架并非越火越好,而是需根据场景选择。文章首先介绍了常见的 AI 应用路径和挑战,进而阐述了 Agent 框架的核心价值,即通过可编排、可调用工具、可多人协作、可观测、可上线的方式将大模型转化为智能应用系统。接着,文章详细解析了 8 个 Agent 应用核心组件及其作用,并指出成熟的 Agent 框架至少要解决任务拆解、工具调用、多 Agent 协作和结果评估等四类问题。文章还介绍了主流的 Agent 框架,包括 LangChain/LangGraph、AutoGen/Microsoft Agent Framework、CrewAI、MetaGPT、OpenAI Agents SDK、LlamaIndex 和 Semantic Kernel 等,并分析了它们各自的定位、优势和适用场景。最后,文章提出了 Agent 框架选型的 5 个关键问题和 8 个避坑点,为产品经理和技术负责人提供了实用的选型建议。


01 先给结论:Agent 框架不是越火越好,而是要按场景选

过去做 AI 应用,常见路径是:

用户输入 → Prompt → LLM → 返回答案

再进一步,是 RAG:

用户输入 → 检索知识库 → LLM 生成 → 返回答案

但到了企业级 Agent 场景,仅靠一次 LLM 调用或一个 RAG 链路就不够了。真实业务往往需要:

理解任务 → 拆解步骤 → 调用工具/API → 查询数据库 → 多轮推理 → 人工审批 → 执行动作 → 记录日志 → 评估效果

这时候,Agent 框架的价值就出现了。

一句话概括:

Agent 框架不是帮你“接一个大模型”,而是帮你把大模型变成可编排、可调用工具、可多人协作、可观测、可上线的智能应用系统。

如果只做知识库问答,用 LlamaIndex、LangChain、Dify 这类工具就够了;如果要做复杂流程、长任务、多 Agent 协作,就要关注 LangGraph、CrewAI、AutoGen/MicrosoftAgent Framework、OpenAI Agents SDK、MetaGPT 等框架。


02 Agent 框架到底解决什么问题?

一个 Agent 应用通常由 8 个核心组件组成:

Agent = LLM + Prompt + Memory + Tools + Planning + Workflow + Guardrails + Observability

拆开看:

组件 作用 没有它会怎样
LLM 负责理解、推理和生成 只能做传统规则系统
Prompt / Instruction 定义角色、任务、边界和输出格式 输出不稳定、不可控
Memory 保存上下文、历史偏好、长期状态 每次对话都像第一次见面
Tools 调用函数、API、数据库、搜索、代码执行等 Agent 只能“说”,不能“做”
Planning 拆解任务、决定下一步动作 复杂任务容易丢步骤
Workflow 控制执行顺序、分支、循环、暂停和恢复 难以承载企业流程
Guardrails 输入输出校验、安全约束、人工审批 容易幻觉、越权、误操作
Observability tracing、日志、评估、成本监控 出问题不知道错在哪里

所以,一个成熟 Agent 框架至少要帮你解决四类问题:

1. 任务如何被拆解?

用户说“帮我分析库存风险并给出补货建议”,背后可能需要查询库存、销量、采购周期、安全库存、供应商交期、历史促销等多个系统。

2. 工具如何被调用?

Agent 不能只生成文字,而要能调用:

get_inventory()

get_sales_trend()

search_policy_docs()

create_purchase_order()

send_approval_request()

3. 多个 Agent 如何协作?

例如:

主 Agent:理解目标与任务拆解

库存 Agent:判断缺货和滞销

定价 Agent:给出调价建议

采购 Agent:给出补货建议

风险 Agent:检查是否需要人工审批

报告 Agent:生成经营报告

4. 结果如何被评估和追踪?

企业不会因为“AI 很聪明”就付费,最终还是看:

是否提升效率?

是否降低成本?

是否减少风险?

是否增加收入?

是否可解释、可审计、可复盘?


03 Agent 框架全景图:主流框架怎么分层?

目前 Agent 框架大致可以分成 6 类。

类型 代表框架 核心定位 最适合场景
通用 Agent 编排框架 LangChain / LangGraph 模型、工具、状态图、流程编排 通用 Agent、复杂工作流、企业级应用
多 Agent 协作框架 CrewAI、AutoGen、MetaGPT 多角色协作、Agent 团队 研究、自动化任务、团队型 Agent
企业级 Agent SDK OpenAI Agents SDK、Microsoft Agent Framework、Semantic Kernel 工具、会话、护栏、观测、企业集成 生产级 Agent、企业应用
知识增强与文档 Agent LlamaIndex、Haystack RAG、文档处理、检索增强 知识库、文档问答、企业搜索
软件工程 Agent MetaGPT、SWE-agent、GPT Pilot 等 需求到代码、软件公司式协作 代码生成、软件项目自动化
低代码 / 产品化平台 Dify、Coze、Flowise、Langflow 等 可视化搭建、工作流、插件 快速原型、业务验证、轻量交付

这篇文章重点解析开发者和产品经理最常遇到的几个框架:

LangChain / LangGraph

AutoGen / Microsoft Agent Framework

CrewAI

MetaGPT

OpenAI Agents SDK

LlamaIndex

Semantic Kernel

Haystack


04 LangChain / LangGraph:最通用的 Agent 基础设施

4.1 它是什么?

LangChain 最早是 LLM 应用开发框架,覆盖模型调用、Prompt、Chains、Tools、Retrievers、Agents 等能力。现在的 LangChain Agent 已经越来越多地和 LangGraph 结合:LangChain 文档中提到 create_agent 会构建基于 LangGraph 的图式 Agent Runtime,Agent 在图中的节点和边之间执行模型调用、工具调用和中间件处理。

LangGraph 则更偏底层编排。官方文档将它定位为用于构建、管理和部署长时间运行、具备状态的 Agent 的低层编排框架,强调 durable execution、streaming、human-in-the-loop、memory 等能力。

4.2 适合什么场景?

LangChain / LangGraph 适合:

1. 你要做通用 Agent;

2. 你希望灵活接入不同模型、工具、检索器;

3. 你需要复杂流程、分支、循环、状态管理;

4. 你需要做生产级 Agent 编排;

5. 你有工程团队,愿意写代码控制细节。

例如:

智能客服 Agent

企业知识库问答 Agent

数据分析 Agent

销售助理 Agent

供应链经营分析 Agent

合同审查 Agent

智能报告生成 Agent

4.3 LangChain 与 LangGraph 的关系

可以这样理解:

LangChain:提供构建 Agent 的积木

LangGraph:提供控制 Agent 运行路径的图式编排引擎

LangSmith:提供 tracing、调试、评估和观测能力

如果你只是做简单工具调用,LangChain Agent 就够;如果你要做复杂流程、可恢复任务、多节点状态机,就应该上 LangGraph。

4.4 最小代码示例:LangChain Agent

from langchain.agents import create_agent

def get_weather(city: str) -> str:

    return f"{city} 今天晴,适合出行。"

agent = create_agent(

    model="openai:gpt-4o-mini",

    tools=[get_weather],

    system_prompt="你是一个会调用工具的旅行助理。"

)

result = agent.invoke({

    "messages": [

        {"role": "user", "content": "北京今天天气怎么样?"}

    ]

})

print(result)

4.5 LangGraph 的核心思想

LangGraph 的思路不是“线性链条”,而是“状态图”。

START

  ↓

模型节点

  ↓

是否需要工具?

  ├── 是 → 工具节点 → 模型节点

  └── 否 → END

这种结构可以天然支持:

分支

循环

中断

人工确认

状态持久化

任务恢复

多 Agent 编排

4.6 产品经理视角:什么时候选 LangGraph?

如果你要做的是企业级 Agent,尤其是以下情况,LangGraph 很值得优先考虑:

场景 为什么适合 LangGraph
多步骤任务 图结构可以控制每一步执行
长任务 支持状态持久化和恢复
人工审批 支持 human-in-the-loop
多 Agent 协作 可以把不同 Agent 设计为不同节点
复杂业务流程 可以做分支、循环和条件判断
需要可观测 可配合 LangSmith 做 tracing 和评估

一句话:

LangChain / LangGraph 更像 Agent 应用的“工程底座”,适合做复杂、可控、长期演进的企业 Agent。


05 AutoGen:多 Agent 对话协作的经典框架,但新项目要关注 Microsoft Agent Framework

5.1 它是什么?

AutoGen 是 Microsoft Research 推出的开源 Agent 框架,核心思想是让多个可对话 Agent 通过协作完成任务。官方文档中,AutoGen 包含 AgentChat、Core、Extensions、Studio 等部分,其中 AgentChat 用于构建单 Agent 和多 Agent 对话应用,Core 则是事件驱动的可扩展多 Agent 系统框架。

AutoGen 曾经非常适合做:

多 Agent 讨论

代码生成与执行

研究型 Agent

用户代理 + 助手代理协作

自动化任务探索

5.2 但要注意:AutoGen 当前状态发生了变化

AutoGen GitHub 仓库已经明确提示:AutoGen 现在处于 maintenance mode,不再接收新特性或增强,社区维护;新用户建议使用 Microsoft Agent Framework,既有用户建议迁移。官方仓库还说明 Microsoft Agent Framework 是 AutoGen 的 enterprise-ready successor。

这意味着:

如果是学习多 Agent 思想,可以继续研究 AutoGen;

如果是新项目生产落地,更建议评估 Microsoft Agent Framework;

如果公司已有 AutoGen 存量项目,应规划迁移路线。

5.3 AutoGen 的典型模式

最经典的是:

UserProxyAgent:代表用户,可执行代码、接收人工输入

AssistantAgent:负责思考、写代码、调用工具

GroupChat:多个 Agent 组成群聊,协作完成任务

一个典型任务:

用户:帮我分析这份 CSV 数据,画出销售趋势图。

AssistantAgent:写 Python 代码。

UserProxyAgent:执行代码并返回结果。

AssistantAgent:分析结果并生成结论。

5.4 产品经理视角:AutoGen 的价值

AutoGen 的价值在于,它让人非常直观地理解多 Agent 协作:

Agent 不是一个助手,而是一组角色;

协作不是函数调用,而是多轮对话和任务推进;

人可以参与其中,成为 Human-in-the-loop 的一部分。

5.5 AutoGen 适合什么?

适合 不太适合
学习多 Agent 协作思想 从 0 开始做长期企业项目
快速验证研究型 Agent 对稳定 API 和长期支持要求高的系统
数据分析、代码执行 Demo 强合规、强审计、强稳定生产系统
多 Agent 群聊实验 复杂企业系统集成

06 Microsoft Agent Framework:AutoGen + Semantic Kernel 的企业级演进方向

6.1 它是什么?

Microsoft Agent Framework 是 Microsoft 新一代 Agent 框架。官方文档明确说明,它结合了 AutoGen 的简单 Agent 抽象和 Semantic Kernel 的企业特性,包括 session-based state management、type safety、middleware、telemetry,并加入 graph-based workflows 用于显式控制多 Agent 编排。

它的定位很清楚:

面向企业级 Agent 应用;

兼顾单 Agent 和多 Agent;

强调工作流、状态管理、遥测、类型安全、生产级能力。

6.2 什么时候考虑它?

如果你的企业技术栈高度依赖:

Azure

Microsoft 生态

.NET / C#

企业级权限与合规

AI Foundry

Semantic Kernel 存量项目

AutoGen 存量项目

那么 Microsoft Agent Framework 很值得关注。

6.3 Agent vs Workflow:官方给出的关键判断

Microsoft 文档中有一个很重要的判断:当任务开放、对话式、需要自主工具使用与规划时,用 Agent;当流程步骤明确、需要显式控制执行顺序、多个 Agent 或函数必须协调时,用 Workflow。

这句话对产品经理非常重要。

翻译成产品语言:

能写死的流程,就不要交给 Agent 自由发挥;

需要开放判断的部分,再交给 Agent;

企业级产品应该是 Agent + Workflow 的混合架构。


07 CrewAI:最像“AI 团队管理”的多 Agent 框架

7.1 它是什么?

CrewAI 是一个面向多 Agent 协作和复杂工作流的开源框架。官方文档强调它可以构建 collaborative AI agents、crews 和 flows,并内置 guardrails、memory、knowledge、observability 等能力。

CrewAI 官方介绍中还将核心结构拆成两部分:

CrewAI Flows:结构化、事件驱动的工作流骨架,负责状态和执行控制;

CrewAI Crews:Flow 中的工作单元,由多个自治 Agent 协作完成任务。

官方文档称 CrewAI 将 Crews 的协作智能与 Flows 的精确控制结合,用于构建生产级多 Agent 系统。

7.2 它的核心概念

概念 解释
Agent 一个具备角色、目标、背景、工具的专业成员
Task 分配给 Agent 的具体任务
Crew 多个 Agent 组成的团队
Process Agent 执行任务的协作方式,如顺序、层级、混合
Flow 更可控的事件驱动工作流
Tools Agent 可调用的外部能力
Memory / Knowledge 上下文和知识增强
Guardrails 结果校验和安全约束

7.3 CrewAI 示例:研究员 + 作者团队

from crewai import Agent, Task, Crew, Process

researcher = Agent(

    role="行业研究员",

    goal="收集并分析 Agent 框架的最新资料",

    backstory="你擅长技术调研和资料整理。"

)

writer = Agent(

    role="技术作者",

    goal="把研究资料整理成微信公众号文章",

    backstory="你擅长写结构清晰、有传播力的技术文章。"

)

research_task = Task(

    description="调研 LangChain、CrewAI、AutoGen、MetaGPT 的核心差异。",

    agent=researcher,

    expected_output="一份结构化调研报告。"

)

write_task = Task(

    description="基于调研报告,写一篇技术公众号文章。",

    agent=writer,

    expected_output="一篇完整文章。"

)

crew = Crew(

    agents=[researcher, writer],

    tasks=[research_task, write_task],

    process=Process.sequential

)

result = crew.kickoff()

print(result)

7.4 CrewAI 适合什么?

CrewAI 很适合做“角色型任务协作”:

内容生产团队

市场调研团队

销售资料生成团队

客服质检团队

投研分析团队

候选人筛选团队

竞品分析团队

经营报告团队

7.5 产品经理视角:CrewAI 的最大优势

CrewAI 的优势是它的心智模型非常接近真实团队:

角色

目标

背景

任务

流程

协作

输出

这对非底层工程背景的产品经理特别友好,因为你可以用“组织分工”的方式设计 Agent。

例如一个“AI 招聘筛选团队”:

JD 分析 Agent:拆解岗位能力要求

简历分析 Agent:提取候选人经历

匹配评分 Agent:给出匹配度

面试题生成 Agent:生成面试问题

报告 Agent:输出候选人评估报告

这就是 CrewAI 最自然的使用方式。

7.6 CrewAI 的边界

CrewAI 适合多角色协作,但如果你要做非常底层、复杂、强状态控制的图式工作流,LangGraph 可能更灵活。如果你要深度进入 Microsoft / Azure 生态,Microsoft Agent Framework 可能更合适。


08 MetaGPT:把软件公司 SOP 编进多 Agent 的代表框架

8.1 它是什么?

MetaGPT 是一个面向软件工程任务的多 Agent 框架,它的核心思想是:

Code = SOP(Team)

也就是把标准作业流程 SOP 编进由 LLM 组成的团队,让不同角色像软件公司一样协作。MetaGPT 的公开介绍中提到,它可以接受一行需求作为输入,然后输出用户故事、竞品分析、需求、数据结构、API、文档等;内部包含产品经理、架构师、项目经理、工程师等角色,并以软件公司的流程协作完成任务。

8.2 MetaGPT 的典型流程

用户输入:

做一个贪吃蛇小游戏

MetaGPT 内部可能会拆成:

产品经理:写 PRD / 用户故事

架构师:设计系统架构

项目经理:拆任务

工程师:写代码

测试角色:检查功能

文档角色:输出说明

8.3 MetaGPT 和 CrewAI 的区别

对比项 MetaGPT CrewAI
核心思想 SOP 化的软件公司 角色团队协作
典型场景 软件开发、需求到代码 通用多角色任务
角色设计 偏固定,如 PM、架构师、工程师 高度自定义
流程控制 强 SOP 可顺序、层级、Flow
产品心智 模拟公司 组建团队
适合对象 软件工程自动化 内容、运营、业务自动化、研究任务

8.4 MetaGPT 适合什么?

从需求生成 PRD

从 PRD 生成技术设计

从技术设计生成代码

自动生成 API 文档

生成软件项目骨架

模拟软件开发流程

8.5 产品经理视角:MetaGPT 的启发

MetaGPT 最大的启发不是“它能不能完全替代程序员”,而是:

复杂任务要流程化,流程要角色化,角色要产出标准化。

这句话对企业 Agent 产品设计非常重要。

例如供应链 Agent 也可以借鉴 SOP 思路:

用户提问

↓

需求识别

↓

数据查询

↓

库存分析

↓

定价建议

↓

风险审核

↓

报告输出

↓

人工审批

也就是说,MetaGPT 的真正价值,是让我们看到:

Multi-Agent 不应该自由聊天,而应该嵌入业务 SOP。


09 OpenAI Agents SDK:轻量、直接、工程友好的多 Agent SDK

9.1 它是什么?

OpenAI Agents SDK 是 OpenAI 官方开源的轻量 Agent 框架。GitHub README 中将它描述为用于构建 multi-agent workflows 的轻量但强大的框架,并且是 provider-agnostic,支持 OpenAI Responses、Chat Completions 以及其他 LLM。其核心概念包括 Agents、Sandbox Agents、Agents as tools / Handoffs、Tools、Guardrails、Human-in-the-loop、Sessions、Tracing 等。

9.2 它适合什么?

OpenAI Agents SDK 适合:

快速构建生产级 Agent

需要 handoff 的多 Agent

需要 guardrails 的安全校验

需要 tracing 的运行观测

需要 session 的多轮会话

需要工具调用和 MCP 集成

9.3 核心概念理解

概念 作用
Agent 配置了 instructions、tools、guardrails、handoffs 的 LLM 单元
Tools 函数、MCP、托管工具等可执行能力
Handoffs 把任务交给其他专业 Agent
Guardrails 输入输出校验,防止越界和错误
Sessions 自动管理跨运行对话历史
Tracing 追踪 Agent 运行过程,便于调试和优化
Human-in-the-loop 在 Agent 运行过程中引入人工确认
Sandbox Agents 让 Agent 在隔离工作区处理长任务、文件、命令等

9.4 产品经理视角:OpenAI Agents SDK 的优势

如果你的技术团队已经在使用 OpenAI API,并希望快速构建 Agent,OpenAI Agents SDK 的上手成本较低,框架概念也相对清晰。

它尤其适合:

客服 Agent

销售助理 Agent

研究 Agent

文件处理 Agent

多角色转接 Agent

语音/实时 Agent

例如客服场景:

入口 Agent:判断用户问题

订单 Agent:处理订单问题

售后 Agent:处理退款退货

技术支持 Agent:处理故障排查

人工客服:处理高风险或复杂问题

Handoff 机制天然适合这类“路由 + 专家 Agent”架构。


10 LlamaIndex:知识增强与文档 Agent 的强项

10.1 它是什么?

LlamaIndex 早期以 RAG 和数据连接能力出名,现在也在强化 Agent Workflows。官方文档中,Agent Workflows 被描述为可以创建和编排一个或多个带工具的 Agent 来完成特定任务的系统,并建立在基础 Workflow 系统之上。

LlamaIndex Workflows 官方页面还强调多步骤编排、异步、事件驱动、最大控制等特性。

10.2 它最适合什么?

LlamaIndex 特别适合文档和知识类场景:

企业知识库问答

合同审查

财报分析

技术文档搜索

法规政策问答

论文阅读助手

复杂 PDF / 表格 / 图表解析

文档工作流自动化

10.3 LlamaIndex 与 LangChain 的区别

对比项 LlamaIndex LangChain / LangGraph
强项 数据连接、文档解析、索引、RAG 通用 Agent、工具、工作流编排
场景 知识增强、文档 Agent 通用 Agent、复杂业务系统
数据能力 也有,但不是唯一核心
编排能力 Workflows 增强中 LangGraph 更底层可控
适合人群 做知识库、文档问答、企业搜索 做通用 Agent 和流程编排

10.4 选型建议

如果你的业务核心是:

大量文档

复杂表格

非结构化数据

PDF / PPT / 网页 / 知识库

需要高质量检索

优先考虑 LlamaIndex。

如果你的业务核心是:

多系统 API

复杂审批流

多 Agent 协作

业务流程自动化

优先考虑 LangGraph、CrewAI、Microsoft Agent Framework、OpenAI Agents SDK。


11 Semantic Kernel:Microsoft 生态下的 AI 编排 SDK

11.1 它是什么?

Semantic Kernel 是 Microsoft 的开源 SDK,面向 C#、Python、Java 等语言,将 LLM 与传统编程语言、插件、Memory、流程等结合。Microsoft Learn 文档中,Semantic Kernel 的核心概念包括 Kernel、Plugins、Memory,同时也提供 Process Framework、Agent Framework 以及 Observability、Security、Filters 等企业组件。

11.2 它适合什么?

Semantic Kernel 更适合企业工程团队,尤其是:

.NET / C# 技术栈

Microsoft / Azure 生态

企业级权限、安全、观测需求

已有传统系统,希望把 AI 能力作为插件接入

11.3 Semantic Kernel 的产品价值

它不像 CrewAI 那样天然强调“团队角色协作”,也不像 MetaGPT 那样强调“软件公司 SOP”,它更像是:

把 AI 能力嵌入企业软件工程体系的 SDK。

对于传统企业信息化团队,Semantic Kernel 的优势是工程化、可集成、企业友好。


12 Haystack:生产级 RAG 与搜索系统的代表

12.1 它是什么?

Haystack 是 deepset 推出的开源框架,长期专注于搜索、问答、RAG、Pipeline。其文档中也出现了 tool-using agents、provider-agnostic chat model support、retrievers、generators、summarizers、writers 等组件。

12.2 它适合什么?

Haystack 适合:

企业搜索

RAG 问答

知识库检索

文档处理 Pipeline

搜索增强生成

生产级检索系统

如果你的业务不是重点做多 Agent 协作,而是重点做“稳定、可控、高质量检索问答”,Haystack 是一个值得关注的框架。

12.3 Haystack 和 LlamaIndex 的差异

对比项 Haystack LlamaIndex
背景 搜索 / QA / RAG Pipeline 数据连接 / RAG / 文档 Agent
风格 Pipeline 工程化 数据索引和知识增强更丰富
适合 搜索系统、问答系统 文档智能、知识型 Agent
Agent 能力 有 tool-using agents Agent Workflows 发展中

13 一张表看懂主流框架怎么选

框架 核心定位 优势 短板 最适合谁
LangChain 通用 LLM 应用开发 生态丰富、工具多、上手广 复杂项目需要较强工程治理 通用 AI 应用团队
LangGraph 状态图式 Agent 编排 可控、可恢复、适合复杂流程 学习曲线比简单 Chain 高 企业级 Agent / 工作流
AutoGen 多 Agent 对话协作 多 Agent 心智清晰、研究价值高 已进入维护模式,新项目需谨慎 学习、研究、存量项目
Microsoft Agent Framework 企业级 Agent + Workflow 状态、类型、安全、遥测、Microsoft 生态 生态仍在演进 Azure / .NET 企业
CrewAI 多角色 Agent 团队 角色和任务抽象直观,适合团队协作 极复杂底层控制不如 LangGraph 内容、运营、业务自动化
MetaGPT SOP 化软件公司 软件工程流程很强 场景相对聚焦软件开发 需求到代码、自动开发
OpenAI Agents SDK 轻量多 Agent SDK Handoff、Guardrails、Tracing、Session 清晰 深度定制需工程能力 使用 OpenAI API 的团队
LlamaIndex 知识增强 / 文档 Agent RAG、文档、数据连接强 通用多 Agent 不是唯一核心 知识库、文档智能
Semantic Kernel 企业 AI 编排 SDK Microsoft 生态、插件、企业集成 对非微软技术栈吸引力较弱 .NET / Azure 企业
Haystack 搜索 / RAG Pipeline 搜索和检索工程化强 多 Agent 协作不是主定位 企业搜索、RAG 系统

14 产品经理如何做 Agent 框架选型?

选型不要从“哪个框架最火”开始,而要从 5 个问题开始。

问题 1:你的任务是开放式还是流程式?

任务类型 推荐
开放式问答、工具调用 LangChain、OpenAI Agents SDK
强流程、可控步骤 LangGraph、Microsoft Agent Framework、CrewAI Flows
文档问答 LlamaIndex、Haystack
软件工程 SOP MetaGPT
多角色讨论 CrewAI、AutoGen

问题 2:你需要单 Agent 还是 Multi-Agent?

需求 推荐
单助手 + 工具调用 LangChain、OpenAI Agents SDK
多专家协作 CrewAI、LangGraph、Microsoft Agent Framework
多 Agent 对话实验 AutoGen
软件公司式协作 MetaGPT

问题 3:你的数据核心是结构化还是非结构化?

数据类型 推荐
文档、PDF、知识库 LlamaIndex、Haystack
数据库、API、业务系统 LangGraph、OpenAI Agents SDK、Microsoft Agent Framework
代码仓库、项目文档 MetaGPT、OpenAI Agents SDK、LangGraph

问题 4:你是做 Demo 还是生产系统?

阶段 推荐
快速 Demo CrewAI、LangChain、OpenAI Agents SDK、Dify
工程化落地 LangGraph、Microsoft Agent Framework、Semantic Kernel
知识型产品 LlamaIndex、Haystack
软件开发自动化 MetaGPT

问题 5:你的团队技术栈是什么?

技术栈 推荐
Python 通用 LangChain、LangGraph、CrewAI、LlamaIndex、OpenAI Agents SDK
TypeScript / 前端全栈 LangChain JS、OpenAI Agents SDK JS、LlamaIndex TS
.NET / Azure Microsoft Agent Framework、Semantic Kernel
低代码产品团队 Dify、Coze、Flowise、CrewAI AMP

15 一个企业级 Agent 项目,该怎么从 0 到 1 落地?

下面用一个真实的案例:

案例:AI 供应链经营分析 Agent

15.1 业务目标

帮助企业运营和供应链团队完成:

库存风险诊断

补货建议

调价建议

异常预警

经营分析报告

用户提问:

帮我分析本月哪些商品存在库存风险,哪些需要补货,哪些适合降价清仓,并生成一份经营分析报告。

15.2 最小架构设计

用户

↓

入口 Agent:理解问题、拆解任务

↓

库存 Agent:分析库存天数、缺货、滞销

销售 Agent:分析销量、转化、趋势

定价 Agent:分析成本、价格、毛利、竞品

采购 Agent:计算补货数量和时点

风险 Agent:判断是否需要审批

报告 Agent:生成经营报告

↓

人工确认 / 审批流

↓

执行动作 / 输出报告

15.3 不同框架的实现思路

框架 实现方式
LangGraph 把每个 Agent 设计成图节点,状态中保存商品、库存、价格、风险等信息
CrewAI 把库存、定价、采购、报告设计成不同角色 Agent,通过 Crew 顺序或层级执行
OpenAI Agents SDK 用入口 Agent 做 handoff,把不同问题转交给专业 Agent
Microsoft Agent Framework 用 Agent + Workflow 控制业务流程和审批节点
LlamaIndex 如果核心是文档规则和制度问答,可作为 RAG 层提供知识增强
Haystack 如果核心是企业搜索和知识库检索,可作为 RAG Pipeline
MetaGPT 如果要生成系统设计、PRD、代码原型,可用于软件工程自动化部分

15.4 产品 PRD 应该怎么写?

Agent 产品 PRD 必须比普通 PRD 多写 6 块内容:

1. Agent 角色定义

2. 工具/API 调用清单

3. Prompt / Instruction 规则

4. 中间结果数据结构

5. 风控与人工审批机制

6. 评估指标与观测方案

示例:库存 Agent 设计表

字段 内容
Agent 名称 库存分析 Agent
目标 判断商品是否缺货、滞销或库存异常
输入 SKU、当前库存、日均销量、在途库存、安全库存、供应商交期
工具 WMS、ERP、订单系统
输出 库存天数、风险类型、风险等级、处理建议
规则 库存天数 < 供应商交期则标记高缺货风险
边界 不直接创建采购单,只输出建议
指标 风险识别准确率、预警提前量、业务采纳率

15.5 技术实现建议

最小可行版本不要一开始就做大而全。

建议分三期:

第一期:MVP
自然语言问答

库存数据查询

库存风险判断

报告生成

技术选型可以是:

LangChain / OpenAI Agents SDK + 简单工具函数 + 数据库查询

第二期:Multi-Agent
引入库存 Agent、销售 Agent、定价 Agent、报告 Agent

加入 Agent 调度

加入结构化输出

加入日志和 tracing

技术选型可以是:

LangGraph / CrewAI / OpenAI Agents SDK

第三期:生产化
权限控制

审批流

异常兜底

长期记忆

指标看板

灰度发布

成本监控

人工反馈闭环

技术选型可以是:

LangGraph + LangSmith

Microsoft Agent Framework

OpenAI Agents SDK + tracing

企业自研编排层


16 框架选型的 8 个避坑点

坑 1:把 Agent 当成 Chatbot

很多 Agent 项目失败,是因为它只是换了个名字的聊天机器人。

真正的 Agent 必须能:

理解任务

调用工具

执行步骤

处理异常

输出结构化结果

接受评估

坑 2:为了 Multi-Agent 而 Multi-Agent

不是每个任务都需要多个 Agent。

简单问答:RAG 即可

固定流程:Workflow 即可

复杂决策:Multi-Agent 才有价值

坑 3:没有结构化输出

如果 Agent 输出都是自然语言,后续很难进入系统。

建议中间结果尽量使用:

{

  "risk_level": "high",

  "reason": "库存可售天数低于供应商交期",

  "suggestion": "建议补货 500 件",

  "need_human_review": true

}

坑 4:没有工具权限边界

Agent 调用工具一定要控制权限:

能查什么?

能改什么?

能不能下单?

能不能发邮件?

能不能执行代码?

是否需要审批?

坑 5:没有人工审批

高风险动作绝不能直接交给 AI 自动执行。

例如:

调价

采购

退款

合同修改

财务付款

法律意见

医疗建议

必须 Human-in-the-loop。

坑 6:没有观测和评估

Agent 出错通常不是“模型坏了”,而是:

Prompt 不清楚

工具调用错了

检索内容错了

中间状态丢了

权限不够

流程设计不合理

所以 tracing 很重要。

坑 7:一开始就追求全自动

企业更容易接受的是:

AI 先做建议

人来确认

系统留痕

效果复盘

逐步自动化

坑 8:只讲技术,不讲 ROI

老板和客户最终关心:

省了多少人力?

减少多少错误?

缩短多少时间?

增加多少收入?

降低多少风险?


17 Agent 框架学习路线:从入门到精通

阶段 1:基础入门

掌握:

LLM

Prompt

RAG

Function Calling

Tool Calling

JSON Schema

Embedding

Vector Database

推荐练习:

做一个知识库问答 Bot

做一个能查天气的工具调用 Agent

做一个能查询数据库的问答 Agent

阶段 2:单 Agent 实战

掌握:

工具调用

记忆管理

结构化输出

异常兜底

Prompt 模板

推荐框架:

LangChain

OpenAI Agents SDK

LlamaIndex

阶段 3:Workflow 编排

掌握:

顺序执行

条件分支

循环

状态管理

人工审批

任务恢复

推荐框架:

LangGraph

CrewAI Flows

Microsoft Agent Framework

LlamaIndex Workflows

阶段 4:Multi-Agent 协作

掌握:

Agent 角色设计

主从式架构

Pipeline 架构

Debate 架构

Handoff

多 Agent 评估

推荐框架:

CrewAI

LangGraph

OpenAI Agents SDK

Microsoft Agent Framework

MetaGPT

阶段 5:生产化落地

掌握:

权限

审计

日志

Tracing

评估集

成本监控

安全护栏

灰度发布

SLA

Human-in-the-loop

推荐组合:

LangGraph + LangSmith

OpenAI Agents SDK + Tracing

Microsoft Agent Framework + Azure

LlamaIndex / Haystack + 自研业务系统


18 不同角色应该怎么学?

AI 产品经理

重点学:

Agent 产品架构

业务流程拆解

工具/API 清单

Agent 角色设计

PRD 写法

评估指标

商业化场景

不用一开始深挖底层代码,但必须能和研发讨论:

这个场景是否需要 Agent?

需要几个 Agent?

每个 Agent 的输入输出是什么?

是否需要人工审批?

如何评估效果?

算法 / 后端工程师

重点学:

工具调用

状态管理

异步任务

函数 schema

Graph 编排

错误处理

Tracing

部署

建议优先实操:

LangGraph

OpenAI Agents SDK

Microsoft Agent Framework

CrewAI

企业技术负责人

重点看:

框架稳定性

生态成熟度

权限与安全

观测能力

长期维护

云厂商绑定

团队学习成本

迁移风险

不要只看 Demo 效果。


19 最推荐的 5 种技术组合

组合 1:LangGraph + LangSmith + 自研业务系统

适合:

复杂企业流程

需要强状态控制

需要 tracing 和评估

有工程团队

组合 2:CrewAI + 业务工具 + 审批系统

适合:

多角色协作

内容生产

市场调研

运营分析

销售材料生成

组合 3:OpenAI Agents SDK + Handoff + Guardrails

适合:

客服

销售助理

多角色转接

实时交互

快速产品化

组合 4:LlamaIndex / Haystack + LangGraph

适合:

知识库 + 复杂流程

企业文档智能

法规 / 合同 / 技术文档分析

组合 5:Microsoft Agent Framework + Azure

适合:

大型企业

Microsoft 技术栈

Azure AI Foundry

.NET / C#

合规、安全、观测要求高


20 最后一张选型速查表

你要做什么 首选框架
快速做一个工具调用 Agent OpenAI Agents SDK / LangChain
做复杂状态图和长任务 LangGraph
做多角色团队协作 CrewAI
做软件公司式自动开发 MetaGPT
做研究型多 Agent 对话 AutoGen
做 Microsoft 企业级 Agent Microsoft Agent Framework / Semantic Kernel
做文档智能和知识库 LlamaIndex
做搜索/RAG Pipeline Haystack
做低代码业务验证 Dify / Coze / Flowise
做生产级企业 Agent LangGraph / Microsoft Agent Framework / OpenAI Agents SDK

21 总结:Agent 框架的终局不是“会聊天”,而是“能执行复杂业务”

Agent 框架的发展,正在从三个方向收敛:

第一,从 Prompt 工程走向系统工程

早期大家关注:

怎么写 Prompt?

怎么让回答更好?

现在真正的问题是:

怎么拆任务?

怎么接工具?

怎么控流程?

怎么做权限?

怎么评估效果?

怎么上线运营?

第二,从单 Agent 走向 Agent + Workflow

未来企业级 Agent 不会是完全自由的黑盒,而会是:

固定流程用 Workflow 控制

开放判断用 Agent 处理

高风险节点用人工审批

关键结果用规则和评估校验

第三,从 Demo 走向商业闭环

真正有价值的 Agent,不是能完成一次炫酷演示,而是能够持续创造业务价值:

提效

降本

增收

控风险

提升决策质量

沉淀组织知识

结语:抓住大模型时代的职业机遇

AI大模型的发展不是“替代人类”,而是“重塑职业价值”——它淘汰的是重复性、低附加值的工作,却催生了更多需要“技术+业务”交叉能力的高端岗位。对于求职者而言,想要在这波浪潮中立足,不仅需要掌握Python、TensorFlow/PyTorch等技术工具,更要深入理解目标行业的业务逻辑(如金融的风险控制、医疗的临床需求),成为“懂技术、懂业务”的复合型人才。

无论是技术研发岗(如算法工程师、研究员),还是业务落地岗(如产品经理、应用工程师),大模型都为不同背景的职场人提供了广阔的发展空间。只要保持学习热情,紧跟技术趋势,就能在AI大模型时代找到属于自己的职业新蓝海。

最近两年大模型发展很迅速,在理论研究方面得到很大的拓展,基础模型的能力也取得重大突破,大模型现在正在积极探索落地的方向,如果与各行各业结合起来是未来落地的一个重大研究方向

大模型应用工程师年包50w+属于中等水平,如果想要入门大模型,那现在正是最佳时机

2025年Agent的元年,2026年将会百花齐放,相应的应用将覆盖文本,视频,语音,图像等全模态

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

扫描下方csdn官方合作二维码获取哦!

在这里插入图片描述

给大家推荐一个大模型应用学习路线

这个学习路线的具体内容如下:

第一节:提示词工程

提示词是用于与AI模型沟通交流的,这一部分主要介绍基本概念和相应的实践,高级的提示词工程来实现模型最佳效果,以现实案例为基础进行案例讲解,在企业中除了微调之外,最喜欢的就是用提示词工程技术来实现模型性能的提升

img

第二节:检索增强生成(RAG)

可能大家经常会看见RAG这个名词,这个就是将向量数据库与大模型结合的技术,通过外部知识来增强改进提升大模型的回答结果,这一部分主要介绍RAG架构与组件,从零开始搭建RAG系统,生成部署RAG,性能优化等

img

第三节:微调

预训练之后的模型想要在具体任务上进行适配,那就需要通过微调来提升模型的性能,能满足定制化的需求,这一部分主要介绍微调的基础,模型适配技术,最佳实践的案例,以及资源优化等内容

img

第四节:模型部署

想要把预训练或者微调之后的模型应用于生产实践,那就需要部署,模型部署分为云端部署和本地部署,部署的过程中需要考虑硬件支持,服务器性能,以及对性能进行优化,使用过程中的监控维护等

img

第五节:人工智能系统和项目

这一部分主要介绍自主人工智能系统,包括代理框架,决策框架,多智能体系统,以及实际应用,然后通过实践项目应用前面学习到的知识,包括端到端的实现,行业相关情景等

img

学完上面的大模型应用技术,就可以去做一些开源的项目,大模型领域现在非常注重项目的落地,后续可以学习一些Agent框架等内容

上面的资料做了一些整理,有需要的同学可以下方添加二维码获取(仅供学习使用)

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐