在2026年大模型Agent爆发的当下,有个核心概念被越来越多开发者追捧——Context Engineering(上下文工程)。很多小白和程序员在选型时容易陷入“框架焦虑”,纠结于哪个框架更牛、哪个star更多,但其实Agent的核心竞争力,从来不是框架本身,而是你给它搭建的上下文体系。

对话历史如何高效管理、工具调用结果如何精准传递、长期记忆如何持久化、复杂任务如何拆解落地——这些上下文工程的核心环节,才是决定Agent能否“好好干活”的关键。框架只是实现这些环节的工具,想通这一点,选型就会变得清晰高效,少走80%的弯路。

ninehills在GitHub上维护的「自主Agent / 上下文工程资料索引」(https://github.com/ninehills/blog/issues/150),至今仍是中文圈最系统的资料汇总,涵盖核心论文、实操案例,2026年仍在持续更新,小白入门、程序员进阶都值得永久收藏。

上下文工程的四大核心要素的核心逻辑从未改变:以Agent输出质量为中心,围绕对话历史管理、工具调用路由、记忆存储、任务分解四大模块搭建体系,这也是所有主流框架的设计底层。

先去哪里看?

几个值得花时间的资源:

Agent 指南(https://agent-guidance.manus.space/):22 篇文章组成知识图谱,从"什么是 Agent"讲到"生产级系统设计",互动式教程,免费,中英文都有。

Hello Agents(Datawhale)(https://datawhalechina.github.io/hello-agents):「从零开始构建智能体」,国内社区做的,适合刚入门把概念搞清楚。

Nader 的完整构建指南(https://nader.substack.com/p/the-complete-guide-to-building-agents):用 Claude Agent SDK 构建 Agent 的全流程,Claude Code 的底层原理讲得很透。

Nazha.co的文章(https://www.nazha.co/posts/how-to-build-agents):实操向,重点讲 Claude Agent SDK 怎么用,以及怎么兼容 Minimax、GLM、DeepSeek 这些国产模型。


框架全景

我把主流框架和工具分成六层,从简单到复杂。找到自己在哪一层,往下看就行。

Agent 框架六层架构图:从底层直接开干到顶层垂直场景,复杂度逐层递增


第一层:直接开干

Claude Agent SDK

本质是把 Claude Code 的能力包成库。spawn 一个 node 进程跑 cli.js,工具调用、长上下文、复杂推理原生支持。

几乎所有实践者都先推这个,理由只有一个:快。早上有想法,下午就能跑通。

踩坑:Electron 打包要加 asar.unpack: '**/node_modules/@anthropic-ai/**',不然 cli.js 解包失败,App 起不来。另外通过 ANTHROPIC_BASE_URL + ANTHROPIC_API_KEY 可以对接 Minimax、GLM、DeepSeek,不是只能用 Claude。


pi-mono(https://github.com/badlogic/pi-mono,★17,938)

容易被忽视,但接近 18k star 不是假的。

这是一套工具包:coding agent CLI + 统一 LLM API(多家模型)+ TUI/Web UI + Slack bot + vLLM pods,不是单一框架。

配套有 awesome-pi-agent(https://github.com/qualisero/awesome-pi-agent)——社区维护的扩展列表,hooks、tools、skills 各种都有,生态挺完整了。


craft-agents(https://github.com/lukilabs/craft-agents-oss)

基于 Claude SDK 和 Pi SDK 构建,文档中心化 Agent 框架,自带 GUI。

核心思路是把「文档」作为 Agent 的工作对象,不是代码不是命令行。内容类、文档处理类的场景用这个。


OpenAI Agents SDK(2025 年 3 月发布)

OpenAI 自家的轻量框架,专为多 Agent 协作设计。比 LangChain 轻,比 LangGraph 好上手。用 OpenAI 模型、又不想搞那么重的,这是合理的中间选项。


第二层:前端交互

Vercel AI SDK(https://ai-sdk.dev/docs/introduction,v6 最新)

这不是完整的 Agent 框架。它是给 Next.js / React / Svelte / Vue 用的前端交互层,提供 useChatuseCompletion 等 hooks,流式渲染丝滑。v6 加了 Expo 和 React Native 支持,同时上了 Coding Agent 相关功能。

后端 Agent 逻辑还是要用别的框架来做,Vercel AI SDK 负责「把结果好看地展示出来」。


CopilotKit(https://github.com/CopilotKit/CopilotKit,★29,078)

定位是「Frontend for Agents & Generative UI」,React + Angular 都支持。

跟 Vercel AI SDK 的区别:Vercel AI SDK 是流式渲染层,CopilotKit 是 Copilot 嵌入层。要让 Agent 直接操作已有 Web 应用的 UI、跟页面元素交互,CopilotKit 才是对的工具,Vercel AI SDK 做不到这个。


第三层:类型安全

PydanticAI

Pydantic 团队做的,类型安全 + 模型无关性。定义好输出 Schema,框架保证 AI 返回符合格式的结果,换模型不用大改代码。

两句社区原话:「看了 LangGraph 和 Agno,最后选了 PydanticAI,更可控。」「只是需要工具调用 + 结构化输出的话,没必要用 LangGraph,PydanticAI 够了。」

输出要入库、要校验——解析合同、生成结构化报告、对接下游系统——选这个。


第四层:多 Agent 编排

LangChain / LangGraph(https://langchain-doc.cn/)

LangChain(★127,733)这两年从「模型接口封装」转成了「智能体工程平台」,官方定位现在是 “The platform for reliable agents.”。核心是 LangGraph(★25,248),状态机式编排,把 Agent 执行过程建模成节点和边,支持循环、分支、回滚。生产部署走 LangSmith Deployment(今年把 LangGraph Platform 改名了,但功能一样)。

学习曲线最高,控制力也最强。流程复杂、需要 HITL(人工在某个节点介入审核)、Agent 出错了要回到上一步重来——这种场景 LangGraph 才值得学。

deepagents(https://github.com/langchain-ai/deepagents,★9,705)是 LangChain 官方基于 LangGraph 做的 Agent harness,内置 planning tool、filesystem backend、子 Agent 生成。想快速理解 LangGraph 怎么用,看这个仓库比看文档直接多了。


CrewAI

角色扮演式。定义「研究员」「撰稿人」「编辑」,分配任务,协作完成。

逻辑清晰,调试时知道是哪个 Agent 出了问题——这是它比 AutoGen 好调的地方。内容生产、市场调研用这个。


AutoGen(微软)

对话协商式。Agent 之间通过对话解决问题,不是固定角色。

灵活,但也因为太灵活,有时候两个 Agent 会无限对话收不了场。代码 Review + 修复这种需要自由协商的技术问题用这个。


第五层:企业级基础设施

Mastra:TypeScript 企业级框架,工作流编排 + 知识库管理 + 工具集成打包在一起。TS 技术栈的首选。

Agno(前 Phidata):Python 版企业级 Agent,自带记忆模块、知识库、工具调用。做公司内部 AI 助理这类应用合适。有用户反映会遇到循环调用、难以调试的问题,选型时注意。

Temporal(https://github.com/temporalio/temporal,★18,561):不是 AI 框架,是任务持久化引擎。断网重连、自动重试、流程不丢失。做公司级应用,从架构初期就把它纳入,别等出问题了再补。


第六层:垂直场景

场景对得上能省大量时间:

opencode(https://github.com/anomalyco/opencode,★112,765):「The open source coding agent.」star 数跟 LangChain 差不多量级,是目前开源 Coding Agent 里最大的项目。如果你要做 AI 编程助手类工具、或者想基于开源 Coding Agent 做二次开发,从这里开始。

TradingAgents-CN(https://github.com/hsliuping/TradingAgents-CN,★17,954):中文化的多 Agent 金融交易框架,基于 LLM 做量化分析。场景在金融领域的可以直接用。

RD-Agent(https://github.com/microsoft/RD-Agent,★11,421):微软出品,自动化工业级研发流程。Agent 要跑实验、分析数据、输出研究报告的,参考这个的设计思路。


测试和架构

上生产前不能漏的两个:

scenario(https://github.com/langwatch/scenario):专门针对 Agentic 系统的测试框架。Agent 写完了怎么保证它在各种场景下行为符合预期?scenario 帮你写测试用例,跑自动化测试。上线前一定要过这一步。

DeepChat Agent 架构解析(https://github.com/ThinkInAIXYZ/deepchat/wiki/Agent-系统架构详解):不是框架,是 DeepChat 项目的架构文档。对 AgentPresenter、agentLoopHandler 等核心组件有详细说明。自己设计 Agent 系统前读一遍,少走弯路。


上下文工程的实操

Agent-Skills-for-Context-Engineering(https://github.com/muratcankoylan/Agent-Skills-for-Context-Engineering,★12,619):专门收集 Agent Skills 的仓库,覆盖上下文工程、多 Agent 架构、生产系统实践。用 Claude Agent SDK 写 Skills 的时候,来这里找参考,不用从零想。


选型决策树

你要做什么 →个人项目 / 快速验证  └→ Claude Agent SDK / pi-mono要做 Web 界面  ├→ 流式渲染 → Vercel AI SDK  └→ 嵌入现有 app 的 Copilot → CopilotKit输出要结构化、要入库  └→ PydanticAI多个 Agent 协作  ├→ 分工明确 → CrewAI  ├→ 自由协商 → AutoGen  └→ 流程复杂 / 需要人工审核 → LangGraph(+ deepagents 上手)垂直场景  ├→ 金融量化 → TradingAgents-CN  ├→ 科研 R&D → RD-Agent  └→ Coding Agent(开源最大项目)→ opencode(★112k)企业级、生产环境  ├→ TS 技术栈 → Mastra  ├→ Python 技术栈 → Agno  ├→ 任务不能丢 → + Temporal  └→ 上线前测试 → scenario
```![](http://cdn.zhipoai.cn/e389c866.jpg)

Agent 框架选型决策树:从你的场景出发,六条路径找到最适合的框架

推荐路径
----

**刚开始做 Agent**:先去 manus.space(https://agent-guidance.manus.space/) 或 hello-agents(https://datawhalechina.github.io/hello-agents) 把概念搞清楚,然后用 Claude Agent SDK 搞一个具体的小场景,比如「帮我自动整理每天的邮件」。跑通了,比把所有框架文档看一遍更有用。

**已经在用、觉得不够用**:看是哪里不够。流程控制不够,LangGraph;多 Agent 分工,CrewAI;结构化输出,PydanticAI;要做界面,Vercel AI SDK 或 CopilotKit。别一下子全上。

**要上生产、给公司用**:

```plaintext
前端:Vercel AI SDK / CopilotKit核心逻辑:Claude Agent SDK 或 LangGraph持久化:Temporal工具连接:MCP测试:scenarioSkills 参考:Agent-Skills-for-Context-Engineering

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

图片

以上资料如何领取?

在这里插入图片描述

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

图片

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
在这里插入图片描述
在这里插入图片描述

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

以上全套大模型资料如何领取?

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐