一、前言:为什么AI工具调用是2026必备核心能力?

近三年大模型落地生态发生了颠覆性迭代,AI工具调用从小众技术点,变成了所有AI应用、Agent开发的核心基石。从最初的Function Calling,到2024年底爆火的MCP协议,再到2025年成熟落地的Agent Skills机制,AI终于完成了「只会说话→能动手做事→会专业高效做事」的完整进化。

目前行业现状:OpenAI、谷歌、微软、Anthropic四大巨头全面适配MCP协议,Claude Code、Cursor等主流AI开发工具原生支持Skills机制,社区也一直在争论:MCP是否会替代Function Calling?Skills究竟解决了什么核心痛点?

本文用通俗大白话+实战场景+对比总结,从零拆解AI工具调用的三次技术迭代,零基础小白、初级程序员都能轻松看懂,全文干货无废话,建议收藏反复学习。

先记住核心进化主线,全文所有内容都围绕这条逻辑展开:

Function Calling(硬连接调用) → MCP(标准化通用接口) → Agent Skills(智能化业务实操)

二、Function Calling:AI 从"只会说"到"能动手"

2.1 它解决了什么问题

在 Function Calling 出现之前,LLM 就是一个**“缸中之脑”**——它能推理、能聊天,但:

  • • 不知道现在几点
  • • 不知道今天天气
  • • 不能发邮件
  • • 不能查数据库
  • • 不能操作任何真实系统

说白了:它有脑子没有手。

💡 一句话定义:Function Calling 让 LLM 学会了"下达结构化指令"——它不直接执行任务,而是告诉你的程序"我想调用哪个函数、传什么参数"。

小编给你打个比方:

想象一个坐在轮椅上的天才指挥官。他不能自己冲锋陷阵,但他可以精确地下达命令:“3 号士兵,用步枪,朝东南方向 200 米的目标射击。”

Function Calling 就是这个"精确下达命令"的能力。模型是指挥官,你的代码是士兵。

图片

2.2 它是怎么工作的——三步走

早期的"工具调用"依赖 Prompt Engineering——开发者苦口婆心地写:“请务必返回 JSON 格式,不要多说废话。”

结果呢?模型经常"抽风",一会儿返回 JSON,一会儿返回散文,程序解析直接崩。

OpenAI 引入 Function Calling 后,把这个过程变成了严格的三步规范

小编用一个场景带你走一遍:你问 Agent:“查一下杭州明天天气”


第一步:契约定义(Schema)——给模型一份"说明书"

开发者预先定义好工具的"名片"——用 JSON Schema 说清楚:

{
  "name":"get_weather",
"description":"查询指定城市的天气预报",
"parameters":{
    "type":"object",
    "properties":{
      "city":{
        "type":"string",
        "description":"城市名称,如 Hangzhou"
      }
    },
    "required":["city"]
}
}

这张"名片"告诉模型:我这里有个工具叫 get_weather,你想用它就必须给我一个 city 参数。


第二步:大脑决策——模型下达"订单"

你问"杭州明天天气怎样",模型一看:

  • • 我自己没有实时天气数据
  • • 但我有一个 get_weather 工具可以用
  • • 用户提到了"杭州"

于是它不再瞎编,而是输出一份精确的"调用请求":

{
  "name": "get_weather",
  "arguments": "{\"city\": \"Hangzhou\"}"
}

注意:此时模型没有联网,没有调 API。它只是精准地提炼了你的意图,翻译成了结构化指令。


第三步:闭环执行——Agent 跑腿 + 模型回复

你的 Agent 程序收到这个 JSON,去调真正的天气 API:

→ 调用 weather_api("Hangzhou")
← 返回:"12°C,小雨"

然后把结果塞回给模型。模型拿到真实数据后,组织一段自然语言:

“杭州明天 12°C,有小雨,记得带伞哦~”

整个过程用一张图总结:

你:"杭州明天天气"
       ↓
模型决策:我要调用 get_weather(city="Hangzhou")
       ↓
Agent 执行:调用真实 API → 得到 12°C/小雨
       ↓
模型回复:"杭州明天12°C,有小雨,带伞"

图片

2.3 Function Calling 的局限

Function Calling 很好,但当你的工具从 3 个变成 30 个、甚至 300 个时——问题来了。

小编自己经历过:

问题 1:重复造轮子

你给 Claude 写了一套工具定义,给 GPT-4 又要重写一遍,给 Gemini 再来一遍。格式不同、字段名不同、行为不同。三个模型三套代码,维护成本爆炸。

问题 2:紧耦合

工具定义硬编码在代码里。换个模型?全部重写。换个应用场景?全部重写。想让别人复用你的工具?把代码 copy 给他。

问题 3:工具描述占上下文

每个工具的 JSON Schema 都要塞进上下文窗口。工具一多,光工具描述就占了几千个 Token——留给真正对话的空间就少了。

“Function Calling 就像有线耳机——好用,但每台设备都要买一根专用线。”

这时候你就会想:能不能有个"标准接口",写一次工具,到处都能用?

这就是 MCP 要解决的问题。


三、MCP:AI 世界的"USB-C 接口"

3.1 它是什么

💡 一句话定义:MCP(Model Context Protocol,模型上下文协议)是 Anthropic 推出的一套开放协议,让 AI 应用可以通过标准化接口连接任何外部工具和数据源——写一次,到处用。

2024 年 11 月,Anthropic 正式发布了 MCP 协议。他们给出的类比是:

MCP 之于 AI 工具,就像 USB-C 之于硬件设备。

以前每个手机充电器都不一样(Micro-USB、Lightning、各种私有接口),USB-C 一出来——一根线搞定所有设备。

MCP 做的是同样的事:以前每个 AI 应用(Claude、GPT、Cursor)接工具都要单独写代码;有了 MCP——写一个 MCP Server,所有支持 MCP 的应用都能直接接入。

图片

3.2 MCP 的三层架构:Host / Client / Server

MCP 不是一个工具,它是一套通信协议。要理解它怎么工作,你得先知道三个角色:

在这里插入图片描述

小编用一个类比帮你记住:

  • Host(宿主)= 你家的电脑。它运行 AI 应用,管理所有连接。
  • Client(客户端)= 电脑上的 USB 接口。每个接口对接一个外设。
  • Server(服务端)= 外接设备。键盘、鼠标、硬盘——各管各的功能。

一个 Host 可以连多个 Server。每个 Server 独立提供能力。互不干扰。

3.3 MCP 是怎么通信的

两种传输方式:

方式 使用场景 大白话
stdio(标准输入输出) 本地server,跑在你自己的电脑上 像两个人面对面说话,不用网络
sse/http 远程server,跑在云端 像打电话,通过网络连接

通信协议是 JSON-RPC 2.0——说白了就是"用 JSON 格式发消息,按规范办事"。

3.4 MCP 的完整工作流

小编用"杭州天气"这个例子,走一遍 MCP 的全流程:


第一步:建立连接(Initialize)

Claude Desktop(Host)启动时,看到配置里有一个天气 MCP Server。于是:

Host → Server:"你好,我是 Claude Desktop,你能干啥?"
Server → Host:"我能查天气(get_weather),也能查空气质量(get_air_quality)"

双方握手完成,Host 知道了 Server 有哪些能力。


第二步:发现工具(List Tools)

Host 把 Server 提供的工具列表注入到 LLM 的系统提示词中。现在模型"看到"了:

你有以下工具可用:
- get_weather(city: string):查询城市天气
- get_air_quality(city: string):查询空气质量

第三步:调用工具(Call Tool)

你问"杭州天气",模型决定调用 get_weather

模型 → Host:"我想调 get_weather,参数 city=Hangzhou"
Host → Client → Server:转发调用请求
Server:调真实 API,拿到结果
Server → Client → Host → 模型:返回"12°C,小雨"

和 Function Calling 有什么不同? 核心区别在于:

维度 Function Calling MCP
工具定义在哪 硬编码在你代码里 独立的server 进程
换个AI应用 重写一遍 直接接入,不用改
别人写的工具 复制代码到你项目 加个server配置就行
工具更新了 该你的代码 server自己更新,你不用动

在这里插入图片描述

3.5 MCP 的三大能力

MCP Server 不只能提供"工具",它实际上有三种能力:

能力 谁来决定使用 大白话 类比
Tool(工具) 模型自主决定调用 “我能帮你干活”–查天气、发邮件、写文件 你桌子上的计算器–你觉得你需要就拿起来用
Resourses(资源) 应用程序决定注入 “我有数据给你看”–数据库内容、文件列表 领导放你桌子上的参考资料–不是你选的,但是你得看
Prompts(提示模版) 用户主动选择 “我又现成的流程”–一键启动特定的工作流 用户点击一个“快捷操作”按钮

小编觉得这个设计挺聪明的:不是所有东西都让模型自己决定用不用。有些信息是应用自动塞进去的(Resources),有些是用户手动触发的(Prompts)。分层控制,避免模型"瞎调用"。

3.6 MCP 的生态有多火

自 2024 年底发布以来,MCP 的生态增长速度超乎想象:

  • 主流大厂全面跟进:Google(Gemini)、OpenAI、微软(VS Code、Copilot)、AWS、Cloudflare 先后宣布支持
  • 第三方 Server 爆发:GitHub、Stripe、Linear、Slack、Notion、Postgres、Docker 等都发布了官方 MCP Server
  • 开发工具原生支持:Cursor、Windsurf、Claude Code、Zed 等 AI 编辑器已原生集成 MCP
  • MCP Registry:社区搭建了中央发现仓库,开发者可以搜索、安装、发布 MCP Server
  • 远程 MCP:Cloudflare Workers 等平台支持将 MCP Server 部署为 Serverless 函数,无需本地运行

小编自己体验下来——MCP 最香的地方是:别人写好的 Server,你加一行配置就能用。

比如要让你的 Agent 操作 GitHub?以前要自己写 GitHub API 封装代码,现在:

{
  "mcpServers":{
    "github":{
      "command":"npx",
      "args":["-y","@modelcontextprotocol/server-github"],
      "env":{"GITHUB_TOKEN":"your-token"}
    }
}
}

加这么一段配置,Agent 就能创建 PR、查看 Issue、管理仓库了。零开发成本。

这就是"标准化"带来的生态红利——一个人写,所有人用。


四、MCP 出来后,Function Calling 是不是就过时了?

这个问题最近社区争论很热闹。小编先说结论:

没过时。两者是不同层面的解决方案,各有适用场景。

4.1 一个"反常"的案例:龙虾 Agent(OpenClaw)

2025 年有一个现象级的开源项目叫 OpenClaw(中文名:龙虾),做的是本地个人 Agent。

有意思的是——它明确选择了回归 Function Calling,没有用 MCP。

这是在开"历史倒车"吗?

小编研究了他们的设计文档,总结出两个核心原因:


原因 1:开发成本

MCP 需要单独启动 Server 进程,涉及生命周期管理(连接、握手、心跳、断线重连)。

对于一个本地 Agent 就用 5-10 个工具的场景——这太重了。

MCP 方式:
  启动 Server A 进程 → 启动 Server B 进程 → 握手 → 注册工具 → 调用 → 管理心跳...

Function Calling 方式:
  定义 JSON Schema → 写业务逻辑函数 → 搞定

说白了:"能跑就行"远比"符合国际协议"重要。 对很多独立开发者来说,这是大实话。


原因 2:性能延迟

MCP 在动态拉取工具列表(list_tools)时会消耗额外的 Token 和往返时间。在生产环境中,如果工具列表是固定的——

直接把 Function 定义写死在 Prompt 里,速度更快、更省钱

小编实测过:MCP 的 stdio 模式每次调用多了大约 50-100ms 延迟。单次不明显,但如果一个任务需要连续调 20 次工具——这就是 1-2 秒的额外等待。


4.2 那什么时候该用 MCP?

场景 function calling MCP
工具数量少(<10个)且固定不变 过度工程
你只是一个模型/应用 不需要标准化
追求极致的延迟 有额外开销
工具被多个应用共享 不够用
工具由第三方提供 自己重写?累,不稳定 ✅ 直接接入
工具列表动态变化 硬编码,不稳定 ✅动态发现
需要安全隔离(server独立进程) 自己做隔离 ✅天然隔离

一句话总结:“MCP 是工具的分发方案,Function Calling 是工具的集成方案。分发给全世界用 MCP,自己内部用 Function Calling 就够了。”

在这里插入图片描述

五、Agent Skills:比"能连接"更重要的是"会使用"

5.1 MCP 的两个痛点

MCP 解决了"标准化连接"的问题。但小编在实际使用中发现了两个新问题:


痛点 1:上下文爆炸

一个 MCP Server 可能暴露几十甚至上百个工具。这些工具的完整 JSON Schema 在连接建立时就会被加载到系统提示词中。

社区开发者实测数据:仅加载一个 Playwright MCP Server 就占用了 200K 上下文窗口的 8%。

你接 3-5 个 Server?20-40% 的上下文就被工具描述占了。留给真正对话的空间严重压缩。

在多轮对话中,这个问题更严重——Token 成本飙升,推理能力下降。


痛点 2:能力鸿沟——“能连上"≠"会用”

MCP 解决了"能够连接"的问题,但没有解决"知道如何使用"的问题。

举个例子

你给 Agent 接了一个数据库 MCP Server。Agent 现在可以执行 SQL 了。

但它知道:

  • • 你的数据库有哪些表?表结构是什么?
  • • 查员工信息应该 JOIN 哪几张表?
  • • 有哪些查询是绝对不能执行的(比如 DROP TABLE)?
  • • 返回结果太多时应该怎么分页?

答案是:它不知道。MCP 只给了它"手",没给"操作手册"。

小编打个比方:

这就像给一个新入职的员工开通了所有系统的访问权限,但没给他任何培训资料和操作规范。他有权限登录 CRM、ERP、数据库——但他完全不知道该怎么用。

在这里插入图片描述

5.2 Agent Skills 是什么

💡 一句话定义:Agent Skills 是一种标准化的"程序性知识封装格式"——如果 MCP 给了 AI “手”,Skills 就给了 AI “操作手册”。

Skills 不是工具(不提供 API),不是 Prompt(不只是文字指令)。它是一个知识包,包含:

  • • 什么时候该用这个技能
  • • 具体怎么一步步做
  • • 有哪些注意事项和坑
  • • 需要调用哪些工具、怎么组合
  • • 可能还有脚本和参考文件

一句话区分三者:

属性 Function Calling MCP AgentSkills
本质 一次函数调用 一个标准化接口 一本操作手册
提供的是 “手” “标准化的手” “大脑里面的SOP”
类比 一个按钮 USE-C接口 应用软件

小编再展开类比:

  • MCP 像 USB 接口或驱动程序——定义设备如何连接
  • Skills 像应用软件——定义如何使用这些设备完成任务

你可以有一个完善的打印机驱动(MCP),但如果没人告诉你"怎么在 Word 里设置双面打印"(Skill),你还是搞不定。

在这里插入图片描述

5.3 Skills 最核心的创新:渐进式披露

前面说了,MCP 的一大问题是"上下文爆炸"——所有工具描述一次性全塞进去。

Skills 的解决方案非常聪明:分三层加载,按需逐步披露。

小编用一个比方帮你理解:

想象你新入职一家公司。公司不会在第一天就把所有部门的操作手册、全部流程文档、几百个系统的使用指南全塞给你。那样你会当场崩溃。

合理的做法是:

  • 第一天(入职手册):告诉你公司有哪些部门、各干什么——你大概知道有什么就行
  • 接到任务时(岗位培训):你被分到市场部?OK,现在才给你市场部的详细流程
  • 遇到具体问题时(查手册):你需要用某个系统?这时候才打开那个系统的操作指南

Skills 的三层加载机制一模一样:


第一层:元数据(Metadata)—— “公司有哪些部门”

Agent 启动时,只扫描每个 Skill 的"名片"——名称、一句话描述、触发词。

---
name: "wechat-article-writer"
description: "撰写微信公众号技术文章时使用此 skill"
triggers:
  - "写公众号文章"
  - "微信文章"
  - "改写成公众号"
---

每个 Skill 的元数据只占约 100 个 Token。就算你装了 50 个 Skill,初始消耗也只有 ~5000 Token。

对比 MCP:连一个 Playwright Server 就占 16000+ Token。差距是数量级的。


第二层:技能主体(Instructions)—— “岗位培训手册”

当用户的请求匹配到某个 Skill 的触发条件时,Agent 才加载这个 Skill 的完整内容。

比如用户说"帮我写一篇公众号文章",Agent 匹配到 wechat-article-writer,这时才把完整的写作规范、文章结构、风格要求全部加载进上下文。

这部分通常 1000-5000 Token,取决于指令复杂度。


第三层:附加资源(Scripts & References)—— “具体问题查手册”

对于复杂的 Skill,还可以附带脚本、模板、参考文档。Agent 只在具体执行到那一步时才加载。

skills/pdf-processing/
├── SKILL.md              # 主技能文件
├── parse_pdf.py          # PDF 解析脚本(需要时才执行)
├── forms.md              # 表单指南(遇到表单任务才加载)
└── templates/            # 模板文件(需要时才访问)

结果:你可以给 Agent 装几十个 Skill,它的初始上下文消耗非常小。只有当任务真正需要某个 Skill 时,才"展开"那个 Skill 的详细内容。

这就是"渐进式披露"的威力——不是一次性全塞进去,而是用多少加载多少。

在这里插入图片描述

5.4 Skills + MCP:不是竞争,是互补

理解了三代技术的差异后,你会发现——它们不是互相替代,而是各管一层。

最佳实践是把三者组合成分层架构

在这里插入图片描述

小编用一个实际场景带你走一遍这个分层:


场景:用户问 “分析一下公司里谁的话语权最高”

Skills 层介入:Agent 识别到这是一个"数据分析"类任务,加载 mysql-employees-analysis 技能。Skill 里定义了:

  • • 分析话语权需要看哪些维度(管理关系、薪资水平、任职时长、汇报线)
  • • 应该查哪些表、怎么 JOIN
  • • 返回结果应该怎么解读

MCP 层执行:Skill 指导 Agent 调用数据库 MCP Server,执行具体的 SQL 查询:

  • SELECT * FROM managers JOIN employees ON ...
  • SELECT salary, title FROM ...

Function Calling 层:MCP Server 底层调用实际的数据库驱动执行 SQL。

最终结果:Agent 基于 Skill 里的领域知识,把原始数据解读为有意义的结论返回给用户。


这种架构的好处:

优势 说明
关注点分类 MCP管“能力连接”,Skills管“领域智慧”
成本优化 渐进式加载,token消耗最小化
可维护性 业务逻辑(skills)和基础设施(MCP)解耦
复用性 同一个MCP Server 可被多个skills复用

5.5 如何写好一个 Skill

小编总结了几条实战原则(基于自己写代码审查 Skill 的经验):


原则 1:描述要回答"什么时候加载我",不是"我是什么"

# ❌ 坏的描述
description: "这是一个代码审查技能"

# ✅ 好的描述
description: "当用户提交代码要求 Review、检查代码质量、或合并 PR 前审查时使用"

Agent 扫描描述是为了判断"要不要加载你"——所以描述要像触发条件,不像自我介绍。


原则 2:触发词覆盖多种说法

用户可能说"帮我 review 代码",也可能说"看看这段代码有没有问题"。你的触发词要尽量覆盖各种说法:

triggers:
  -"review 代码"
-"代码审查"
-"检查代码质量"
-"帮我看看这段代码"
-"PR review"
- "code review"

原则 3:指令要像 SOP,不像散文

# ❌ 坏的指令(散文式)
审查代码时要注意安全性、性能和可读性,
同时关注命名规范和错误处理...

# ✅ 好的指令(SOP式)
## Step 1 — 理解上下文
1. 确认变更的目的(修 Bug / 新功能 / 重构)
2. 查看关联的 Issue 或需求描述
3. 了解影响范围(涉及哪些模块)

## Step 2 — 逐层审查
1. 安全性:是否有 SQL 注入、XSS、硬编码密钥
2. 正确性:边界条件、空值处理、并发安全
3. 性能:是否有 N+1 查询、内存泄漏、死循环风险
4. 可维护性:命名清晰度、函数长度、重复代码
...

越结构化、越具体,Agent 执行得越好。


原则 4:声明退出条件——什么算"做完了"

## 完成标准
- [ ] 所有文件都已逐一审查
- [ ] 安全类问题标记为「必须修复」
- [ ] 每条审查意见标注了严重等级(P0/P1/P2)
- [ ] 给出总体评价(通过 / 需修改 / 打回重写)

没有退出条件的 Skill,Agent 可能无限循环或提前结束。


原则 5:Skill 内部可以调用 MCP 工具

好的 Skill 不是"替代"MCP,而是编排MCP。在指令里明确说"用什么工具做什么事":

## Step 3 — 提交审查结果
1. 使用 GitHub MCP Server 在 PR 上逐行添加 Review Comment
2. 对于安全类问题,调用 Jira MCP Server 自动创建 Bug 工单
3. 使用消息 MCP Server 通知提交者审查已完成

这样 Skill 负责"决策和编排",MCP 负责"执行具体操作"——职责清晰。


5.6 一个完整的 Skill 工作场景

小编用一个大家都遇到过的场景,带你走一遍"有 Skill 的 Agent"是怎么工作的:

场景:你对 Agent 说"帮我看看这周的 Bug 列表,写封周报邮件发给领导"

这件事你自己做,大概要:打开 Jira 查 Bug → 筛选本周的 → 分类汇总 → 写成邮件 → 发送。30 分钟起步。

现在看 Agent 怎么做——


第一步:元数据匹配

Agent 扫描所有已安装 Skill 的元数据,发现 weekly-report-writer 匹配了:

用户说的:"写封周报邮件"
Skill 触发词:["周报", "weekly report", "写周报", "汇报邮件"]
→ 匹配!加载这个 Skill

此时消耗:~100 Token。其余几十个 Skill 完全不占上下文。


第二步:加载完整指令

Agent 读取这个 Skill 的完整内容。现在它知道了:

  • • 周报的标准格式(本周完成 / 进行中 / 下周计划 / 风险项)
  • • Bug 应该按"严重程度"分组,不是按时间
  • • 领导喜欢先看结论再看细节(金字塔结构)
  • • 邮件标题格式:[周报] XX团队 第N周工作汇报
  • • 语气要求:专业但不啰嗦,重点加粗

没有这个 Skill,Agent 可能写成流水账或格式乱七八糟。有了 Skill,它写出来的周报就像你组里最靠谱的那个同事写的。


第三步:按 SOP 执行(Skill 编排 + MCP 执行)

Skill 定义了清晰的步骤,Agent 依次执行:

Step 1:调用 Jira MCP Server → 查询本周所有 Bug(状态、优先级、负责人)
Step 2:按 Skill 指令分类 → P0/P1/P2 分组 + 已解决/进行中/待处理
Step 3:调用日历 MCP Server → 看看本周有没有重要会议/里程碑
Step 4:根据 Skill 模板组织邮件正文 → 金字塔结构,结论先行
Step 5:调用邮件 MCP Server → 发送给领导(抄送组内成员)

注意这里的分工:

  • Skill 负责"怎么做":分组逻辑、格式模板、语气要求
  • MCP 负责"去执行":查 Jira、读日历、发邮件

第四步:退出检查

Agent 对照 Skill 里定义的"完成标准"自检:

  • • Bug 数据来源是本周?(不是上周的旧数据)
  • • 邮件标题符合格式?
  • • 有"风险项"板块?(领导最关心的)
  • • 收件人正确?(发给领导,抄送组员)
  • • 邮件已成功发送?

全部通过 → 任务完成。你收到 Agent 的回复:“周报已发送,本周共处理 12 个 Bug,其中 P0 级 2 个已修复。”

从你说话到邮件发出,可能就 30 秒。


小编想强调的点是——如果没有 Skill,Agent 也"能"写周报。但它写出来的很可能是:

  • • 格式不对(领导看了想打人)
  • • 分类混乱(P0 和 P2 混在一起)
  • • 重点不突出(埋在一堆细节里)
  • • 语气不合适(要么太随意要么太正式)

Skill 的价值不是让 Agent “能做”,而是让它"做得对、做得好"。

“Skill 让 Agent 从’什么都能干但什么都干不精’变成了’接到任务就像老员工一样驾轻就熟’。”

在这里插入图片描述

六、全景总结:三代技术一张表

维度 Function Calling MCP AgentSkills
诞生时间 2023 2024年底 2025年底
创造者 OpenAI Anthropic anthrppic
定义 让模型输出结构化工具调用 让模型通过标准协议被任何应用接入 让Agent拥有领域的知识和工作流
解决的问题 AI不能动手 工具不能被复用 AI会玲姐但是不会精准的使用工具
类比 有线耳机 USB-C接口 应用软件
上下文消耗 中等(工具定义常驻) 高(每次都需要加在所有schema) 低(渐进式加在)
适用场景 内部简单工具绑定 跨应用工具共享 复杂领域任务编排
关系 基础层 中间层 上层
演进关系:

Function Calling  →  MCP  →  Agent Skills
    "能动手"         "手能通用"    "知道怎么用好手"

“从 Function Calling 到 Skills,本质上是从’连接’到’智慧’的跃迁。”


好了,三代工具调用技术全部讲完。回到最开始的问题——该选哪个?

小编的建议很实际:

  • 刚入门、做 Demo:直接用 Function Calling,简单够用
  • 要做跨应用共享、接第三方工具:上 MCP
  • 做复杂的领域任务、需要 Agent “真的懂业务”:写 Skills
  • 生产级系统:三层都用,各管各的层

说实话,小编自己目前的项目就是三层混合的——MCP 接数据库和文件系统,Skills 定义写作流程和质量标准,Function Calling 处理一些简单的内部逻辑。分工明确,各司其职。

最后

2026年技术圈的分化愈发明显:降薪裁员潮持续蔓延,传统开发、测试等岗位大批缩水,不少从业者陷入职业焦虑;与之形成鲜明对比的是,AI大模型相关岗位迎来疯狂扩招,薪资逆势飙升150%,大厂更是直接开出70-100W年薪,疯抢具备实战能力的大模型人才,甚至放宽年龄限制,只求能快速落地技术、创造价值!

很多程序员、职场新人纷纷入局大模型领域,绝非盲目跟风,而是实实在在看到了不可替代的价值优势,这也是2026年最值得抓住的职业风口:

1、窗口期红利,入门门槛友好:不同于成熟赛道的“内卷式招聘”,2026年大模型人才缺口巨大,简历只要达标(掌握基础AI应用+具备简单项目经验),年龄、学历均非硬性要求,小白可快速入门,转行程序员也能无缝衔接;

2、技术可复用,上手速度翻倍:如果你有前后端开发、测试、数据分析等基础,在大模型落地、系统部署、Prompt工程等环节会更具优势,无需从零开始,复用原有技术能力就能快速进阶;

3、懂业务更吃香,竞争力翻倍:单纯懂技术已不够,2026年大厂更看重“技术+业务”的复合型人才,有垂直领域(金融、医疗、工业等)经验者,能精准定位模型落地痛点,薪资比纯技术岗高出30%以上;

更重要的是,即便没有转型需求,用AI大模型工具为工作赋能、提升效率,也已经成为80%企业的硬性要求——不会用大模型提效,未来很可能被行业淘汰!

图片

那么2026年,小白/程序员该如何高效学习大模型?

很多人想入门大模型,却陷入两大困境:要么到处搜集零散资料,不成体系,越学越懵;要么被收费高昂的课程割韭菜,花了钱却学不到实战技能,白白浪费时间走弯路。

今天就给大家精心整理了一份2026年最新、免费、系统化的AI大模型学习资源包,覆盖从零基础入门到商业实战、从理论沉淀到面试通关的全流程,所有资料均已整理归档,无需拼凑,直接领取就能上手学习,小白可照做,程序员可进阶!

请添加图片描述

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

1、大模型系统化学习路线

这份学习路线结合2026年行业趋势和新手学习规律,由行业专家精心设计,从零基础到精通,每一步都有明确指引,帮你节省80%的无效学习时间,少走弯路、高效进阶,避免踩坑。

请添加图片描述

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

在这里插入图片描述

3、大模型学习书籍&电子文档

涵盖2026年最新技术要点,包括基础入门、Transformer核心原理、Prompt工程、RAG实战、模型微调与部署等内容

在这里插入图片描述

4、AI大模型最新行业报告

报告包含腾讯、阿里、甲子光年等权威机构发布的核心内容,还有2026年中文大模型基准测评报告、AI Agent行业研究报告等,帮你站在行业前沿,把握技术风口。

在这里插入图片描述

5、大模型项目实战&配套源码

项目包含Deepseek R1、GPT项目、MCP项目、RAG实战等热门方向,还有视频配套代码,手把手教你从0到1完成项目开发,既能练手提升技术,又能丰富简历,为求职和职业发展加分。

img

6、2026大模型大厂面试真题

2026年大模型面试已全面升级,不再单纯考察基础原理,而是转向侧重技术落地和业务结合的综合考察,很多程序员和新手因为缺乏针对性准备,明明技术不错,却在面试中失利。

img

适用人群

在这里插入图片描述

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

7、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐