从LLM到Agent Skill，一文读懂大模型底层逻辑！

程序员王饱饱

399人浏览 · 2026-05-14 21:23:31

程序员王饱饱 · 2026-05-14 21:23:31 发布

本文从工程视角深入剖析AI圈内高频名词，如LLM、Token、Context、Prompt、Tool、MCP、Agent、Agent Skill等，揭示大模型底层运作机制。通过解析Transformer架构、Token编码解码、Context Window、Prompt工程、Tool调用流程、MCP标准协议及Agent自主规划能力，阐述各概念间关联，最终呈现一套完整的AI技术体系框架，帮助读者理解AI产品背后的逻辑与运作原理。

AI 圈子里每天都在冒出各种新名词：

LLM、Token、Context、Prompt、Tool、MCP、Agent、Agent Skill。

这些词你可能都听说过，但如果真的让你准确说出每一个概念的含义，很多人可能会发现：自己只是“听过”，但并没有真正理解。

我们不讲那些虚头巴脑的商业概念，而是从最底层的工程视角出发，把这些概念一个一个拆开、揉碎、讲清楚。

读完之后，你对 AI 系统的理解会更完整，也能看懂很多 AI 产品背后到底是怎么运作的。

先从最底层开始，一层一层往上搭。

最底层的，就是 LLM。

01 LLM：大模型到底是什么？

LLM 的全称是 Large Language Model，翻译成中文就是“大语言模型”，简称“大模型”。

基本上，现在主流的大模型都是基于 Transformer 架构训练出来的。

Transformer 架构看起来非常复杂，但一开始不需要研究它的每一个细节。你只需要知道：大模型的底层引擎，基本就是 Transformer。

Transformer 架构最早由 Google 团队在 2017 年提出，对应的论文叫做：

《Attention Is All You Need》

很有戏剧性的是，虽然 Google 发明了这个火种，但真正把它点燃并引爆全世界的，却是 OpenAI。

2022 年底，GPT-3.5 横空出世。它应该算是第一个真正达到大众可用级别的大模型。相信当时用过的人，都能感受到它的强大。

仅仅几个月之后，2023 年 3 月，GPT-4 发布，它直接把 AI 的能力天花板拉到了一个新的高度。

可以说，GPT 系列是今天这一轮 AI 浪潮的重要起点。

直到现在，GPT 家族依然非常强大。不过，如今的 AI 赛道早已不再是 OpenAI 的独角戏。Claude、Gemini 等优秀模型也在各自擅长的领域与它同台竞技。

那么，大模型到底是怎么工作的？

其实，大模型最底层的生成方式非常朴素：

它本质上就是一个“文字接龙”游戏。

比如你向大模型提问：

Today读什么的文章怎么样？

模型接收到这句话之后，会经过内部的一系列运算，然后预测下一个概率最高的词。

比如它预测下一个词是：

特别

关键点来了：模型吐出“特别”这个词之后，并不会停下来。

它会把刚吐出来的“特别”重新追加到刚才的输入后面，然后拿着这个新的输入继续预测下一个词，比如：

有

接着，它再把“有”塞回去，继续预测下一个词，比如：

帮助

然后它会把“帮助”也追加到输入里面。

等模型判断自己要说的话已经全部说完了，就会输出一个特殊的结束标识符。整个回答到这里才算彻底结束。

这样，我们就拿到了大模型的完整回答：

特别有帮助。

这就是大模型最底层的生成原理。

理解了这一点，你就明白了为什么大模型总是一个词一个词地输出答案，因为它本来就是这么运作的。

02 Token：大模型真正处理的不是文字，而是 Token

刚才我们说，用户提交问题给大模型之后，大模型每次都会吐出一个词。

但严格来说，这只是为了方便理解而简化后的说法。

现实情况是：

大模型本质上是一个庞大的数学函数，内部跑的全是矩阵运算。

它接收的是数字，输出的也是数字。

也就是说，大模型压根不认识人类写的文字。

所以，在人类语言和大模型之间，必须有一个“中间人”来做翻译。

这个中间人就叫：

Tokenizer。

Tokenizer 负责两件事情：

编码和解码。

编码，就是把文字变成数字。

解码，就是把数字还原成文字。

还是拿刚才的例子来说。

用户提问：

Today读什么的文章怎么样？

这句话会先交给 Tokenizer 处理。

Tokenizer 要把这些文字转换成数字，这就是编码环节。

编码过程可以拆成两步。

第一步，切分

Tokenizer 会把用户的问题拆成一个一个最小的片段。

这些片段就叫 Token。

第二步，映射

由于模型只认识数字，Tokenizer 会把每一个 Token 对应到一个数字上去。

这个数字就叫：

Token ID。

Token 和 Token ID 是一一对应绑定的。

Token 是文字，Token ID 是数字。

它们本质上表达的是同一个东西，只是换了一种表示方式。

经过这两步，原来的一句话就变成了一串由 Token ID 组成的列表。

然后 Tokenizer 会把这串列表送进模型。

模型在内部经过一系列运算，最终吐出一个新的 Token ID。

这个时候，Tokenizer 会再次出场，把这个 Token ID 翻译回 Token，这就是解码环节。

解码只有一步，就是映射。

方向和编码相反：把数字转换成文字。

要注意的是，解码环节不需要切分，因为模型每次只会给出一个 Token，并没有什么好切分的。

解码完成后，我们就拿到了大模型输出的第一个 Token。

如果模型的话还没有说完，它就继续吐出第二个、第三个 Token，后面的流程都是一样的。

所以，Token 才是大模型处理文本的最基本单位。

大模型是一个 Token 一个 Token 地接收输入，然后一个 Token 一个 Token 地输出结果。

现在我们回过头看刚才的例子：

Today读什么的文章怎么样？

它可能会被切分成几个 Token。

你可能会发现，有些 Token 好像刚好对应一个词，于是会以为 Token 就是词。

但其实不是。

Token 和词并不是一一对应的关系。

刚才那个例子只是看起来比较接近而已。我们换几个例子就能明白。

比如：

Today读什么技术栏目

如果按照词的标准来理解，可能会觉得它可以切成“Today读什么”“技术”“栏目”。

但在 Tokenizer 里面，它未必会按照我们理解的词来切分。

有些中文词可能会被拆得更细。

比如“程序员”这个词，在中文语境下当然是一个完整的词，但在 Tokenizer 里面，它可能会被切成两个 Token：

程序员

英文也是一样。

对于常见单词来说，一个英文单词经常对应一个 Token，比如 hello 是一个 Token，going 也是一个 Token。

但这也不是铁律。

比如 helpful 这个单词，就可能被拆成：

helpful

甚至在某些情况下，一个字符会被拆成多个 Token 来表示。比如某些特殊符号，可能需要好几个 Token 才能表示出来。

所以可以这样总结：

词和 Token 没有明确的一一对应关系。

你可以把 Token 理解成模型自己学会的一套文本切分规则。

切出来的每一块，就是它一次能够处理的最小单位。

平均来讲，一个 Token 大概等于：

0.75 个英文单词，或者 1.5 到 2 个汉字。

比如 40 万个 Token，大概就是 60 到 80 万个汉字，或者 30 万个英文单词。

理解 Token 很重要。

因为大模型世界里的输入长度、输出长度、上下文窗口、计费方式，很多时候都是围绕 Token 来计算的。

03 Context：大模型所谓的“记忆”从哪里来？

我们刚才讲了 Token，知道了它是大模型处理文本的基本单位。

下面来看一件你可能一直觉得理所当然，但其实很值得思考的事情。

我们平时和大模型聊天时，它好像能记住之前说过的话。

比如你开头告诉它：

我叫小李。

它回复你以后，你再问：

我叫什么？

它还是能够回答出来。

但问题是，大模型本质上只是一个数学函数。

你给它输入，它给你输出。

它不像人一样真的拥有长期记忆。

那它是怎么“记住”之前聊天内容的呢？

答案是：

我们每次给大模型发送消息的时候，并不只发送当前的问题。

背后的程序会自动把你之前的整段对话历史找出来，一起发给模型。

这样一来，模型每次看到的都是完整的对话内容。

它有了用户当前的问题，也有了前面的对话历史，所以它才知道之前发生了什么。

这就引出了 Context 这个概念。

Context 中文叫：

上下文。

它代表大模型每次处理任务时所接收到的信息总和。

用户当前的问题，是 Context 的一部分。

之前的对话历史，也是 Context 的一部分。

除此之外，模型正在输出的每一个 Token，也会被追加进 Context 里面。

另外，Context 里还可能包含工具列表、System Prompt 等信息。

这些概念后面会继续讲。

现在你只需要记住一件事：

Context 就是大模型每次处理任务时接收到的信息总和。

从某种程度上，我们也可以把 Context 看成大模型的一个临时记忆体。

它不是真正的人类记忆，而是模型当前这次任务中能够看到的全部信息。

理解了 Context，下一个问题就很自然地出来了：

这个 Context 能有多大？

它能塞多少 Token？

这就引出了 Context Window，也就是：

上下文窗口。

Context Window 代表 Context 能够容纳的最大 Token 数量。

比如 Context Window 为 1 万，就代表模型最多能够处理 1 万个 Token。

不过，1 万的 Context Window 现在已经算比较小了。

目前主流大模型都有很大的 Context Window。

比如 GPT-5.4 的 Context Window 是 105 万，Gemini 3.1 Pro 的 Context Window 是 100 万，Claude Opus 4.6 的 Context Window 也是 100 万。

我们前面说过，一个 Token 大概等于 1.5 个汉字。

那么 100 万个 Token，差不多就是 150 万个汉字。

这个容量已经非常大了，甚至可以放下非常长的书籍内容。

但这里还有一个现实问题。

假如你有一个上千页的公司产品手册，希望大模型根据这份产品手册回答用户的各种疑问，那要怎么实现？

是不是要把这本手册的全部内容，连同用户问题一起扔给大模型？

这其实不是一个很好的解决方案。

因为产品手册太长，即使模型的 Context Window 不被撑爆，成本也会很高，效率也会很低。

这时候就需要 RAG 技术。

RAG 可以从产品手册中抽取与用户问题最匹配的几个片段，然后只把这几个片段发给大模型，让大模型根据这些片段回答问题。

这样，大模型接收到的就不是一整本书，而可能只是几段关键内容。

这样既不会过度依赖 Context Window，也能大幅降低成本。

04 Prompt：提示词不是玄学，本质是把话说明白

Prompt 中文叫：

提示词。

它是大模型接收的具体问题或指令。

比如你对大模型说：

帮我写一首诗。

这句话就是 Prompt。

不要把 Prompt 想成特别复杂、高端的东西。

它本质上就是给大模型的一个问题，或者一个指令。

大模型接收到这个输入之后，才会开始运转，然后给你一个对应的答案。

但这里有一个问题：

如果你只是简单地说“帮我写一首诗”，大模型可能会给你写古诗，也可能写现代诗，甚至可能写一首打油诗。

为什么？

因为你的 Prompt 太模糊了。

它不知道你具体想要什么。

所以 Prompt 怎么写，会直接影响大模型的输出质量。

一个好的 Prompt 应该是：

清晰、具体、明确。

比如你可以这样写：

请帮我写一首五言绝句，主题是秋天的落叶，风格要悲凉一点。

这样一来，大模型就清楚多了。

它生成的内容也会更符合你的预期。

这就是为什么有一个领域叫 Prompt Engineering，也就是“提示词工程”。

说白了，它研究的就是如何把话说明白，让大模型更精准地理解你的意图。

当然，这个领域虽然曾经很火，但现在单独强调它的人已经少了很多。

一方面是因为门槛并不高，本质上就是把需求表达清楚；另一方面是因为大模型能力越来越强，即使提示词稍微含糊一点，它也能大致猜出你的意图。

不过，Prompt 的基本概念仍然很重要。

事情还没有结束。

我们还需要区分两种不同的 Prompt：

User Prompt 和 System Prompt。

User Prompt 中文叫“用户提示词”，它是用户自己输入的内容，用来说明具体任务。

System Prompt 中文叫“系统提示词”，它通常由开发者在后台配置，用来说明模型的人设和做事规则。

举个例子，假设你要做一个数学辅导机器人，希望它不要直接告诉学生答案，而是引导学生思考。

这时候就需要两种 Prompt 配合。

第一种是 System Prompt。

你可以在后台这样设置：

你是一个耐心的数学老师。当学生问你数学问题的时候，不要直接给出答案，而是要一步一步引导学生思考，帮助他们理解解题思路。

这段话是开发者在后台设置的，用户看不到，但它会一直影响大模型的行为。

然后学生在对话框里输入：

3 加 5 等于几？

这就是 User Prompt，也就是用户直接输入的问题。

大模型看到这两个 Prompt 之后，就会知道：

我的角色是数学老师，我应该引导学生思考，而不是直接说答案。

于是它可能会回答：

我们可以这样想：你手里有 3 个苹果，然后又拿了 5 个，现在一共有多少个呢？你可以数一数看。

如果没有 System Prompt，大模型可能就直接回答“8”。

但因为有了 System Prompt 的约束，它知道自己要扮演一个引导式的老师，所以回答方式就完全不一样了。

这就是 User Prompt 和 System Prompt 的区别。

有了它们的配合，大模型既能守住规则，又能完成用户的具体需求。

05 Tool：大模型如何感知外部世界？

接下来讲 Tool。

我们先说大模型的一个弱点：

它无法天然感知外部环境。

比如你问大模型：

今天上海的天气怎么样？

它可能会说：

抱歉，我无法获取实时天气信息，我的知识库截止到某年某月，无法提供当天的天气数据。

为什么？

因为大模型本质上还是一个文字接龙系统。

它的能力来自训练数据，是根据已有数据预测下一个词。

但它自己没有办法去查天气预报网站，也不能直接拿到实时天气数据。

那该怎么办？

这就需要 Tool。

Tool 翻译成中文就是“工具”。

但工具这个词有时候不太好理解，你可以把它理解成：

函数。

Tool 本质上就是一个函数。

你给它输入，它给你输出。

比如一个天气查询工具，它的输入可能包含两个参数：

城市和日期。

传入之后，它内部会进行一系列操作，比如调用气象局接口。

最后，它会给出一个输出，告诉你对应的天气信息。

有了 Tool，大模型就可以回答天气相关的问题。

我们来看从用户提问到大模型回答的完整流程。

整个流程涉及四个角色：

用户、大模型、天气查询工具，以及平台。

平台是什么？

你可以把平台理解成一个传话筒。

用户、大模型和天气查询工具之间不能直接对话，所以需要平台来负责传递信息。

它本质上就是一段代码，用来负责上传下达。

流程开始时，用户的问题会先发给平台。

平台再把用户的问题转发给大模型。

但发给大模型的不只有用户问题，还有目前可用的工具列表。

比如天气查询工具、计算器工具等等。

大模型收到问题之后，会自己分析：

用户想知道天气，而我没有实时天气数据。

但是工具列表里有一个天气查询工具可以用，那我就调用这个工具。

注意，大模型无法自己调用工具。

它唯一的能力是输出文本。

如果它想调用某个工具，只能借助平台的力量。

所以此时，大模型会生成一个调用天气查询工具的指令。

这个指令里会标明要用的工具名称，以及对应的参数。

平台接收到这个指令后，才会真正调用工具。

也就是说，平台调用了工具背后对应的函数。

调用结束后，平台拿到天气信息，再把这个工具调用结果返回给大模型。

大模型拿到结果之后，会把它整理成一句人话输出给平台，比如：

今天上海天气不错，晴天，温度在 15 度到 25 度之间。

然后平台再把这句话转发给用户。

在这个过程中，每个角色都有自己的职责。

大模型的职责有两个。

第一，选择工具。也就是判断需要调用哪个工具，并生成对应的工具参数。

第二，归纳总结。也就是在拿到工具执行结果后，把结果整理成用户能看懂的回答。

工具的职责，是完成具体动作，比如查询天气。

平台的职责，是串联整个流程，比如告诉模型有哪些工具可用，并根据模型的指令去调用工具。

所以要分清楚：

不是模型自己直接调用工具。

模型能做的只是输出一段文本，告诉平台它想要调用哪个工具。

真正执行工具调用的，还是平台。

最后总结一下：

Tool 的本质，就是给大模型提供一套可以调用的外部能力，让大模型能够感知和影响外部环境。

06 MCP：统一工具接入标准

刚才我们讲了使用工具的完整流程，但这里面有一个工程上的大问题。

平台需要做两件事：

第一，把工具列表传给模型。

第二，能够真正调用工具。

要做到这些，我们首先得把工具接入平台。

只有这样，平台才知道有哪些工具可用、每个工具的用途是什么、参数是什么、调用方法是什么。

问题来了：

每个平台的工具接入规范都不一样。

如果你用的是 ChatGPT，你得按照 OpenAI 的规范接入工具，写一套接入代码。

如果你用的是 Claude，你得按照 Anthropic 的规范接入，再写一套接入代码。

如果你用的是 Gemini，你得按照 Google 的规范接入，然后再写一套。

同一个工具，你可能要写三遍。

因为每个平台的接入标准都不一样，所以 AI 圈子里就有人开始想：

能不能搞一个统一标准？

让所有平台都遵循这个标准。

这样，工具开发者只需要写一次代码，就可以在所有平台上使用。

这就是 MCP 的由来。

MCP 的全称是：

Model Context Protocol。

翻译过来叫：

模型上下文协议。

这个名字听起来有点学术，不太好理解。

你可以直接把它理解成：

一套统一的工具接入标准。

有了 MCP 之后，工具开发者只需要按照 MCP 规范开发一次工具，这个工具就可以被所有支持 MCP 的平台使用。

这就像所有手机都使用 Type-C 接口一样。

接口统一之后，大家都会方便很多。

所以，MCP 的核心作用就是：

统一工具接入方式，让工具不再被绑定到某一个平台。

07 Agent：能自主规划和调用工具的系统

现在我们知道，大模型可以借助工具感知外部世界，而工具又可以通过 MCP 统一接入。

按理说，有了这两个东西，大模型应该已经很强了。

但实际上还差一点。

比如我们让大模型解决一个更复杂的问题：

今天我这里的天气怎么样？如果下雨的话，帮我查一下附近有没有卖雨伞的店。

这个问题就不是一次简单工具调用能解决的。

假设现在有三个工具可用。

第一个是定位工具，负责查询用户所在地区的经纬度。

第二个是天气工具，用来根据经纬度查询天气信息。

第三个是店铺工具，可以根据经纬度查询附近的店铺。

要解决这个问题，模型需要多次调用工具。

从大模型视角来看，整个过程应该是这样的：

首先，模型思考：

用户问的是当前所在地的天气。

要拿到天气信息，必须先知道用户当前位置。

正好这里有定位工具，那就先调用定位工具。

于是，模型发出工具调用指令，让平台调用定位工具，获取用户所在地的经纬度。

平台调用工具后返回结果，比如经度是 -74 度，纬度是 40 度。

接着，模型再次思考：

现在我拿到了位置，下一步需要查询这个位置的天气。

工具列表里有天气工具，那就调用天气工具。

于是，模型再次向平台发出指令，调用天气工具，参数是经度 -74 度，纬度 40 度。

平台调用工具后返回结果：

有雨。

模型再一次思考：

现在发现下雨了，根据用户的要求，如果下雨，还需要帮他找卖雨伞的店。

这里有店铺工具可以调用。

于是，模型再次向平台发出指令，调用店铺工具，搜索雨伞。

平台调用工具后返回结果：

附近 100 米有一家便利店卖伞。

最后，大模型综合所有信息，判断目标已经全部达成，于是给出最终答案。

这个过程已经不再是简单的一次工具调用了。

在这个过程中，大模型需要一步一步思考当前情况，并决定下一步应该做什么。

从某种程度上来说，大模型已经具备了一定的自主规划能力。

我们把这种能够自主规划、自主调用工具、持续工作直到完成用户任务的系统，称为：

Agent。

目前市面上有很多 Agent 产品，比如 Claude Code、Codex、Gemini CLI 等等。

它们使用的 Agent 构建模式也各不相同，比较经典的包括 ReAct、Plan and Execute 等。

不管具体实现方式有什么差异，Agent 的核心都是：

它不只是回答一句话，而是能够拆解任务、规划步骤、调用工具，并持续推进，直到完成目标。

08 Agent Skill：给 Agent 看的说明文档

现在我们知道，Agent 能够自主规划、调用工具、持续工作，直到完成任务。

听起来已经很完美了。

但在实际高频使用中，你很快会遇到一个新痛点。

举个例子，假设你希望大模型成为你出门前的小助手。

每次出门前，都帮你查一下天气，并提醒你带东西。

你肯定有一套自己的出门习惯。比如：

下雨带伞。

光照强带帽子。

空气差带口罩。

风大穿防风外套。

无论如何手机必须带。

不仅如此，你可能还希望它的回答不要太啰嗦，必须按照特定格式输出。

比如先来一句总结，然后再列出要带的物品清单。

如果没有任何预设，你只问一句：

我马上要出门，该带些什么？

Agent 虽然会查天气，但它不知道你的私人规则，也不知道你的格式要求。

它大概率会给你一堆废话，也无法根据你的出门习惯判断应该带什么。

为了得到满意结果，你每次提问时都不得不带上一大串尾巴，把所有规则、格式要求、示例统统塞进 Prompt 里发给它。

如果每次出门都要敲这么一大段要求，显然非常反人类。

这时候，Agent Skill 就该登场了。

Agent Skill 本质上就是你提前写好、塞给 Agent 的一份说明文档。

比如刚刚那个出门场景，我们就可以写成一个 Agent Skill。

它本质上是一个 Markdown 文档，整体结构可以分成两部分。

第一部分：元数据层

它相当于这份说明文档的封面，用来告诉 Agent 这个技能叫什么、负责做什么事情。

这部分至少要有两个属性：

Name 和 Description。

Name 代表 Agent Skill 的名字，比如：

go-out-checklist

Description 代表这个技能的描述，比如：

根据天气情况，为用户生成出门物品清单。

第二部分：指令层

从目标开始，一直到文档结尾，这一大片都可以叫做指令层。

它的格式没有特别严格的要求，只要能把事情向 Agent 说明白就行。

比如在指令层里，可以写清楚：

目标、执行步骤、判断规则、输出格式和示例。

在执行步骤里，可以告诉 Agent：

先调用定位工具，获取经纬度。

然后调用天气工具，获取天气信息。

拿到天气信息之后，根据天气数据结果，按照下方判断规则整理出门需要携带的物品。

最后，严格按照指定输出格式向用户输出最终结果。

判断规则可以写成：

如果下雨，就提醒带伞。

如果光照强，就提醒带帽子。

如果空气质量差，就提醒带口罩。

如果风大，就提醒穿防风外套。

手机永远都要提醒携带。

输出格式可以规定为两段话：

第一段给出一句总结。

第二段列出具体要带的物品清单。

最后，还可以给一个完整示例。

比如用户的问题是：

我马上要出门，帮我看看今天带什么东西。

然后假设定位工具返回一个位置，天气工具返回对应天气数据。

在这种情况下，Agent 必须按照 Skill 中规定的格式输出一份结果。

这就是 Agent Skill 的整体结构。

定义好之后，需要把它存到指定位置。

拿 Claude Code 举例，需要找到用户目录下的：

.claude/skills

存放时有两个规定。

第一，需要在这个目录下新建一个文件夹，并且文件夹名字必须和 Agent Skill 的名字相同。

比如 Agent Skill 叫：

go-out-checklist

那么文件夹也必须叫：

go-out-checklist

第二，进入这个文件夹之后，需要新建一个文件，把刚才的内容全部贴进去。

重点是，这个文件名必须叫：

SKILL.md

其中 SKILL 是大写。

这是 Agent Skill 的硬性规范。

如果随便起一个名字，系统是不会识别的。

保存之后，这个 Agent Skill 就创建完成了。

当启动 Claude Code 时，它会发现 skills 文件夹里多了一个叫 go-out-checklist 的 Agent Skill，于是读取对应的 SKILL.md 文件。

这里有一个细节：

启动时，它通常会先读取元数据层，也就是名称和描述。

下面完整的指令层不一定马上读取，因为指令层内容可能比较大。

只有当用户的问题和某个 Agent Skill 的名称、描述相关时，系统才会进一步读取对应的完整指令层。

这就是 Agent Skill 的渐进式披露机制，可以节省很多 Token。

比如用户输入：

我要出门了，告诉我带什么。

系统发现这个问题与 go-out-checklist 相关，就会读取这个 Agent Skill 的完整内容。

随后，Agent 会按照 Skill 的要求做事：

先调用定位工具，再调用天气工具，最后根据规则整理答案，并按照指定格式输出给用户。

所以，Agent Skill 的基本功能其实很简单：

它就是一个文档，一个给 Agent 看的说明文档。

当然，Agent Skill 还有很多高级功能，比如运行代码、引用资源等等。

但从最基本的角度看，它的核心作用就是：

把一套固定规则、流程和格式提前写好，让 Agent 在需要的时候自动读取并执行。

09 总结：这些概念之间到底是什么关系？

到这里，我们已经把这些核心概念都讲了一遍。

最后再把整个体系串起来。

LLM 代表大语言模型，它是当前 AI 技术体系的核心。

Token 是大模型处理数据的最基本单位。

Context 是大模型每次处理任务时接收到的信息总和，可以把它看作大模型的临时记忆体。

Context 里面装着历史记录、系统规则、当前输入，以及模型正在生成的内容，而这些数据的基本单位都是 Token。

Context Window 则代表大模型最多能够容纳多少 Token。

Prompt 是用户或系统给大模型下达的具体指令或问题。

它分为 User Prompt 和 System Prompt 两大类。

User Prompt 是用户给模型的输入。

System Prompt 是开发者在后台配置的大模型人设和做事规则。

Tool 是大模型用来感知和影响外部环境的函数。

MCP 是统一工具接入格式的标准协议。

有了 MCP，开发者只需要按照一个标准来做工具，不需要为每个大模型平台都重新做一遍。

Agent 是能够自主规划、自主调用工具，并持续运作直到解决用户问题的系统。

Agent Skill 是给 Agent 看的说明文档，主要用来规定做事步骤、判断规则和输出格式。

把这些概念放在一起，你就能看懂今天很多 AI 产品背后的运行逻辑。

无论是 Claude Code、Codex、各种 AI 编程助手，还是越来越多的自动化 Agent 产品，本质上都在这个框架下运作：

大模型负责理解和生成。

Token 是它处理信息的基本单位。

Context 是它当前能看到的全部信息。

Prompt 告诉它要做什么。

Tool 给它外部能力。

MCP 统一工具接入方式。

Agent 让它能够连续规划和执行。

Agent Skill 则把固定经验和流程沉淀成可复用的说明文档。

理解了这套体系，再看到 AI 圈子里各种新产品、新技术，就不会只觉得眼花缭乱了。

你会发现，它们大多不是凭空冒出来的新东西，而是在这几个基础概念上不断组合、扩展和工程化。

最后

我在一线科技企业深耕十二载，见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200% ，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

在这里插入图片描述

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

在这里插入图片描述

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【轴承故障诊断】一种用于轴承故障诊断的稀疏贝叶斯学习（SBL），两种群稀疏学习算法来提取故障脉冲，第一种仅利用故障脉冲的群稀疏性，第二种则利用故障脉冲的额外周期性行为（Matlab代码实现）

在强背景噪声和/或多重干扰下提取故障脉冲是轴承故障诊断的一项具有挑战性的任务。稀疏表示已被广泛应用于提取故障脉冲，并且能够实现最先进的性能。然而，大多数当前的方法依赖于精心调整多个超参数，并且由于近似正则化和/或启发式稀疏模型可能会遭受算法退化的可能性。为了克服这些缺点，本文提出了一种用于轴承故障诊断的稀疏贝叶斯学习（SBL）框架，然后提出了两种群稀疏学习算法来提取故障脉冲，其中第一种仅利用故障脉

AtomGit开源社区

基于模型预测控制的波浪能转换器（WEC）研究（Matlab代码实现）

本文模拟从波浪能转换器（WEC）中提取的能量，当受控移动窗口阻塞 MPC 时，单设备。它还比较了使用标准MPC和GPC控制时WEC提取的能量。摘要：海浪能是可再生能源最集中的来源之一。然而，到目前为止，它还没有达到商业化所需的经济可行性。为了提高波浪能转换器的效率，已经提出了几种先进的控制策略，包括模型预测控制（MPC）。然而，每个优化问题的计算负担都是传统（全自由度）MPC的缺点，这通常会