收藏必备！小白程序员轻松看懂AI底层逻辑（LLM、Token、Agent全解析）

ai绘画-安安妮

905人浏览 · 2026-03-19 10:38:25

ai绘画-安安妮 · 2026-03-19 10:38:25 发布

玩AI、用AI、开发AI，你是不是总被一堆专业术语绕晕？LLM、Token、Context、Agent……每个词单独看似乎都懂，可放在一起就一脸懵，既搞不清它们之间的关联，也摸不透AI的底层运行逻辑？

今天，我们就像一期浓缩版AI底层逻辑视频，不搞复杂公式，不堆晦涩理论，把 LLM、Token、Context、Context Window、Prompt、User Prompt、System Prompt、Tool、MCP、Agent、Agent Skill 这11个核心概念，按“从基础到应用、从底层到上层”的逻辑串联起来，一次性讲透它们的关联，让你看完就能理清AI运行的完整链路，再也不用被术语绑架 🚀

先给大家一个核心逻辑总纲，记好这句话，后面的内容全围绕它展开：LLM是AI的“大脑”，Token是AI的“语言单位”，Context是AI的“记忆”，Context Window是“记忆容量”，Prompt是AI的“指令”，Tool是AI的“手脚”，MCP是AI上下文交互的“规范协议”，Agent是AI的“执行者”，Agent Skill是AI的“专属能力”。

一、底层基础：AI的“大脑”与“语言”（LLM + Token）

这两个概念是所有AI功能的根基，没有它们，AI就成了“没有大脑、不会说话”的空壳，也是我们串联所有概念的起点。

1. LLM（大语言模型）：AI的“核心大脑”

LLM 全称 Large Language Model，直译就是“大语言模型”，它是整个AI系统的核心，相当于人类的大脑——负责理解你的需求、思考如何回应、生成符合逻辑的内容（文字、代码等）。

简单说，我们平时用的ChatGPT、Claude、文心一言，本质上都是不同的LLM。它的核心能力是“理解语言、生成语言”，而支撑这一能力的，正是下面要讲的Token。

2. Token：AI的“最小语言单位”

Token是LLM能识别和处理的最小“语言碎片”，相当于人类说话的“音节”、写字的“笔画”，但又不完全相同——它不是单个字或单个词，而是AI对语言的专属“拆分单位”。

举个例子：“AI核心概念大串联”这句话，在LLM中可能会拆分成 [AI、核心、概念、大、串联] 这样的Token（不同模型拆分规则略有差异）。LLM处理信息时，不会直接处理完整句子，而是先将句子拆成一个个Token，再通过学习到的规律，对Token进行组合、运算，最终生成新的Token序列——也就是我们看到的AI回应。

关键关联：LLM的所有运算都基于Token进行，Token数量越多，LLM需要处理的信息就越多，运算成本也越高——这一点，也和后面要讲的Context Window密切相关。

二、记忆系统：AI的“记性”与“记忆容量”（Context + Context Window）

LLM虽然强大，但本身没有“长期记忆”，就像一个“记性时好时坏的人”，能不能记住你说的话、理解对话上下文，全靠Context和Context Window——这两个概念，直接决定了AI的“理解能力上限”。

1. Context：AI的“当前记忆”

Context直译是“上下文”，但在AI领域，它更准确的定义是“AI当前能感知到的所有信息集合”，相当于AI的“短期记忆”。

比如你和AI对话：“帮我写一篇Java代码，实现用户登录功能”，紧接着又说“给代码加个密码加密逻辑”——这里的“Java代码、用户登录、密码加密”，就共同构成了AI的Context。AI之所以能理解你第二句话是对第一句话的补充，正是因为它能捕捉到Context中的关联信息。

关键关联：Context由一系列Token组成，你输入的每一句话、AI的每一次回应，都会被拆成Token，加入到Context中，供LLM后续思考时调用。
在这里插入图片描述

2. Context Window：AI的“记忆容量上限”

Context Window直译是“上下文窗口”，核心作用是“限制Context的Token总量”，相当于AI的“记忆容量”——就像人类的短期记忆只能记住7±2个信息块，AI的Context Window也有固定的Token上限（比如GPT-4是128k Token，Claude 3 Opus是200k Token）。

一旦Context中的Token数量超过Context Window的上限，AI就会“忘记”最早的信息（类似人类记不住太久之前说的话），这也是为什么有时候你和AI多轮对话后，它会出现“答非所问”——本质是Context超出了它的“记忆容量”。

关键关联：Context Window决定了AI能处理的“上下文长度”，容量越大，AI能记住的信息就越多，越能处理长文本、多轮对话、复杂任务（比如写长篇小说、分析大型数据集）。

三、指令系统：AI的“行动指令”（Prompt + User Prompt + System Prompt）

有了“大脑”（LLM）和“记忆”（Context），AI还需要知道“该做什么”——这就是Prompt的作用。Prompt是AI的“行动指令”，而User Prompt和System Prompt，是Prompt的两个核心分类，分工不同、作用各异。

1. Prompt：AI的“总指令”

Prompt直译是“提示词”，但它的本质是“用户或系统给AI下达的所有指令、提供的所有信息”，是连接人类需求与AI能力的“桥梁”。

简单说，你对AI说的每一句话、输入的每一个需求，都是Prompt。比如“帮我写一篇博客”“解释什么是LLM”“修复这段Java代码的Bug”，这些都是Prompt——它明确告诉AI“要做什么”“怎么做”。

2. User Prompt：用户的“具体需求”

User Prompt就是“用户直接输入的需求指令”，是最常见的Prompt类型，也是我们和AI交互时最常使用的。它的核心特点是“具体、灵活”，完全由用户自主决定，比如：

“帮我总结这篇文章的核心观点”
“用Python写一个批量处理Excel的脚本”
“解释一下Token和Context的区别”

User Prompt是AI行动的“直接触发者”，但它有个局限性——用户可能不知道如何精准描述需求，或者描述不够细致，导致AI生成的结果不符合预期。这时候，就需要System Prompt来“规范”AI的行为。

3. System Prompt：AI的“行为规范”

System Prompt是“系统层面给AI下达的指令”，相当于AI的“行为准则”“角色设定”，它会隐藏在用户看不到的地方，提前规范AI的回应风格、能力边界和思考逻辑。

举个例子：如果给AI设置这样的System Prompt：“你是一名专业的程序员，擅长Java开发，回应时要简洁明了，只讲技术细节，不添加多余的客套话”——那么无论用户输入什么样的User Prompt（比如“帮我写Java代码”“解释Java知识点”），AI都会严格按照这个规范来回应。

关键关联：System Prompt的优先级高于User Prompt，它决定了AI的“角色和风格”，User Prompt则决定了AI的“具体任务”；两者结合，才能让AI生成更符合预期的结果。而且，System Prompt和User Prompt都会被拆成Token，加入到Context中，供LLM调用。

四、能力扩展：AI的“手脚”与“连接协议”（Tool + MCP）

LLM本身的能力仅限于“理解和生成语言”，无法直接操作外部工具、处理复杂的多源信息——这时候，Tool和MCP就派上了用场，它们是AI的“能力扩展插件”：Tool是AI的“手脚”，帮AI完成具体操作；MCP则是AI的“连接协议”，帮AI打破数据孤岛，实现与本地、远程资源及工具的无缝交互。

1. Tool：AI的“手脚”

Tool就是“AI可以调用的外部工具”，相当于人类的“手脚”——人类靠手脚做事，AI则靠Tool完成自身无法实现的任务。常见的AI Tool包括：

搜索工具（比如百度、Google）：帮AI获取实时信息（LLM本身没有实时数据）；
代码执行工具（比如Python解释器）：帮AI运行代码、验证代码正确性；
文件处理工具：帮AI读取、编辑Excel、Word、PDF等文件；
数据库工具：帮AI查询、操作数据库。

关键关联：AI不会主动调用Tool，必须通过Prompt指令触发——比如你给AI下达User Prompt：“帮我查询今天的天气，并生成一份天气报告”，AI会判断“自身没有实时天气数据”，随后调用搜索Tool获取天气信息，再结合LLM的能力生成报告。

2. MCP（模型上下文协议）：AI上下文交互的“规范协议”

MCP全称Model Context Protocol（模型上下文协议），是Anthropic于2024年11月底推出的一种开放标准，核心定位是统一大型语言模型（LM）与外部数据源、工具之间的通信协议。其主要目的是解决当前AI模型因数据孤岛限制而无法充分发挥潜力的难题，通过标准化设计，让AI应用能够安全访问和操作本地及远程数据，为AI应用提供了“连接万物”的接口。

这里需要明确三个易混淆概念的区别：Function Calling是AI模型调用函数的机制，MCP是实现AI模型与API无缝交互的标准协议，而AI Agent是自主运行的智能系统，会借助Function Calling和MCP分析、执行任务，进而实现特定目标。简单说，MCP就像AI与外部资源交互的“交通规则”，它遵循JSON-RPC 2.0规范，定义了客户端与服务器之间的消息交互标准，同时采用“主机-客户端-服务器-资源”的完整架构，明确各方职责，实现上下文、工具与资源的安全、高效交互与管理。其核心架构分工清晰，具体如下：

MCP的核心架构包含五大组成部分，而非单纯的三大模块，具体定义完全贴合官方及你提供的信息：

MCP主机（MCP Hosts）：发起请求的LLM应用程序，比如Claude Desktop、IDE或各类AI工具，是整个交互流程的发起者；
MCP客户端（MCP Clients）：位于主机程序内部，与MCP Server保持1:1的有状态连接，负责路由协议消息、处理功能协商，是主机与服务器之间的“桥梁”；
MCP服务器（MCP Servers）：为MCP Client提供上下文、工具和Prompt信息，是资源和功能的提供方，独立运行且仅接收必要的上下文信息，确保交互安全隔离；
本地资源（Local Resources）：本地计算机中可供MCP Server安全访问的资源，比如本地文件、数据库等；
远程资源（Remote Resources）：MCP Server可以连接的远程资源，比如通过API访问的远程数据库、在线工具等。

关键关联：MCP是AI打破数据孤岛、连接外部资源的核心协议，它不仅规范Context的传递与调度，更实现了AI与本地、远程资源的安全交互——既确保Context在主机、客户端、服务器之间安全传递，又能让AI通过MCP无缝调用外部工具、访问各类资源，完美解决数据孤岛问题。同时，MCP与Function Calling、Agent协同工作，Agent借助Function Calling机制，通过MCP协议实现多客户端、多工具、多资源的协同，大幅提升AI处理复杂任务的能力。此外，MCP提供官方文档、客户端及SDK支持，方便开发者集成使用（官方文档：https://modelcontextprotocol.io/introduction；客户端：https://modelcontextprotocol.io/clients；Python SDK：https://github.com/modelcontextprotocol/python-sdk）。

五、执行主体：AI的“执行者”与“专属能力”（Agent + Agent Skill）

有了“大脑”（LLM）、“记忆”（Context+Context Window）、“指令”（Prompt）、“手脚”（Tool）和“核心连接协议”（MCP），最后还需要一个“执行者”，将这些能力整合起来完成复杂任务——这就是Agent，而Agent Skill，就是这个“执行者”的“专属技能”。

1. Agent：AI的“自主执行者”

Agent直译是“智能体”，它是AI的“执行主体”——简单说，Agent就是“具备自主决策能力、能整合所有AI能力、完成复杂任务的独立个体”。

和普通LLM不同，Agent不需要人类一步步下达指令，它能做到：

理解用户的“最终需求”（比如“帮我完成一个Java项目的需求分析+代码开发+测试”）；
自主拆解任务（拆分为“需求分析→架构设计→代码开发→测试调试”）；
自主调用工具（比如调用搜索工具查询技术文档、调用代码工具编写代码、调用测试工具进行调试）；
自主管理Context与资源访问（依托MCP协议，实现上下文的安全传递和本地、远程资源的安全访问，同步任务相关细节，避免遗忘关键信息）；
自主调整策略（如果代码报错，会自动排查问题、修改代码，直至任务完成）。

关键关联：Agent是所有核心概念的“整合者”——它以LLM为大脑，以Token为语言单位，以Context和Context Window为记忆，以Prompt为指令，以Tool为手脚，以MCP为核心连接协议，借助Function Calling机制，通过MCP实现与本地、远程资源及工具的无缝交互，完成多客户端、多工具的协同，最终实现“自主处理复杂任务”的目标。我们之前讲的Claude Code，本质上就是一个“专注于编码领域的Agent”，其与外部工具、代码资源的交互，正是基于MCP协议实现的。

2. Agent Skill：Agent的“专属能力”

Agent Skill就是“Agent具备的特定能力”，相当于人类的“专业技能”——不同的Agent拥有不同的Skill，这也决定了它们能完成的任务类型。

举几个例子：

编码Agent（如Claude Code）的Skill：代码生成、Bug修复、代码重构、技术文档编写；
办公Agent的Skill：文件处理、会议纪要生成、邮件回复、日程管理；
数据分析Agent的Skill：数据清洗、图表生成、趋势分析、报告撰写。

关键关联：Agent Skill是Agent的“核心竞争力”，它基于LLM的能力，结合特定领域的知识和Tool训练而成，是Agent的“专属技能”；Agent的Skill越多、越精准，能完成的任务就越复杂、越专业。

六、11个概念大串联：AI运行的完整链路（必看！）

看到这里，相信你对每个概念都有了清晰的理解，现在我们把11个概念串联起来，完整走一遍AI的运行流程，彻底打通底层逻辑：

用户输入 User Prompt（比如“帮我写一个Java登录接口，并生成测试用例”），系统同时加载预设的 System Prompt（比如“你是专业Java开发者，代码要符合规范，包含注释和测试用例”）；
这两个Prompt被拆成一个个Token，进入Context（AI的短期记忆）；同时，MCP 作为核心连接协议，通过“主机-客户端-服务器”架构，调度用户历史对话、Java开发背景知识（长期上下文），并按照协议规范将关键信息注入短期Context，同时支持AI安全访问本地代码资源、远程技术文档，确保上下文与资源的安全、高效传递；
AI的“大脑” LLM 读取Context中的Token，结合System Prompt的规范，理解用户的核心需求，并拆解任务（“先写接口代码→再写测试用例→验证代码正确性”）；
LLM判断需要调用外部工具，于是指令 Agent（编码Agent）自主调用 Tool（Java代码执行工具、测试工具）；
Agent依靠自身的 Agent Skill（Java代码生成、测试用例编写），结合LLM的逻辑能力，生成接口代码和测试用例，并通过Tool验证代码正确性；
整个过程中，Context Window 限制着Context的Token总量，确保AI不会遗忘任务细节；MCP则作为标准化连接协议，规范上下文的传递、调度以及AI与本地、远程资源的交互，协调主机、客户端与服务器的协同，打破数据孤岛，确保任务连贯推进；
最终，Agent将生成的代码、测试用例整合起来，通过LLM生成自然语言回应，返回给用户——整个AI运行流程至此完成。

总结：一句话记住所有关联

最后，用一句话总结11个概念的核心关联，方便你快速记忆、快速回顾：

以LLM为大脑，以Token为语言单位，在Context Window的记忆容量限制下，通过MCP协议打破数据孤岛、规范Context与资源的交互调度，接收User Prompt和System Prompt的指令，依靠Agent结合Function Calling机制、调用Tool、发挥Agent Skill，最终完成用户的需求。

其实AI的底层逻辑并不复杂，这些概念看似零散，实则环环相扣、层层递进——从基础的“大脑和语言”（LLM、Token），到“记忆和容量”（Context、Context Window），再到“指令和工具”（Prompt系列、Tool），再到“核心连接协议”（MCP，解决数据孤岛），最后到“执行者和技能”（Agent、Agent Skill），每一个概念都在AI的运行流程中扮演着不可或缺的角色。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

在这里插入图片描述

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

山东大学创新实训个人纪实（5）——降低对话延迟调研

AtomGit开源社区

AI Agent Harness Engineering 增长策略：从免费试用到底价付费的4步转化漏斗

在讨论增长策略前，必须先厘清本文涉及的三个核心术语——零散Agent（Loose Agent）增长Harness（Growth Harness）零散Agent：指独立部署、功能单一的AI工具，如通用代码生成Agent、文本摘要Agent，缺乏与业务增长逻辑绑定的设计，通常由OpenAI Function Calling或LangChain简单搭建，决策链短、交互深度浅、留存率低。增长Harness