玩AI、用AI、开发AI,你是不是总被一堆专业术语绕晕?LLM、Token、Context、Agent……每个词单独看似乎都懂,可放在一起就一脸懵,既搞不清它们之间的关联,也摸不透AI的底层运行逻辑?

今天,我们就像一期浓缩版AI底层逻辑视频,不搞复杂公式,不堆晦涩理论,把 LLM、Token、Context、Context Window、Prompt、User Prompt、System Prompt、Tool、MCP、Agent、Agent Skill 这11个核心概念,按“从基础到应用、从底层到上层”的逻辑串联起来,一次性讲透它们的关联,让你看完就能理清AI运行的完整链路,再也不用被术语绑架 🚀

先给大家一个核心逻辑总纲,记好这句话,后面的内容全围绕它展开:LLM是AI的“大脑”,Token是AI的“语言单位”,Context是AI的“记忆”,Context Window是“记忆容量”,Prompt是AI的“指令”,Tool是AI的“手脚”,MCP是AI上下文交互的“规范协议”,Agent是AI的“执行者”,Agent Skill是AI的“专属能力”

一、底层基础:AI的“大脑”与“语言”(LLM + Token)


这两个概念是所有AI功能的根基,没有它们,AI就成了“没有大脑、不会说话”的空壳,也是我们串联所有概念的起点。

1. LLM(大语言模型):AI的“核心大脑”

LLM 全称 Large Language Model,直译就是“大语言模型”,它是整个AI系统的核心,相当于人类的大脑——负责理解你的需求、思考如何回应、生成符合逻辑的内容(文字、代码等)。

简单说,我们平时用的ChatGPT、Claude、文心一言,本质上都是不同的LLM。它的核心能力是“理解语言、生成语言”,而支撑这一能力的,正是下面要讲的Token。

2. Token:AI的“最小语言单位”

Token是LLM能识别和处理的最小“语言碎片”,相当于人类说话的“音节”、写字的“笔画”,但又不完全相同——它不是单个字或单个词,而是AI对语言的专属“拆分单位”。

举个例子:“AI核心概念大串联”这句话,在LLM中可能会拆分成 [AI、核心、概念、大、串联] 这样的Token(不同模型拆分规则略有差异)。LLM处理信息时,不会直接处理完整句子,而是先将句子拆成一个个Token,再通过学习到的规律,对Token进行组合、运算,最终生成新的Token序列——也就是我们看到的AI回应。

关键关联:LLM的所有运算基于Token进行,Token数量越多,LLM需要处理的信息就越多,运算成本也越高——这一点,也和后面要讲的Context Window密切相关。

二、记忆系统:AI的“记性”与“记忆容量”(Context + Context Window)


LLM虽然强大,但本身没有“长期记忆”,就像一个“记性时好时坏的人”,能不能记住你说的话、理解对话上下文,全靠Context和Context Window——这两个概念,直接决定了AI的“理解能力上限”。

1. Context:AI的“当前记忆”

Context直译是“上下文”,但在AI领域,它更准确的定义是“AI当前能感知到的所有信息集合”,相当于AI的“短期记忆”。

比如你和AI对话:“帮我写一篇Java代码,实现用户登录功能”,紧接着又说“给代码加个密码加密逻辑”——这里的“Java代码、用户登录、密码加密”,就共同构成了AI的Context。AI之所以能理解你第二句话是对第一句话的补充,正是因为它能捕捉到Context中的关联信息。

关键关联:Context由一系列Token组成,你输入的每一句话、AI的每一次回应,都会被拆成Token,加入到Context中,供LLM后续思考时调用。
在这里插入图片描述

2. Context Window:AI的“记忆容量上限”

Context Window直译是“上下文窗口”,核心作用是“限制Context的Token总量”,相当于AI的“记忆容量”——就像人类的短期记忆只能记住7±2个信息块,AI的Context Window也有固定的Token上限(比如GPT-4是128k Token,Claude 3 Opus是200k Token)。

一旦Context中的Token数量超过Context Window的上限,AI就会“忘记”最早的信息(类似人类记不住太久之前说的话),这也是为什么有时候你和AI多轮对话后,它会出现“答非所问”——本质是Context超出了它的“记忆容量”。

关键关联:Context Window决定了AI能处理的“上下文长度”,容量越大,AI能记住的信息就越多,越能处理长文本、多轮对话、复杂任务(比如写长篇小说、分析大型数据集)。

三、指令系统:AI的“行动指令”(Prompt + User Prompt + System Prompt)


有了“大脑”(LLM)和“记忆”(Context),AI还需要知道“该做什么”——这就是Prompt的作用。Prompt是AI的“行动指令”,而User Prompt和System Prompt,是Prompt的两个核心分类,分工不同、作用各异。

1. Prompt:AI的“总指令”

Prompt直译是“提示词”,但它的本质是“用户或系统给AI下达的所有指令、提供的所有信息”,是连接人类需求与AI能力的“桥梁”。

简单说,你对AI说的每一句话、输入的每一个需求,都是Prompt。比如“帮我写一篇博客”“解释什么是LLM”“修复这段Java代码的Bug”,这些都是Prompt——它明确告诉AI“要做什么”“怎么做”。

2. User Prompt:用户的“具体需求”

User Prompt就是“用户直接输入的需求指令”,是最常见的Prompt类型,也是我们和AI交互时最常使用的。它的核心特点是“具体、灵活”,完全由用户自主决定,比如:

  • “帮我总结这篇文章的核心观点”
  • “用Python写一个批量处理Excel的脚本”
  • “解释一下Token和Context的区别”

User Prompt是AI行动的“直接触发者”,但它有个局限性——用户可能不知道如何精准描述需求,或者描述不够细致,导致AI生成的结果不符合预期。这时候,就需要System Prompt来“规范”AI的行为。

3. System Prompt:AI的“行为规范”

System Prompt是“系统层面给AI下达的指令”,相当于AI的“行为准则”“角色设定”,它会隐藏在用户看不到的地方,提前规范AI的回应风格、能力边界和思考逻辑。

举个例子:如果给AI设置这样的System Prompt:“你是一名专业的程序员,擅长Java开发,回应时要简洁明了,只讲技术细节,不添加多余的客套话”——那么无论用户输入什么样的User Prompt(比如“帮我写Java代码”“解释Java知识点”),AI都会严格按照这个规范来回应。

关键关联:System Prompt优先级高于User Prompt,它决定了AI的“角色和风格”,User Prompt则决定了AI的“具体任务”;两者结合,才能让AI生成更符合预期的结果。而且,System Prompt和User Prompt都会被拆成Token,加入到Context中,供LLM调用。

四、能力扩展:AI的“手脚”与“连接协议”(Tool + MCP)


LLM本身的能力仅限于“理解和生成语言”,无法直接操作外部工具、处理复杂的多源信息——这时候,Tool和MCP就派上了用场,它们是AI的“能力扩展插件”:Tool是AI的“手脚”,帮AI完成具体操作;MCP则是AI的“连接协议”,帮AI打破数据孤岛,实现与本地、远程资源及工具的无缝交互。

1. Tool:AI的“手脚”

Tool就是“AI可以调用的外部工具”,相当于人类的“手脚”——人类靠手脚做事,AI则靠Tool完成自身无法实现的任务。常见的AI Tool包括:

  • 搜索工具(比如百度、Google):帮AI获取实时信息(LLM本身没有实时数据);
  • 代码执行工具(比如Python解释器):帮AI运行代码、验证代码正确性;
  • 文件处理工具:帮AI读取、编辑Excel、Word、PDF等文件;
  • 数据库工具:帮AI查询、操作数据库。

关键关联:AI不会主动调用Tool,必须通过Prompt指令触发——比如你给AI下达User Prompt:“帮我查询今天的天气,并生成一份天气报告”,AI会判断“自身没有实时天气数据”,随后调用搜索Tool获取天气信息,再结合LLM的能力生成报告。

2. MCP(模型上下文协议):AI上下文交互的“规范协议”

MCP全称Model Context Protocol(模型上下文协议),是Anthropic于2024年11月底推出的一种开放标准,核心定位是统一大型语言模型(LM)与外部数据源、工具之间的通信协议。其主要目的是解决当前AI模型因数据孤岛限制而无法充分发挥潜力的难题,通过标准化设计,让AI应用能够安全访问和操作本地及远程数据,为AI应用提供了“连接万物”的接口。

这里需要明确三个易混淆概念的区别:Function Calling是AI模型调用函数的机制,MCP是实现AI模型与API无缝交互的标准协议,而AI Agent是自主运行的智能系统,会借助Function Calling和MCP分析、执行任务,进而实现特定目标。简单说,MCP就像AI与外部资源交互的“交通规则”,它遵循JSON-RPC 2.0规范,定义了客户端与服务器之间的消息交互标准,同时采用“主机-客户端-服务器-资源”的完整架构,明确各方职责,实现上下文、工具与资源的安全、高效交互与管理。其核心架构分工清晰,具体如下:

MCP的核心架构包含五大组成部分,而非单纯的三大模块,具体定义完全贴合官方及你提供的信息:

  • MCP主机(MCP Hosts):发起请求的LLM应用程序,比如Claude Desktop、IDE或各类AI工具,是整个交互流程的发起者;
  • MCP客户端(MCP Clients):位于主机程序内部,与MCP Server保持1:1的有状态连接,负责路由协议消息、处理功能协商,是主机与服务器之间的“桥梁”;
  • MCP服务器(MCP Servers):为MCP Client提供上下文、工具和Prompt信息,是资源和功能的提供方,独立运行且仅接收必要的上下文信息,确保交互安全隔离;
  • 本地资源(Local Resources):本地计算机中可供MCP Server安全访问的资源,比如本地文件、数据库等;
  • 远程资源(Remote Resources):MCP Server可以连接的远程资源,比如通过API访问的远程数据库、在线工具等。

关键关联:MCP是AI打破数据孤岛、连接外部资源的核心协议,它不仅规范Context的传递与调度,更实现了AI与本地、远程资源的安全交互——既确保Context在主机、客户端、服务器之间安全传递,又能让AI通过MCP无缝调用外部工具、访问各类资源,完美解决数据孤岛问题。同时,MCP与Function Calling、Agent协同工作,Agent借助Function Calling机制,通过MCP协议实现多客户端、多工具、多资源的协同,大幅提升AI处理复杂任务的能力。此外,MCP提供官方文档、客户端及SDK支持,方便开发者集成使用(官方文档:https://modelcontextprotocol.io/introduction;客户端:https://modelcontextprotocol.io/clients;Python SDK:https://github.com/modelcontextprotocol/python-sdk)。

五、执行主体:AI的“执行者”与“专属能力”(Agent + Agent Skill)


有了“大脑”(LLM)、“记忆”(Context+Context Window)、“指令”(Prompt)、“手脚”(Tool)和“核心连接协议”(MCP),最后还需要一个“执行者”,将这些能力整合起来完成复杂任务——这就是Agent,而Agent Skill,就是这个“执行者”的“专属技能”。

1. Agent:AI的“自主执行者”

Agent直译是“智能体”,它是AI的“执行主体”——简单说,Agent就是“具备自主决策能力、能整合所有AI能力、完成复杂任务的独立个体”。

和普通LLM不同,Agent不需要人类一步步下达指令,它能做到:

  • 理解用户的“最终需求”(比如“帮我完成一个Java项目的需求分析+代码开发+测试”);
  • 自主拆解任务(拆分为“需求分析→架构设计→代码开发→测试调试”);
  • 自主调用工具(比如调用搜索工具查询技术文档、调用代码工具编写代码、调用测试工具进行调试);
  • 自主管理Context与资源访问(依托MCP协议,实现上下文的安全传递和本地、远程资源的安全访问,同步任务相关细节,避免遗忘关键信息);
  • 自主调整策略(如果代码报错,会自动排查问题、修改代码,直至任务完成)。

关键关联:Agent是所有核心概念的“整合者”——它以LLM为大脑,以Token为语言单位,以Context和Context Window为记忆,以Prompt为指令,以Tool为手脚,以MCP为核心连接协议,借助Function Calling机制,通过MCP实现与本地、远程资源及工具的无缝交互,完成多客户端、多工具的协同,最终实现“自主处理复杂任务”的目标。我们之前讲的Claude Code,本质上就是一个“专注于编码领域的Agent”,其与外部工具、代码资源的交互,正是基于MCP协议实现的。

2. Agent Skill:Agent的“专属能力”

Agent Skill就是“Agent具备的特定能力”,相当于人类的“专业技能”——不同的Agent拥有不同的Skill,这也决定了它们能完成的任务类型。

举几个例子:

  • 编码Agent(如Claude Code)的Skill:代码生成、Bug修复、代码重构、技术文档编写;
  • 办公Agent的Skill:文件处理、会议纪要生成、邮件回复、日程管理;
  • 数据分析Agent的Skill:数据清洗、图表生成、趋势分析、报告撰写。

关键关联:Agent Skill是Agent的“核心竞争力”,它基于LLM的能力,结合特定领域的知识和Tool训练而成,是Agent的“专属技能”;Agent的Skill越多、越精准,能完成的任务就越复杂、越专业。

六、11个概念大串联:AI运行的完整链路(必看!)


看到这里,相信你对每个概念都有了清晰的理解,现在我们把11个概念串联起来,完整走一遍AI的运行流程,彻底打通底层逻辑:

  1. 用户输入 User Prompt(比如“帮我写一个Java登录接口,并生成测试用例”),系统同时加载预设的 System Prompt(比如“你是专业Java开发者,代码要符合规范,包含注释和测试用例”);
  2. 这两个Prompt被拆成一个个Token,进入Context(AI的短期记忆);同时,MCP 作为核心连接协议,通过“主机-客户端-服务器”架构,调度用户历史对话、Java开发背景知识(长期上下文),并按照协议规范将关键信息注入短期Context,同时支持AI安全访问本地代码资源、远程技术文档,确保上下文与资源的安全、高效传递;
  3. AI的“大脑” LLM 读取Context中的Token,结合System Prompt的规范,理解用户的核心需求,并拆解任务(“先写接口代码→再写测试用例→验证代码正确性”);
  4. LLM判断需要调用外部工具,于是指令 Agent(编码Agent)自主调用 Tool(Java代码执行工具、测试工具);
  5. Agent依靠自身的 Agent Skill(Java代码生成、测试用例编写),结合LLM的逻辑能力,生成接口代码和测试用例,并通过Tool验证代码正确性;
  6. 整个过程中,Context Window 限制着Context的Token总量,确保AI不会遗忘任务细节;MCP则作为标准化连接协议,规范上下文的传递、调度以及AI与本地、远程资源的交互,协调主机、客户端与服务器的协同,打破数据孤岛,确保任务连贯推进;
  7. 最终,Agent将生成的代码、测试用例整合起来,通过LLM生成自然语言回应,返回给用户——整个AI运行流程至此完成。

总结:一句话记住所有关联


最后,用一句话总结11个概念的核心关联,方便你快速记忆、快速回顾:

以LLM为大脑,以Token为语言单位,在Context Window的记忆容量限制下,通过MCP协议打破数据孤岛、规范Context与资源的交互调度,接收User Prompt和System Prompt的指令,依靠Agent结合Function Calling机制、调用Tool、发挥Agent Skill,最终完成用户的需求

其实AI的底层逻辑并不复杂,这些概念看似零散,实则环环相扣、层层递进——从基础的“大脑和语言”(LLM、Token),到“记忆和容量”(Context、Context Window),再到“指令和工具”(Prompt系列、Tool),再到“核心连接协议”(MCP,解决数据孤岛),最后到“执行者和技能”(Agent、Agent Skill),每一个概念都在AI的运行流程中扮演着不可或缺的角色。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

在这里插入图片描述

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐