一文看懂：LLM、Memory、RAG、MCP、Skills 与 AI Agent到底是什么？

weixin_44943030

508人浏览 · 2026-04-13 22:33:21

weixin_44943030 · 2026-04-13 22:33:21 发布

在这里插入图片描述

大家在接触大模型应用开发时，经常会被 Memory、RAG、MCP、Agent 这些专业名词绕晕。其实它们并非孤立的技术，而是一层层叠加，为了让大模型从一个“只会背书的复读机”进化成“懂历史、有知识、会动手的智能体”。

下面我们用最通俗易懂的逻辑，把这些核心概念串讲一遍。

1. 底座基石：LLM（大语言模型）

定义：
大模型本质上就是用来提供推理服务的。你可以把它想象成一个巨大的、装满了参数的大脑。

技术本质：
剥开复杂的外壳，调用大模型其实就是一次 HTTP 网络请求。你发文字过去，它计算后把文字返回给你。

2. 第一层进化：Memory（记忆）

痛点：
大模型天生是“金鱼脑”，它不记得上一句话你说了什么。

解决方案：
每次发起新请求时，系统会把之前全部的聊天记录重新拼接在一起，作为 Prompt 的一部分发给大模型。这份拼接起来的内容就叫上下文。

Memory 机制的分类：

短期记忆： 当前会话窗口里最近的几轮对话。
长期记忆： 将很久之前的对话压缩成摘要或向量存入数据库。

工作机制：
每次请求时，系统把 长期记忆摘要 + 短期对话记录 拼在一起喂给模型。这套管理上下文存取、拼接、裁剪的机制，就是 Memory。

3. 第二层进化：RAG（检索增强生成）

痛点：
大模型的训练数据是存量且滞后的。如果你问它“今天发生了什么新闻”或者“公司内部最新的报销政策是什么”，它要么胡说八道，要么直接说不知道。

解决方案：
给大模型配一个外部知识库。

核心流程：

存：把外部知识（文档、PDF、网页）切块，转化成向量（一串代表语义的数字），存入向量数据库。
检：用户提问时，先去向量数据库里检索语义最相似的内容片段。
答：把检索到的内容片段连同用户问题一起发给大模型，让它基于资料作答。

关键点：

之所以用向量数据库，是因为它不搞死板的字面匹配，而是计算语义距离，能听懂“感冒了”和“着凉了”是一回事。
RAG = 检索 + 生成。

4. 第三层进化：MCP（模型上下文协议）

痛点：
有了 Memory 和 RAG，大模型变成了“满腹经纶的活字典”，但它依然没有手和脚。它无法帮你发邮件、订机票、操作 Excel。

解决方案：
在对话中约定一种 JSON 格式的暗号。

运作机制：

告知工具： 外部服务先告诉大模型：“我现在有 搜索网页、发送邮件 这两个工具，参数格式要求是这样…”
模型决策： 大模型思考后，觉得需要搜索，它不输出最终答案，而是输出一段 特定格式的 JSON 指令：{"tool": "search_web", "query": "今日天气"}
执行反馈： 外部程序截获这段 JSON，去执行真正的搜索操作，拿到结果后，再把结果塞回对话记录里发给大模型。
最终生成： 大模型看着搜索结果，生成自然语言回复：“今天天气晴，适合出门。”

工程化抽象 —— MCP：
这套“通过结构化消息调用外部工具”的规范，被抽象成了 MCP 协议。

MCP Host： 负责解析 JSON 和调度工具的中间程序。
MCP 插件： 具体干活的工具（可以拆分为本地的 Client 和远端的 Server）。

5. 第四层进化：Skills（技能/指南）

痛点：
工具多了，大模型就懵了。它不知道怎么组合工具——是先查天气再订票，还是先订票再查路线？

解决方案：
给大模型一份 操作手册（SOP）。

定义：
Skills 就是一份结构化的场景指南。它明确告诉大模型：

“当你需要做旅行规划时，请务必先用 地图工具 查路线，再用 天气工具 查目的地天气，最后生成表格。注意：时间一定要换算成当地时间。”

Skills vs. Workflow 的核心区别：

Workflow（工作流）： 死板的流程图。A 节点到 B 节点，在设计时就画死了，一旦执行，必须按既定路线走。
Skills： 由大模型驱动的 Workflow。它只给了指导方针和最佳实践，具体先走哪步、遇到意外怎么绕路，全由大模型根据实时情况灵活决策。Skills 的执行路径不是预设的，而是模型推理出来的。

6. 终极形态：AI Agent（智能体）

把上面所有的零件组装起来：

组件	赋予的能力
LLM	大脑，思考与规划
Memory	记忆力，记住历史
RAG	知识库，获取新知
MCP	手和脚，操作工具
Skills	经验手册，指导做事流程

结论：
AI Agent = LLM + Memory + RAG + MCP + Skills

它不再是只会聊天的 Bot，而是一个能自主感知、规划、行动、达成目标的智能工具人。

举例说明：

最近很火的 OpenClaw 本质上就是典型的 AI Agent 产品，它的目标是帮你操作电脑完成各种任务。

（ps：尽管AI冲击依旧持续，年初的那篇“如何在人工智能时代找到自己的价值”依然无从解答，但生活推着你走的时候，你也不得不走。整理一些东西出来可以安慰自己也在努力融入了😊）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

[Dify x EdgeOne] 哄睡童话机——用 Dify + EdgeOne Pages 给娃造一个会现挂的 AI 睡前故事神器

AtomGit开源社区

PP-OCRv5 ONNX部署但使用OnnxOCR

AtomGit开源社区

MCP（Model Context Protocol）技术深度解析：AI Agent的标准化接口革命

AI技术的发展路径清晰展现了从对话机器人(Chatbot)→辅助决策助手(Copilot)→自主执行Agent的演进轨迹。随着AI在任务中参与度的不断提升，对**丰富的任务上下文(Context)和执行行动所需的工具(Tool)**的需求也日益增长。平台依赖性强：OpenAI、Google等不同LLM平台的Function Call API实现差异巨大开发耦合度高：工具开发者需要深入了解Agent