一文看懂:LLM、Memory、RAG、MCP、Skills 与 AI Agent到底是什么?

大家在接触大模型应用开发时,经常会被 Memory、RAG、MCP、Agent 这些专业名词绕晕。其实它们并非孤立的技术,而是一层层叠加,为了让大模型从一个“只会背书的复读机”进化成“懂历史、有知识、会动手的智能体”。
下面我们用最通俗易懂的逻辑,把这些核心概念串讲一遍。
1. 底座基石:LLM(大语言模型)
定义:
大模型本质上就是用来提供推理服务的。你可以把它想象成一个巨大的、装满了参数的大脑。
技术本质:
剥开复杂的外壳,调用大模型其实就是一次 HTTP 网络请求。你发文字过去,它计算后把文字返回给你。
2. 第一层进化:Memory(记忆)
痛点:
大模型天生是“金鱼脑”,它不记得上一句话你说了什么。
解决方案:
每次发起新请求时,系统会把之前全部的聊天记录重新拼接在一起,作为 Prompt 的一部分发给大模型。这份拼接起来的内容就叫上下文。
Memory 机制的分类:
- 短期记忆: 当前会话窗口里最近的几轮对话。
- 长期记忆: 将很久之前的对话压缩成摘要或向量存入数据库。
工作机制:
每次请求时,系统把 长期记忆摘要 + 短期对话记录 拼在一起喂给模型。这套管理上下文存取、拼接、裁剪的机制,就是 Memory。
3. 第二层进化:RAG(检索增强生成)
痛点:
大模型的训练数据是存量且滞后的。如果你问它“今天发生了什么新闻”或者“公司内部最新的报销政策是什么”,它要么胡说八道,要么直接说不知道。
解决方案:
给大模型配一个外部知识库。
核心流程:
- 存: 把外部知识(文档、PDF、网页)切块,转化成向量(一串代表语义的数字),存入向量数据库。
- 检: 用户提问时,先去向量数据库里检索语义最相似的内容片段。
- 答: 把检索到的内容片段连同用户问题一起发给大模型,让它基于资料作答。
关键点:
- 之所以用向量数据库,是因为它不搞死板的字面匹配,而是计算语义距离,能听懂“感冒了”和“着凉了”是一回事。
- RAG = 检索 + 生成。
4. 第三层进化:MCP(模型上下文协议)
痛点:
有了 Memory 和 RAG,大模型变成了“满腹经纶的活字典”,但它依然没有手和脚。它无法帮你发邮件、订机票、操作 Excel。
解决方案:
在对话中约定一种 JSON 格式的暗号。
运作机制:
- 告知工具: 外部服务先告诉大模型:“我现在有
搜索网页、发送邮件这两个工具,参数格式要求是这样…” - 模型决策: 大模型思考后,觉得需要搜索,它不输出最终答案,而是输出一段 特定格式的 JSON 指令:
{"tool": "search_web", "query": "今日天气"} - 执行反馈: 外部程序截获这段 JSON,去执行真正的搜索操作,拿到结果后,再把结果塞回对话记录里发给大模型。
- 最终生成: 大模型看着搜索结果,生成自然语言回复:“今天天气晴,适合出门。”
工程化抽象 —— MCP:
这套“通过结构化消息调用外部工具”的规范,被抽象成了 MCP 协议。
- MCP Host: 负责解析 JSON 和调度工具的中间程序。
- MCP 插件: 具体干活的工具(可以拆分为本地的 Client 和远端的 Server)。
5. 第四层进化:Skills(技能/指南)
痛点:
工具多了,大模型就懵了。它不知道怎么组合工具——是先查天气再订票,还是先订票再查路线?
解决方案:
给大模型一份 操作手册(SOP)。
定义:
Skills 就是一份结构化的场景指南。它明确告诉大模型:
“当你需要做旅行规划时,请务必先用
地图工具查路线,再用天气工具查目的地天气,最后生成表格。注意:时间一定要换算成当地时间。”
Skills vs. Workflow 的核心区别:
- Workflow(工作流): 死板的流程图。A 节点到 B 节点,在设计时就画死了,一旦执行,必须按既定路线走。
- Skills: 由大模型驱动的 Workflow。它只给了指导方针和最佳实践,具体先走哪步、遇到意外怎么绕路,全由大模型根据实时情况灵活决策。Skills 的执行路径不是预设的,而是模型推理出来的。
6. 终极形态:AI Agent(智能体)
把上面所有的零件组装起来:
| 组件 | 赋予的能力 |
|---|---|
| LLM | 大脑,思考与规划 |
| Memory | 记忆力,记住历史 |
| RAG | 知识库,获取新知 |
| MCP | 手和脚,操作工具 |
| Skills | 经验手册,指导做事流程 |
结论:
AI Agent = LLM + Memory + RAG + MCP + Skills
它不再是只会聊天的 Bot,而是一个能自主感知、规划、行动、达成目标的智能工具人。
举例说明:
- 最近很火的 OpenClaw 本质上就是典型的 AI Agent 产品,它的目标是帮你操作电脑完成各种任务。
(ps:尽管AI冲击依旧持续,年初的那篇“如何在人工智能时代找到自己的价值”依然无从解答,但生活推着你走的时候,你也不得不走。整理一些东西出来可以安慰自己也在努力融入了😊)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)