14个核心概念，小白也能看懂大模型，速收藏！

和老莫一起学AI

354人浏览 · 2026-04-29 11:14:36

和老莫一起学AI · 2026-04-29 11:14:36 发布

| 你有没有过这样的经历：第一次跟做 AI 的朋友聊天，他们嘴里蹦出一个又一个专业术语——“这个模型上下文窗口太小了”、“我们用 RAG 增强”、“要做微调”……你只能点头微笑，心里却在想：这说的都是啥？ |

别慌，你不是一个人。我第一次接触这些概念时，也是一头雾水。后来我发现，这些看似高深的词汇，其实都能用"说人话"的方式理解。今天，我就用最简单的话，帮你把这14 个核心概念串起来。

01基础篇：先搞懂这四个

1. LLM（大语言模型）

LLM，全称 Large Language Model，大语言模型。你可以把它想象成一个**“读了全世界书的超级书呆子”**。它读过海量的文章、书籍、网页，几乎什么都知道一点。

但这个书呆子有个特点：它不是在"查资料"，而是在"预测下一个字"。比如你问"今天天气"，它会根据概率猜下一个字可能是"怎么样"或"很好"。就像你手机输入法的联想功能，只不过它聪明了几亿倍。


📍 实际应用我们常用的 ChatGPT、Claude、文心一言，本质上都是 LLM。写邮件、总结文章、翻译文档、生成代码，都是 LLM 在工作。

2. Token（词元）

Token 是 AI 理解文字的最小单位。中文里，一个汉字通常就是一个 Token；英文里，一个单词可能被拆成几个 Token，比如 “understanding” 可能会被拆成 “under” + “stand” + “ing”。


⚠️为什么要关心 Token？因为 AI 有 Token 限制。比如一个模型说支持 8K Token，意思就是它一次最多能处理 8000 个左右的汉字。超过这个限制，它会"忘掉"前面的内容。

3. Context Window（上下文窗口）

Context Window 是 AI 的**“短期记忆容量”**。假设 Context Window 是 4K Token，那你在对话中发送的所有消息、AI 的所有回复，加起来不能超过 4000 个汉字左右。

现在有些模型已经支持超大的 Context Window，比如 128K、甚至 1M（100万）Token。这意味着你可以把整本书、整个代码库都喂给它。

4. Temperature（温度参数）

Temperature 控制 AI 的**“创意程度”**。范围通常是 0 到 2。0 最确定，回答最稳定；Temperature 高，回答会更有创意、更多变。


🎯什么时候用什么温度？写代码、做翻译 → Temperature 0-0.3（要准确）写小说、头脑风暴 → Temperature 0.7-1.0（要创意）

02进阶篇：让 AI 更聪明的四个法宝

5. RAG（检索增强生成）

RAG 的原理很简单：当你要问问题时，先去**“查资料”**，把相关的内容找出来，然后连同问题一起喂给 AI。


📚类比这就像考试时让你"开卷"，你可以翻书找答案，而不是只能靠记忆。RAG 的好处是：AI 可以基于最新的、特定的知识来回答。

6. Vector Database（向量数据库）

向量数据库让 AI 能**“找得到"相关内容**。向量就是用一串数字来表示一个词、一句话、一篇文章的"含义”。含义相近的内容，向量就相近。

这就像图书馆里不是按书名分类，而是按书的"内容相似度"分类。你要找"关于人工智能的书"，它能给你找出所有主题相近的书。

7. Embedding（嵌入）

Embedding 就是把文字转成向量的过程。它捕捉的是**“语义”**，而不是表面文字。比如"我饿了"和"想吃饭"，字面上完全不同，但意思相近。


✨ 解决的问题以前搜"如何减肥"，你必须含有这几个词；现在用 Embedding，搜"怎么瘦身"、"减肥方法"都能找到相关内容。

8. Fine-tuning（微调）

微调就是在通用模型的基础上，用特定领域的数据再训练一下，让它变成**“专才”**。比如通用的 LLM 可能懂基本的法律知识，但你要让它回答具体的中国法律问题，就需要用法律数据微调。

03Agent 篇：AI 的行动派

9. Agent（智能体）

Agent 是**“行动派”**。它不只是回答你的问题，还能自己规划步骤、调用工具、执行操作、检查结果，像个小秘书一样把事情做完。


📍 举个例子你让普通 LLM “帮我订一张明天去上海的机票”，它只能说"我不会订票"。但 Agent 会分析任务、调用工具、执行操作、反馈结果。Agent 是 AI 从"聊天机器人"走向"真正助手"的关键一步。

10. Tools（工具）

Tool 就是 AI 可以调用的功能，就像人的双手。没有工具，Agent 只能"说话"，不能"做事"。有了工具，它能访问网页、读写文件、发送邮件、查询数据库……

11. Skills（技能）

Skills 是比 Tools 更高层次的概念。如果说 Tool 是"一个工具"，Skill 就是**“一套能力”**。它包含了一整套知识、流程、技巧。


💡Tool vs Skill Tool 可能是"搜索网页" Skill 则是"做市场调研"（包含：确定主题→搜索→整理→生成报告）

12. MCP（Model Context Protocol）

MCP 就像AI 界的 USB 接口。只要数据源或工具支持 MCP，AI 就能直接连接，不用额外开发。这大大降低了 AI 接入外部世界的成本。


✨ 实际场景你想让 AI 读取你的 Notion 笔记。以前可能需要写 API 接口、处理认证、转换数据格式。现在，只要有个 MCP Server 支持 Notion，AI 直接就能连。

13. ACP（Agent Communication Protocol）

ACP 是OpenClaw提出的协议，让不同的 Agent 之间能互相通信和协作。


🤝 协作场景你有个研究 Agent 负责查资料，有个写作 Agent 负责写文章，有个发布 Agent 负责发到公众号。ACP 就是让它们"对上话"的对讲机。

14. Rules（规则）

Rules 是告诉 AI**“什么能做、什么不能做、怎么做”**的约束。它就像给 AI 设的"规矩"，让它的行为符合预期。

✓总结


基础篇 LLM 是 AI 的"大脑"，Token 是它理解的单位，Context Window 是它的记忆容量，Temperature 控制它的创造力。进阶篇 RAG 让 AI 能查资料，Vector Database 帮它找相关内容，Embedding 把文字转成语义向量，Fine-tuning 让它成为领域专家。 Agent 篇 Agent 是能行动的 AI，Tools 是它的手，Skills 是它的能力包，MCP 让它能连接外部世界，ACP 让它能和其他 Agent 协作，Rules 让它的行为符合预期。

基础篇 LLM 是 AI 的"大脑"，Token 是它理解的单位，Context Window 是它的记忆容量，Temperature 控制它的创造力。进阶篇 RAG 让 AI 能查资料，Vector Database 帮它找相关内容，Embedding 把文字转成语义向量，Fine-tuning 让它成为领域专家。 Agent 篇 Agent 是能行动的 AI，Tools 是它的手，Skills 是它的能力包，MCP 让它能连接外部世界，ACP 让它能和其他 Agent 协作，Rules 让它的行为符合预期。