AI核心概念大串联（适合新手）

江来520

740人浏览 · 2026-05-16 19:37:41

江来520 · 2026-05-16 19:37:41 发布

AI核心概念大串联

1. LLM（Large Language Model）大语言模型

1.1 核心架构

Transformer - 内部核心架构
对应论文：Attention Is All You Need

1.2 代表模型

OpenAI GPT-3.5 (2023年发布)
被视为AI浪潮的绝对鼻祖

1.3 本质

大模型本质上是数学函数

输入：Question（问题）

输出：Answer（答案）

2. Token（词元）

2.1 定义

LLM处理文本的最小语义单元

2.2 重要性

计费单位 - 按Token数量收费
上下文窗口 - 限制模型能处理的Token数量

2.3 Tokenizer（分词器）

人类和大模型之间的中间人，负责编码和解码

编码过程：

切分 - 将文本切成最小的片段（Token）
映射 - 将Token映射为Token ID

解码过程：

不需要切分，直接将Token ID还原为文本

2.4 Token ≠ 词

Token和词没有一一对应关系
40万Token ≈ 60-80万汉字 ≈ 30万英文单词

3. Context（上下文）

3.1 定义

大模型每次处理任务时所接收到的信息总和

3.2 包含内容

对话历史
用户问题
工具列表
当前输出
System Prompt

3.3 上下文窗口（Context Window）

Context能够容纳的最大Token数量

3.4 RAG技术

（Retrieval-Augmented Generation，检索增强生成）

4. Prompt（提示词）

4.1 定义

给LLM的指令

4.2 重要性

Prompt怎么写，直接影响大模型的输出质量

4.3 好的提示词特征

清晰的
具体的
明确的

4.4 Prompt Engineering（提示词工程）

建议：不需要花太多功夫深入研究

4.5 Prompt分类

类型	说明
User Prompt	用户输入的提示
System Prompt	开发者后台设置的提示

5. Tool（工具）

5.1 定义

本质上是函数
标准化的扩展接口
让大模型能够调用外部程序或服务来完成特定任务
突破自身的功能限制

5.2 工作流程示例

场景：查询明天兰州的天气

角色	职责
用户	给出Prompt
大模型	选择工具、归纳总结
天气查询工具	查询天气
平台	串联整个流程

5.3 MCP（Model Context Protocol）

统一的工具接入标准

6. Agent（智能体）

6.1 定义

能够自主感知环境、进行规划决策、并使用工具采取行动，以达成特定目标的智能系统。

核心特征：在没有人类逐步指导的情况下，独立完成复杂的多步骤任务

6.2 五大核心特征

1. 自主感知环境

主动从环境中获取信息
环境可以是数字世界（数据库、API、网页）或物理世界（传感器、摄像头）

2. 进行规划决策

将大目标拆解为可执行的子任务
根据反馈调整计划
区别于普通模型的核心能力

3. 使用工具采取行动

调用搜索引擎、代码解释器、API、数据库等
真正改变外部世界的状态

4. 以达成特定目标为导向

目的是完成任务，而非开放式闲聊
所有行动指向明确的最终目标

5. 无需逐步人类指导

接收到目标后，整个执行过程由自己主导
不需要"先做A，再做B，然后做C"的逐步指令

6.3 反例帮助理解

场景	是否为Agent
"查一下明天上海的天气" → 查完告诉你结果	❌ 被动响应，不是Agent
"帮我盯着上海工程技术大学所在区域的天气，如果明天下雨，就帮我发一封提醒邮件给她，同时帮我在学校附近订一个可以避雨的咖啡馆，并发给她地址"	✅ Agent：持续监控、判断条件、触发邮件、搜索咖啡馆、预订并发送

6.4 本质升级

从 "你说我做" 的助手 → 升级为 "你定目标，我来完成" 的代理者

6.5 主流Agent工具

Codex
Claude Code
Gemini CLI
Cursor
Trae（字节跳动）

7. Agent Skill

7.1 定义

封装了特定能力、可被Agent按需调用的标准化功能模块

7.2 作用

定义"能做什么"以及"如何做"
将复杂的任务规划转化为具体、可靠的外部行动

7.3 地位

开发人员的核心工作之一

8. 概念关系图

用户 → Prompt → LLM(大语言模型) ↓ Tokenizer处理 ↓ Context(上下文) ↓ ┌─────┴─────┐ ↓ ↓ 直接回答调用Tool/Agent Skill ↓ Agent(智能体) ↓ 自主规划 → 使用工具 → 达成目标

9. 总结

概念	一句话理解
LLM	基于Transformer的数学函数，输入问题输出答案
Token	LLM处理文本的最小单位，计费和上下文限制的基础
Context	模型处理任务时的全部信息总和
Prompt	给模型的指令，质量决定输出质量
Tool	扩展模型能力的标准化函数接口
MCP	统一的工具接入标准协议
Agent	能自主感知、规划、使用工具完成目标的智能系统
Agent Skill	封装特定能力的标准化功能模块