AI核心概念大串联(适合新手)
·
AI核心概念大串联
1. LLM(Large Language Model)大语言模型
1.1 核心架构
- Transformer - 内部核心架构
- 对应论文:Attention Is All You Need
1.2 代表模型
- OpenAI GPT-3.5 (2023年发布)
- 被视为AI浪潮的绝对鼻祖
1.3 本质
大模型本质上是数学函数
- 输入:Question(问题)
- 输出:Answer(答案)
2. Token(词元)
2.1 定义
LLM处理文本的最小语义单元
2.2 重要性
- 计费单位 - 按Token数量收费
- 上下文窗口 - 限制模型能处理的Token数量
2.3 Tokenizer(分词器)
人类和大模型之间的中间人,负责编码和解码
编码过程:
- 切分 - 将文本切成最小的片段(Token)
- 映射 - 将Token映射为Token ID
解码过程:
- 不需要切分,直接将Token ID还原为文本
2.4 Token ≠ 词
- Token和词没有一一对应关系
- 40万Token ≈ 60-80万汉字 ≈ 30万英文单词
3. Context(上下文)
3.1 定义
大模型每次处理任务时所接收到的信息总和
3.2 包含内容
- 对话历史
- 用户问题
- 工具列表
- 当前输出
- System Prompt
3.3 上下文窗口(Context Window)
Context能够容纳的最大Token数量
3.4 RAG技术
(Retrieval-Augmented Generation,检索增强生成)
4. Prompt(提示词)
4.1 定义
给LLM的指令
4.2 重要性
Prompt怎么写,直接影响大模型的输出质量
4.3 好的提示词特征
- 清晰的
- 具体的
- 明确的
4.4 Prompt Engineering(提示词工程)
建议:不需要花太多功夫深入研究
4.5 Prompt分类
| 类型 | 说明 |
|---|---|
| User Prompt | 用户输入的提示 |
| System Prompt | 开发者后台设置的提示 |
5. Tool(工具)
5.1 定义
- 本质上是函数
- 标准化的扩展接口
- 让大模型能够调用外部程序或服务来完成特定任务
- 突破自身的功能限制
5.2 工作流程示例
场景:查询明天兰州的天气
| 角色 | 职责 |
|---|---|
| 用户 | 给出Prompt |
| 大模型 | 选择工具、归纳总结 |
| 天气查询工具 | 查询天气 |
| 平台 | 串联整个流程 |
5.3 MCP(Model Context Protocol)
统一的工具接入标准
6. Agent(智能体)
6.1 定义
能够自主感知环境、进行规划决策、并使用工具采取行动,以达成特定目标的智能系统。
核心特征:在没有人类逐步指导的情况下,独立完成复杂的多步骤任务
6.2 五大核心特征
1. 自主感知环境
- 主动从环境中获取信息
- 环境可以是数字世界(数据库、API、网页)或物理世界(传感器、摄像头)
2. 进行规划决策
- 将大目标拆解为可执行的子任务
- 根据反馈调整计划
- 区别于普通模型的核心能力
3. 使用工具采取行动
- 调用搜索引擎、代码解释器、API、数据库等
- 真正改变外部世界的状态
4. 以达成特定目标为导向
- 目的是完成任务,而非开放式闲聊
- 所有行动指向明确的最终目标
5. 无需逐步人类指导
- 接收到目标后,整个执行过程由自己主导
- 不需要"先做A,再做B,然后做C"的逐步指令
6.3 反例帮助理解
| 场景 | 是否为Agent |
|---|---|
| "查一下明天上海的天气" → 查完告诉你结果 | ❌ 被动响应,不是Agent |
| "帮我盯着上海工程技术大学所在区域的天气,如果明天下雨,就帮我发一封提醒邮件给她,同时帮我在学校附近订一个可以避雨的咖啡馆,并发给她地址" | ✅ Agent:持续监控、判断条件、触发邮件、搜索咖啡馆、预订并发送 |
6.4 本质升级
从 "你说我做" 的助手 → 升级为 "你定目标,我来完成" 的代理者
6.5 主流Agent工具
- Codex
- Claude Code
- Gemini CLI
- Cursor
- Trae(字节跳动)
7. Agent Skill
7.1 定义
封装了特定能力、可被Agent按需调用的标准化功能模块
7.2 作用
- 定义"能做什么"以及"如何做"
- 将复杂的任务规划转化为具体、可靠的外部行动
7.3 地位
开发人员的核心工作之一
8. 概念关系图
用户 → Prompt → LLM(大语言模型) ↓ Tokenizer处理 ↓ Context(上下文) ↓ ┌─────┴─────┐ ↓ ↓ 直接回答 调用Tool/Agent Skill ↓ Agent(智能体) ↓ 自主规划 → 使用工具 → 达成目标
9. 总结
| 概念 | 一句话理解 |
|---|---|
| LLM | 基于Transformer的数学函数,输入问题输出答案 |
| Token | LLM处理文本的最小单位,计费和上下文限制的基础 |
| Context | 模型处理任务时的全部信息总和 |
| Prompt | 给模型的指令,质量决定输出质量 |
| Tool | 扩展模型能力的标准化函数接口 |
| MCP | 统一的工具接入标准协议 |
| Agent | 能自主感知、规划、使用工具完成目标的智能系统 |
| Agent Skill | 封装特定能力的标准化功能模块 |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)