AI核心概念大串联

1. LLM(Large Language Model)大语言模型

1.1 核心架构

  • Transformer - 内部核心架构
  • 对应论文:Attention Is All You Need

1.2 代表模型

  • OpenAI GPT-3.5 (2023年发布)
  • 被视为AI浪潮的绝对鼻祖

1.3 本质

大模型本质上是数学函数

  • 输入:Question(问题)
  • 输出:Answer(答案)

2. Token(词元)

2.1 定义

LLM处理文本的最小语义单元

2.2 重要性

  1. 计费单位 - 按Token数量收费
  2. 上下文窗口 - 限制模型能处理的Token数量

2.3 Tokenizer(分词器)

人类和大模型之间的中间人,负责编码和解码

编码过程:
  1. 切分 - 将文本切成最小的片段(Token)
  2. 映射 - 将Token映射为Token ID
解码过程:
  • 不需要切分,直接将Token ID还原为文本

2.4 Token ≠ 词

  • Token和词没有一一对应关系
  • 40万Token ≈ 60-80万汉字 ≈ 30万英文单词

3. Context(上下文)

3.1 定义

大模型每次处理任务时所接收到的信息总和

3.2 包含内容

  • 对话历史
  • 用户问题
  • 工具列表
  • 当前输出
  • System Prompt

3.3 上下文窗口(Context Window)

Context能够容纳的最大Token数量

3.4 RAG技术

(Retrieval-Augmented Generation,检索增强生成)


4. Prompt(提示词)

4.1 定义

给LLM的指令

4.2 重要性

Prompt怎么写,直接影响大模型的输出质量

4.3 好的提示词特征

  • 清晰的
  • 具体的
  • 明确的

4.4 Prompt Engineering(提示词工程)

建议:不需要花太多功夫深入研究

4.5 Prompt分类

类型 说明
User Prompt 用户输入的提示
System Prompt 开发者后台设置的提示

5. Tool(工具)

5.1 定义

  • 本质上是函数
  • 标准化的扩展接口
  • 让大模型能够调用外部程序或服务来完成特定任务
  • 突破自身的功能限制

5.2 工作流程示例

场景:查询明天兰州的天气

角色 职责
用户 给出Prompt
大模型 选择工具、归纳总结
天气查询工具 查询天气
平台 串联整个流程

5.3 MCP(Model Context Protocol)

统一的工具接入标准


6. Agent(智能体)

6.1 定义

能够自主感知环境、进行规划决策、并使用工具采取行动,以达成特定目标的智能系统。

核心特征:在没有人类逐步指导的情况下,独立完成复杂的多步骤任务

6.2 五大核心特征

1. 自主感知环境
  • 主动从环境中获取信息
  • 环境可以是数字世界(数据库、API、网页)或物理世界(传感器、摄像头)
2. 进行规划决策
  • 将大目标拆解为可执行的子任务
  • 根据反馈调整计划
  • 区别于普通模型的核心能力
3. 使用工具采取行动
  • 调用搜索引擎、代码解释器、API、数据库等
  • 真正改变外部世界的状态
4. 以达成特定目标为导向
  • 目的是完成任务,而非开放式闲聊
  • 所有行动指向明确的最终目标
5. 无需逐步人类指导
  • 接收到目标后,整个执行过程由自己主导
  • 不需要"先做A,再做B,然后做C"的逐步指令

6.3 反例帮助理解

场景 是否为Agent
"查一下明天上海的天气" → 查完告诉你结果 ❌ 被动响应,不是Agent
"帮我盯着上海工程技术大学所在区域的天气,如果明天下雨,就帮我发一封提醒邮件给她,同时帮我在学校附近订一个可以避雨的咖啡馆,并发给她地址" ✅ Agent:持续监控、判断条件、触发邮件、搜索咖啡馆、预订并发送

6.4 本质升级

从 "你说我做" 的助手 → 升级为 "你定目标,我来完成" 的代理者

6.5 主流Agent工具

  • Codex
  • Claude Code
  • Gemini CLI
  • Cursor
  • Trae(字节跳动)

7. Agent Skill

7.1 定义

封装了特定能力、可被Agent按需调用的标准化功能模块

7.2 作用

  • 定义"能做什么"以及"如何做"
  • 将复杂的任务规划转化为具体、可靠的外部行动

7.3 地位

开发人员的核心工作之一


8. 概念关系图


用户 → Prompt → LLM(大语言模型) ↓ Tokenizer处理 ↓ Context(上下文) ↓ ┌─────┴─────┐ ↓ ↓ 直接回答 调用Tool/Agent Skill ↓ Agent(智能体) ↓ 自主规划 → 使用工具 → 达成目标


9. 总结

概念 一句话理解
LLM 基于Transformer的数学函数,输入问题输出答案
Token LLM处理文本的最小单位,计费和上下文限制的基础
Context 模型处理任务时的全部信息总和
Prompt 给模型的指令,质量决定输出质量
Tool 扩展模型能力的标准化函数接口
MCP 统一的工具接入标准协议
Agent 能自主感知、规划、使用工具完成目标的智能系统
Agent Skill 封装特定能力的标准化功能模块
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐