AI的七层关系 —— 从“文字米粒“到“全能管家“的完整架构
一句话总结:你说出提示词,交给 Agent 大管家;所有沟通内容拆成 Token 记录,全部存入上下文备忘录;Harness 家规全程约束管家行为,不乱干活;管家通过 MCP 联络中枢,外接各类资源;再调用自身的 Skills 技能,一步步自主完成你交代的所有任务。
一、七层架构总览(由下至上)
┌─────────────────────────────────────────┐
│ 第7层 │ Skills │ 可复用的能力与经验 │
├─────────────────────────────────────────┤
│ 第6层 │ MCP │ 连接与扩展的协议层 │
├─────────────────────────────────────────┤
│ 第5层 │ Harness │ 编排与运行的工程框架 │
├─────────────────────────────────────────┤
│ 第4层 │ Agent │ 自主决策与执行的智能体│
├─────────────────────────────────────────┤
│ 第3层 │ 上下文 │ 提供相关背景信息 │
├─────────────────────────────────────────┤
│ 第2层 │ 提示词 │ 告诉模型要做什么 │
├─────────────────────────────────────────┤
│ 第1层 │ Token │ 模型理解的最小单位 │
└─────────────────────────────────────────┘
二、逐层详解与类比
第1层:Token = 文字最小颗粒(文字米粒)
定义:所有对话、指令、资料,都会被拆成一粒粒「文字米粒」。不管是人说话还是 AI 回复,都靠一粒粒 Token 承载,也是计量工作量的最小单位。
类比理解:
- 🍚 文字米粒:就像一碗米饭由无数米粒组成,任何一段话都由无数 Token 组成。
- 📏 计量单位:就像装修按"平方米"计费,AI 服务按 "Token 数" 计费。
- 🧩 乐高积木:Token 是 AI 理解世界的最小积木块,模型通过组合积木块来理解语义。
技术本质:Token 是大型语言模型(LLM)处理文本的基本单元,可以是一个字、一个词,或一个子词片段(如 "unbelievable" 可能被拆为 "un" + "believ" + "able")。
第2层:提示词 = 你的口头吩咐
定义:就是你给管家下达的直接命令,比如"帮我整理资料、查数据、写总结",是一切工作的起点。
类比理解:
- 🗣️ 口头吩咐:就像你对管家说"今晚做红烧肉",越具体,结果越符合预期。
- 🎯 射箭瞄准:提示词是箭头指向的目标,方向错了,再强的 AI 也打不中靶心。
- 📝 菜谱指令:同样的食材(Token),不同的菜谱(提示词)做出完全不同的菜。
关键要点:
- 提示词工程(Prompt Engineering)是人与 AI 交互的核心技能
- 好的提示词 = 明确的角色 + 具体的任务 + 期望的输出格式 + 约束条件
第3层:上下文 = 聊天全程备忘录
定义:你和管家从头到尾的所有对话记录,管家靠着这份备忘录记住前因后果,不会忘事、不会聊跑偏;备忘录页数有限,满了就会忘记前面内容。
类比理解:
- 📒 全程备忘录:就像会议记录本,管家每次回复前都要翻阅之前的记录。
- 🧠 短期记忆:类似人脑的"工作记忆",容量有限(通常几千到几十万 Token)。
- 📺 连续剧剧本:管家需要知道前几集剧情,才能演好当前这集。
- 🗑️ FIFO 队列:备忘录满了就像垃圾桶满了,最早的内容会被"倒掉"(遗忘)。
关键要点:
- 上下文窗口(Context Window):模型能同时处理的最大 Token 数量
- 长对话中,早期的信息可能被"挤出"窗口,导致 AI "失忆"
- 重要信息需要在提示词中反复强化或总结
第4层:Agent = 全能自主大管家
定义:核心主角,主动思考、自主办事。不只死板听一句话,会拆解你的吩咐、自己规划步骤、调动工具完成整套任务。
类比理解:
- 🏠 全能管家:不是只会开门的门卫,而是能统筹全局的"大管家"。
- 🧑✈️ 项目经理:你只说"办一场年会",他自动分解为:定场地 → 发邀请 → 安排餐饮 → 协调节目。
- 🤖 钢铁侠的贾维斯:理解意图 → 制定计划 → 调用资源 → 执行反馈 → 迭代优化。
- 🧠 有脑子的执行者:不是"你说一句我做一句",而是"你说目标,我想办法达成"。
关键特征:
| 特征 | 说明 |
|---|---|
| 自主性 | 能独立思考,不依赖每一步人工指令 |
| 规划性 | 将复杂任务拆解为可执行的子步骤 |
| 工具调用 | 能主动使用外部工具(搜索、计算、数据库等) |
| 反思迭代 | 执行中发现问题能自我修正 |
第5层:Harness = 家规 + 管理制度
定义:用来约束、管控大管家。划定能干啥、不能干啥、权限多大、做事流程规矩,防止乱操作、越界出错,起到风控和规范作用。
类比理解:
- 📜 家规家训:就像大家族的家规,管家权力再大也不能越界。
- 🛡️ 安全带 + 护栏:让管家在高速行驶(高效执行)时不会冲出道路(越界犯错)。
- ⚖️ 宪法与法律:Agent 是"政府",Harness 是"宪法",规定什么能做、什么绝对不行。
- 🎮 游戏边界:就像游戏里的空气墙,防止角色掉出地图。
核心作用:
- 权限控制:哪些 API 能调、哪些数据能访问
- 行为规范:禁止生成有害内容、禁止泄露隐私
- 流程约束:必须按 A → B → C 的顺序执行,不能跳过
- 审计追踪:记录管家的每一步操作,便于回溯
第6层:MCP = 内部联络总交换机
定义:相当于办公室总通讯枢纽,打通各个工具、部门、资料库。让管家能顺畅对接各类外部资源,实现跨工具、跨模块联动配合。
类比理解:
- ☎️ 总交换机:就像公司前台总机,转分机号就能接通任何部门。
- 🌐 万能翻译官:让说中文的管家和说英文的数据库、说日语的搜索工具无障碍沟通。
- 🔌 统一插座:不管电器(工具)是什么插头,插上就能用。
- 🚇 地铁换乘站:不同线路(工具/服务)在此交汇,实现无缝换乘。
技术本质:
- MCP(Model Context Protocol)是 Anthropic 推出的开放标准协议
- 定义了 AI 模型与外部数据源、工具之间的统一通信格式
- 让 Agent 可以"即插即用"地连接数据库、文件系统、API 服务等
第7层:Skills = 管家的各项手艺 / 技能包
定义:比如查资料、做表格、翻译、计算、联网搜索。是管家的一身本事,没有对应技能,再聪明也干不了专属活。
类比理解:
- 🛠️ 工具箱:就像电工的工具腰带,有螺丝刀、电笔、万用表,遇到什么问题拿什么工具。
- 🎹 乐器技能:会弹钢琴不代表会拉小提琴,每项技能都需要专门训练。
- 🍳 厨艺手艺:管家再聪明,没学过做菜(没有 Cooking Skill),也做不出佛跳墙。
- 📚 专业证书:就像律师执照、医师执照,代表在特定领域的执业能力。
常见 Skills 类型:
| 技能类型 | 示例功能 |
|---|---|
| 信息检索 | 联网搜索、数据库查询、知识图谱检索 |
| 数据处理 | Excel 操作、CSV 解析、数据清洗 |
| 代码执行 | Python 运行、SQL 查询、脚本执行 |
| 内容生成 | 图像生成、PPT 制作、文档排版 |
| 通信协作 | 发送邮件、Slack 通知、日历管理 |
三、七层联动关系图
┌────────────────────────────────────────────────────────────┐
│ 用户输入 │
│ ↓ │
│ 【第2层】提示词 —— "帮我分析上季度销售数据并做成 PPT" │
│ ↓ │
│ 【第1层】Token 化 —— 提示词被拆解为 Token 序列 │
│ ↓ │
│ 【第3层】上下文 —— 结合历史对话,理解"上季度"指哪个时间段 │
│ ↓ │
│ 【第5层】Harness —— 检查权限:允许访问销售数据库?允许生成文件? │
│ ↓ │
│ 【第4层】Agent —— 制定计划:①查数据 ②做分析 ③生成 PPT │
│ ↓ │
│ 【第6层】MCP —— 通过统一协议连接数据库、PPT 生成工具 │
│ ↓ │
│ 【第7层】Skills —— 调用 SQL 查询技能、数据分析技能、PPT 制作技能 │
│ ↓ │
│ 输出结果:一份完整的销售分析 PPT │
└────────────────────────────────────────────────────────────┘
四、核心关系总结
| 层级 | 角色定位 | 与"管家"的类比 | 不可替代性 |
|---|---|---|---|
| Token | 最小单元 | 管家能听懂的"单词" | 没有 Token,AI 无法"识字" |
| 提示词 | 工作起点 | 主人的吩咐 | 没有吩咐,管家不知道干啥 |
| 上下文 | 记忆系统 | 管家的记事本 | 没有记忆,对话无法连贯 |
| Agent | 执行核心 | 管家本人 | 没有管家,只是一堆工具 |
| Harness | 约束规则 | 家规制度 | 没有约束,管家可能闯祸 |
| MCP | 通讯系统 | 内部电话总机 | 没有总机,各部门无法协作 |
| Skills | 专业能力 | 管家的手艺 | 没有手艺,吩咐无法落地 |
五、一句话记住七层
"你说出提示词,交给 Agent 大管家;所有沟通拆成 Token 存入上下文;Harness 家规约束行为;MCP 联络中枢外接资源;调用 Skills 技能,自主完成所有任务。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)