一句话总结:你说出提示词,交给 Agent 大管家;所有沟通内容拆成 Token 记录,全部存入上下文备忘录;Harness 家规全程约束管家行为,不乱干活;管家通过 MCP 联络中枢,外接各类资源;再调用自身的 Skills 技能,一步步自主完成你交代的所有任务。


一、七层架构总览(由下至上)

┌─────────────────────────────────────────┐
│  第7层 │ Skills   │ 可复用的能力与经验    │
├─────────────────────────────────────────┤
│  第6层 │ MCP      │ 连接与扩展的协议层    │
├─────────────────────────────────────────┤
│  第5层 │ Harness  │ 编排与运行的工程框架  │
├─────────────────────────────────────────┤
│  第4层 │ Agent    │ 自主决策与执行的智能体│
├─────────────────────────────────────────┤
│  第3层 │ 上下文    │ 提供相关背景信息      │
├─────────────────────────────────────────┤
│  第2层 │ 提示词    │ 告诉模型要做什么      │
├─────────────────────────────────────────┤
│  第1层 │ Token    │ 模型理解的最小单位    │
└─────────────────────────────────────────┘

二、逐层详解与类比

第1层:Token = 文字最小颗粒(文字米粒)

定义:所有对话、指令、资料,都会被拆成一粒粒「文字米粒」。不管是人说话还是 AI 回复,都靠一粒粒 Token 承载,也是计量工作量的最小单位。

类比理解

  • 🍚 文字米粒:就像一碗米饭由无数米粒组成,任何一段话都由无数 Token 组成。
  • 📏 计量单位:就像装修按"平方米"计费,AI 服务按 "Token 数" 计费。
  • 🧩 乐高积木:Token 是 AI 理解世界的最小积木块,模型通过组合积木块来理解语义。

技术本质:Token 是大型语言模型(LLM)处理文本的基本单元,可以是一个字、一个词,或一个子词片段(如 "unbelievable" 可能被拆为 "un" + "believ" + "able")。


第2层:提示词 = 你的口头吩咐

定义:就是你给管家下达的直接命令,比如"帮我整理资料、查数据、写总结",是一切工作的起点。

类比理解

  • 🗣️ 口头吩咐:就像你对管家说"今晚做红烧肉",越具体,结果越符合预期。
  • 🎯 射箭瞄准:提示词是箭头指向的目标,方向错了,再强的 AI 也打不中靶心。
  • 📝 菜谱指令:同样的食材(Token),不同的菜谱(提示词)做出完全不同的菜。

关键要点

  • 提示词工程(Prompt Engineering)是人与 AI 交互的核心技能
  • 好的提示词 = 明确的角色 + 具体的任务 + 期望的输出格式 + 约束条件

第3层:上下文 = 聊天全程备忘录

定义:你和管家从头到尾的所有对话记录,管家靠着这份备忘录记住前因后果,不会忘事、不会聊跑偏;备忘录页数有限,满了就会忘记前面内容。

类比理解

  • 📒 全程备忘录:就像会议记录本,管家每次回复前都要翻阅之前的记录。
  • 🧠 短期记忆:类似人脑的"工作记忆",容量有限(通常几千到几十万 Token)。
  • 📺 连续剧剧本:管家需要知道前几集剧情,才能演好当前这集。
  • 🗑️ FIFO 队列:备忘录满了就像垃圾桶满了,最早的内容会被"倒掉"(遗忘)。

关键要点

  • 上下文窗口(Context Window):模型能同时处理的最大 Token 数量
  • 长对话中,早期的信息可能被"挤出"窗口,导致 AI "失忆"
  • 重要信息需要在提示词中反复强化或总结

第4层:Agent = 全能自主大管家

定义:核心主角,主动思考、自主办事。不只死板听一句话,会拆解你的吩咐、自己规划步骤、调动工具完成整套任务。

类比理解

  • 🏠 全能管家:不是只会开门的门卫,而是能统筹全局的"大管家"。
  • 🧑‍✈️ 项目经理:你只说"办一场年会",他自动分解为:定场地 → 发邀请 → 安排餐饮 → 协调节目。
  • 🤖 钢铁侠的贾维斯:理解意图 → 制定计划 → 调用资源 → 执行反馈 → 迭代优化。
  • 🧠 有脑子的执行者:不是"你说一句我做一句",而是"你说目标,我想办法达成"。

关键特征

特征 说明
自主性 能独立思考,不依赖每一步人工指令
规划性 将复杂任务拆解为可执行的子步骤
工具调用 能主动使用外部工具(搜索、计算、数据库等)
反思迭代 执行中发现问题能自我修正

第5层:Harness = 家规 + 管理制度

定义:用来约束、管控大管家。划定能干啥、不能干啥、权限多大、做事流程规矩,防止乱操作、越界出错,起到风控和规范作用。

类比理解

  • 📜 家规家训:就像大家族的家规,管家权力再大也不能越界。
  • 🛡️ 安全带 + 护栏:让管家在高速行驶(高效执行)时不会冲出道路(越界犯错)。
  • ⚖️ 宪法与法律:Agent 是"政府",Harness 是"宪法",规定什么能做、什么绝对不行。
  • 🎮 游戏边界:就像游戏里的空气墙,防止角色掉出地图。

核心作用

  • 权限控制:哪些 API 能调、哪些数据能访问
  • 行为规范:禁止生成有害内容、禁止泄露隐私
  • 流程约束:必须按 A → B → C 的顺序执行,不能跳过
  • 审计追踪:记录管家的每一步操作,便于回溯

第6层:MCP = 内部联络总交换机

定义:相当于办公室总通讯枢纽,打通各个工具、部门、资料库。让管家能顺畅对接各类外部资源,实现跨工具、跨模块联动配合。

类比理解

  • ☎️ 总交换机:就像公司前台总机,转分机号就能接通任何部门。
  • 🌐 万能翻译官:让说中文的管家和说英文的数据库、说日语的搜索工具无障碍沟通。
  • 🔌 统一插座:不管电器(工具)是什么插头,插上就能用。
  • 🚇 地铁换乘站:不同线路(工具/服务)在此交汇,实现无缝换乘。

技术本质

  • MCP(Model Context Protocol)是 Anthropic 推出的开放标准协议
  • 定义了 AI 模型与外部数据源、工具之间的统一通信格式
  • 让 Agent 可以"即插即用"地连接数据库、文件系统、API 服务等

第7层:Skills = 管家的各项手艺 / 技能包

定义:比如查资料、做表格、翻译、计算、联网搜索。是管家的一身本事,没有对应技能,再聪明也干不了专属活。

类比理解

  • 🛠️ 工具箱:就像电工的工具腰带,有螺丝刀、电笔、万用表,遇到什么问题拿什么工具。
  • 🎹 乐器技能:会弹钢琴不代表会拉小提琴,每项技能都需要专门训练。
  • 🍳 厨艺手艺:管家再聪明,没学过做菜(没有 Cooking Skill),也做不出佛跳墙。
  • 📚 专业证书:就像律师执照、医师执照,代表在特定领域的执业能力。

常见 Skills 类型

技能类型 示例功能
信息检索 联网搜索、数据库查询、知识图谱检索
数据处理 Excel 操作、CSV 解析、数据清洗
代码执行 Python 运行、SQL 查询、脚本执行
内容生成 图像生成、PPT 制作、文档排版
通信协作 发送邮件、Slack 通知、日历管理

三、七层联动关系图

┌────────────────────────────────────────────────────────────┐
│  用户输入                                                     │
│     ↓                                                        │
│  【第2层】提示词 —— "帮我分析上季度销售数据并做成 PPT"           │
│     ↓                                                        │
│  【第1层】Token 化 —— 提示词被拆解为 Token 序列                  │
│     ↓                                                        │
│  【第3层】上下文 —— 结合历史对话,理解"上季度"指哪个时间段        │
│     ↓                                                        │
│  【第5层】Harness —— 检查权限:允许访问销售数据库?允许生成文件?  │
│     ↓                                                        │
│  【第4层】Agent —— 制定计划:①查数据 ②做分析 ③生成 PPT           │
│     ↓                                                        │
│  【第6层】MCP —— 通过统一协议连接数据库、PPT 生成工具              │
│     ↓                                                        │
│  【第7层】Skills —— 调用 SQL 查询技能、数据分析技能、PPT 制作技能  │
│     ↓                                                        │
│  输出结果:一份完整的销售分析 PPT                               │
└────────────────────────────────────────────────────────────┘

四、核心关系总结

层级 角色定位 与"管家"的类比 不可替代性
Token 最小单元 管家能听懂的"单词" 没有 Token,AI 无法"识字"
提示词 工作起点 主人的吩咐 没有吩咐,管家不知道干啥
上下文 记忆系统 管家的记事本 没有记忆,对话无法连贯
Agent 执行核心 管家本人 没有管家,只是一堆工具
Harness 约束规则 家规制度 没有约束,管家可能闯祸
MCP 通讯系统 内部电话总机 没有总机,各部门无法协作
Skills 专业能力 管家的手艺 没有手艺,吩咐无法落地

五、一句话记住七层

"你说出提示词,交给 Agent 大管家;所有沟通拆成 Token 存入上下文;Harness 家规约束行为;MCP 联络中枢外接资源;调用 Skills 技能,自主完成所有任务。

 

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐