基于 LLM 的 AI 智能体架构:一台长在你设备里的新型电脑
基于 LLM 的 AI 智能体架构:一台长在你设备里的新型电脑
过去,我们一直把 AI 理解成一个“聊天机器人”。
但如果从系统架构角度重新观察,会发现未来真正成熟的 AI 智能体,更像是一台安装在你设备里的新型个人电脑。
它拥有:
- 计算核心
- 内存
- 文件系统
- 软件系统
- 输入输出设备
- 长期存储
只是:
它的核心不再是传统 CPU,而是 LLM。
一、LLM 引擎:没有记忆的“CPU”
LLM 本身其实没有长期记忆。
它更像一个推理引擎:
- 接收输入
- 读取上下文
- 进行推理
- 输出结果
- 然后“失忆”
它无法天然记住过去发生的事情。
因此:
LLM 本身更像 CPU,而不是完整的智能体。
它只负责计算。
真正让 AI “看起来认识你”的,是外部为它提供的上下文。

二、上下文:AI 智能体的内存
如果 LLM 是 CPU,
那么 Context(上下文)就是 AI 的内存。
而这个内存,其实应该分成两层。
1. 全局上下文(Global Context)
这一层属于整个智能体。
它记录:
- 用户偏好
- 长期目标
- 常用习惯
- 人格设定
- 长期规则
- 历史知识
例如:
- “用户喜欢 Markdown”
- “用户正在学习 AI Agent”
- “用户习惯使用中文写作”
这些信息会长期影响智能体行为。
2. 会话上下文(Session Context)
这一层只属于当前对话。
例如:
- 当前正在讨论的话题
- 当前文章结构
- 最近几轮对话
- 临时推理结果
它更像程序运行时的临时内存。
上下文窗口,本质上是“内存限制”
LLM 的 Context Window 并不是无限的。
这意味着:
- 历史不能无限累积
- 信息会越来越贵
- 超过限制后必须被压缩
于是:
智能体必须像操作系统一样管理内存:
- 压缩历史
- 总结摘要
- 清理低优先级信息
- 转移长期信息
- 动态加载需要的数据
因此:
Context Window 本质上就是 AI 的内存容量。

三、Markdown 文件:智能体的硬盘
长期数据不应该一直放在上下文里。
否则:
- 成本会越来越高
- 推理速度会下降
- Context 会迅速膨胀
因此:
长期记忆应该存在文件系统中。
而一种非常自然的形式,就是 Markdown 文件。
例如:
- 笔记
- 项目资料
- 日记
- 世界观
- 用户档案
- 写作素材
- 长期知识库
都可以直接存成 Markdown。
这意味着:
| 传统电脑 | AI 智能体 |
|---|---|
| 硬盘 | Markdown 文件系统 |
Markdown 有一个巨大优势:
它既能被 AI 阅读,也能被人类直接阅读。
因此:
- 人类可以编辑
- AI 可以处理
- Git 可以版本管理
- 文件可以同步
- 即使脱离 AI 依然存在
这会形成一种:
“人与 AI 共用的知识空间”。

四、Skill:安装在 AI 上的软件
未来的 AI 智能体,不会只有“知识”。
它还会拥有“技能”。
例如:
- 写作 Skill
- 编程 Skill
- 视频剪辑 Skill
- 数据分析 Skill
- 项目管理 Skill
这些 Skill 可能由:
- Prompt
- 工作流
- Python 代码
- MCP 配置
- Tool 调用规则
共同组成。
它们就像:
安装在 AI 身上的软件。
因此:
| 传统电脑 | AI 智能体 |
|---|---|
| 软件 / App | Skill |
Skill 可以:
- 安装
- 卸载
- 更新
- 共享
- 组合
未来甚至可能出现:
- Skill Store
- Skill Marketplace
- 开源 Skill 社区

五、输入输出:不只是文字
传统聊天机器人最大的误导之一,是大家以为 AI 只有文字交互。
实际上未来的 AI 智能体,会拥有完整的多模态输入输出系统。
输入
AI 可以读取:
- 文字
- 语音
- 图片
- 视频
- 摄像头
- 文件
- 屏幕内容
- 设备状态
输出
AI 可以生成:
- 文本
- 语音
- 图像
- 视频
- 自动化操作
- 控制指令
因此:
AI 智能体本质上是一种新的交互层。

电脑整机:一种“类冯诺依曼结构”的 AI 计算机
如果把整个架构放在一起:
| 传统计算机 | AI 智能体 |
|---|---|
| CPU | LLM 引擎 |
| 内存 | Context |
| 硬盘 | Markdown 文件系统 |
| 软件 | Skill |
| 输入设备 | 多模态输入 |
| 输出设备 | 多模态输出 |
你会发现:
它已经越来越像一台真正的计算机。
只是:
这台计算机不是围绕 GUI 构建的。
而是围绕:
“语言理解与推理”
构建的。

操作系统:个人 AI 操作系统
未来每个人设备中,都可能长期存在一个 AI Agent。
它:
- 理解你
- 记住你
- 帮助你工作
- 管理你的知识
- 调度你的 Skills
- 操作你的设备
- 与你长期共同成长
那时:
我们使用的可能不再只是:
- Windows
- macOS
- Android
而是:
一个以 LLM 为核心的新型个人 AI 操作系统。
而今天的聊天框,
可能只是这个新时代最早期的雏形。

参考资料
-
Park, Joon Sung et al.
MemGPT: Towards LLMs as Operating Systems
arXiv:2310.08560
https://arxiv.org/abs/2310.08560 -
Wang, Lei et al.
LLM as OS, Agents as Apps: Envisioning AIOS, Agents and the AIOS-Agent Ecosystem
arXiv:2312.03815
https://arxiv.org/abs/2312.03815
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)