【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章:智能体发展史深度解读
【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章:智能体发展史深度解读
本笔记记录学习 Datawhale 开源项目 hello-agents 第二章的要点总结,梳理智能体从符号主义到LLM的70年演进历程。
📚 前言
在正式开始构建 Agent 之前,理解其发展历史至关重要。正如教程所言:“每一个新范式的出现,都是为了解决上一代范式的核心痛点”。本章以"问题驱动进化"为主线,带我们穿越半个世纪的 AI 发展史。
🧠 一、符号主义时代(1950s-1980s)
1.1 核心思想:智能 = 符号 + 规则
理论基础:物理符号系统假说(PSSH, 1976)—— 纽厄尔 & 西蒙
充分性论断:任何物理符号系统都具备产生通用智能行为的充分手段
必要性论断:任何展现通用智能的系统,本质上必然是物理符号系统
通俗理解:智能的本质就是按规则处理符号,就像图书馆管理员按分类规则整理书籍。
1.2 代表系统
| 系统 | 年份 | 核心贡献 |
|---|---|---|
| GPS | 1957 | 通用问题求解器,处理"玩具问题" |
| ELIZA | 1966 | 模式匹配聊天机器人,揭示"Eliza效应" |
| MYCIN | 1972 | 医疗诊断专家系统,600+条规则,达到人类专家水平 |
| SHRDLU | 1970 | 积木世界智能体,首次集成语言+规划+记忆 |
1.3 专家系统架构
┌─────────────────────────────────────────┐
│ 用户界面 │
└─────────────────┬───────────────────────┘
▼
┌─────────────────────────────────────────┐
│ 推理机 │
│ 正向链:数据驱动(从事实推导结论) │
│ 反向链:目标驱动(从假设验证证据) │
└─────────────────┬───────────────────────┘
▼
┌─────────────────────────────────────────┐
│ 知识库 │
│ IF 发烧 AND 咳嗽 THEN 呼吸道感染 │
│ (产生式规则 / 置信因子 CF) │
└─────────────────────────────────────────┘
1.4 符号主义的局限
| 局限 | 说明 |
|---|---|
| 知识获取瓶颈 | 手工编码规则成本极高,难以规模化 |
| 系统脆弱性 | 遇到训练外case就崩溃,缺乏泛化能力 |
| 规则冲突 | 600条规则已难以管理,维护成噩梦 |
| 常识缺失 | 无法处理隐性知识(如"石头比羽毛重") |
🔗 二、联结主义时代(1980s-2010s)
2.1 核心思想:让机器从数据中自己学习!
关键突破:反向传播算法(1986)
符号主义:写规则 "四条腿+尖耳朵+胡须 = 猫"
→ 遇到无毛猫就崩溃
联结主义:给机器看1000张猫图片,让它自己总结规律
→ 能识别各种猫,甚至卡通猫
2.2 强化学习:试错中的智能
核心循环:
┌──────────┐
│ 环境 │
└────┬─────┘
│ 状态
▼
┌──────────┐
│ 智能体 │◄──── 奖励信号
└────┬─────┘
│ 行动
▼
└──────────┘
代表成果:
| 系统 | 年份 | 突破 |
|---|---|---|
| TD-Gammon | 1992 | 自我对弈学习达到世界冠军水平 |
| DQN | 2015 | 深度Q网络,Atari游戏超越人类 |
2.3 优势与局限
| 优势 | 局限 |
|---|---|
| 解决知识获取瓶颈 | 黑盒模型,难以解释 |
| 处理非结构化数据 | 数据饥渴,需要大量标注 |
| 鲁棒性更强 | 泛化能力有限 |
🚀 三、深度学习时代(2010s-2022)
3.1 核心技术
深度神经网络 + 大规模数据 + GPU算力
3.2 代表成果
| 系统 | 年份 | 成就 |
|---|---|---|
| AlphaGo | 2016 | 击败围棋世界冠军李世石 |
| ResNet | 2015 | 图像识别突破 |
| 自动驾驶 | 2010s | 感知+决策一体化 |
3.3 局限
- 缺乏常识推理
- 迁移能力差
- 需要大量领域数据
🤖 四、LLM驱动时代(2022-至今)
4.1 核心架构:多模块协同
现代 Agent 采用 "感知-思考-行动-观察"闭环:
┌─────────────────────────────────────────────────────────┐
│ 现代 Agent 架构 │
├─────────────────────────────────────────────────────────┤
│ 感知 ◄──── 环境观察(API/用户输入/传感器) │
│ │ │
│ ▼ │
│ 思考 ──── LLM核心 + 记忆模块(短期/长期记忆) │
│ │ │
│ ▼ │
│ 行动 ──── 调用工具(搜索/代码执行/API) │
│ │ │
│ ▼ │
│ 观察 ◄──── 接收工具反馈,更新记忆,循环 │
└─────────────────────────────────────────────────────────┘
4.2 代表系统
| 系统 | 特点 |
|---|---|
| ChatGPT | 通用对话,零样本学习能力 |
| AutoGPT | 自主任务分解与执行 |
| Manus | 端到端任务完成 |
4.3 融合优势
符号主义(可解释性)
+
联结主义(学习能力)
+
LLM(通用性)
↓
神经符号主义
📊 五、四大时代对比总结
| 维度 | 符号主义 | 联结主义 | 深度学习 | LLM驱动 |
|---|---|---|---|---|
| 时间 | 1950s-1980s | 1980s-2010s | 2010s-2022 | 2022-至今 |
| 核心 | 规则+逻辑推理 | 神经网络+强化学习 | 深度神经网络 | 大语言模型+Prompting |
| 知识来源 | 人工编写规则 | 从数据学习 | 大规模数据 | 互联网全部文本 |
| 代表 | MYCIN、GPS | TD-Gammon | AlphaGo | ChatGPT、AutoGPT |
| 优势 | 可解释、精确 | 自动学习、泛化 | 超人表现(专用) | 通用、零样本 |
| 劣势 | 知识瓶颈、脆弱 | 黑盒、数据饥渴 | 缺乏常识、迁移差 | 幻觉、成本高 |
💡 六、三个核心启示
6.1 没有银弹,只有权衡
符号主义:精确但僵化
联结主义:灵活但黑盒
LLM:通用但不稳定
→ 未来的智能体将是混合架构
6.2 环境决定设计
| 场景 | 推荐技术 |
|---|---|
| 封闭环境(围棋/游戏) | 深度学习 + 强化学习 |
| 开放环境(现实世界) | LLM + 工具调用 |
| 安全关键(医疗/自动驾驶) | 符号系统 + 可解释AI |
6.3 AGI仍是长期目标
LLM虽强,但真正的AGI还需突破:
- ❌ 真正的"理解"(vs. 统计模式匹配)
- ❌ 持续学习能力(vs. 固定模型)
- ❌ 物理世界交互(vs. 纯数字)
- ❌ 创造力和想象力
📝 七、学习心得
7.1 为什么学历史很重要
- 避免重复踩坑:符号主义的知识获取瓶颈告诉我们,手工编码规则不可持续
- 理解设计选择:为什么现代Agent要"工具调用"?因为单靠LLM不够
- 预测未来方向:混合架构、神经符号主义将是趋势
7.2 本章核心认知
| 概念 | 理解 |
|---|---|
| 物理符号系统假说 | 智能=符号操作,奠定了早期AI理论基础 |
| 知识获取瓶颈 | 专家系统衰落的主因,催生了机器学习 |
| ReAct模式 | Reasoning + Acting,现代Agent的核心范式 |
| 神经符号主义 | 结合神经网络(直觉)和符号系统(推理) |
7.3 遇到的问题
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 概念太多记不住 | 时间跨度大,技术迭代快 | 画时间轴图,对比记忆 |
| 理解不了反向传播 | 数学基础不够 | 先掌握直观理解,再补数学 |
| 不清楚现代Agent优势 | 缺乏实践经验 | 结合第一章的FirstAgentTest.py理解 |
🔗 参考资源
课程资料
- 📖 项目教程地址:https://github.com/datawhalechina/hello-agents
- 📝 第二章原文:https://datawhalechina.github.io/hello-agents/#/./chapter2/第二章%20智能体发展史
延伸阅读
- 📄 物理符号系统假说论文:Newell & Simon, 1976
- 📚 《人工智能:一种现代的方法》—— Stuart Russell
- 🎬 AlphaGo纪录片(了解深度学习时代的里程碑)
Datawhale 社区
- 🏠 Datawhale 官网:https://datawhale.club/
- 💬 GitHub 讨论区:https://github.com/datawhalechina/hello-agents/discussions
🌟 结语
从符号主义的"死规则"到LLM的"思维链",智能体的70年演进告诉我们:没有完美的技术,只有不断解决问题的迭代。理解这段历史,让我们在面对技术选型时更有底气,也更能看清未来的方向。
下一章将进入大语言模型基础,敬请期待!
版权声明:本学习笔记基于 Datawhale 开源项目 hello-agents 整理,仅供学习交流使用。转载请注明出处。
📖 项目教程地址
hello-agents - Datawhale AI Agent 入门教程
👉 https://github.com/datawhalechina/hello-agents
记录时间:2026年3月19日
本文由AI润色输出总结
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)