【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章:智能体发展史深度解读

本笔记记录学习 Datawhale 开源项目 hello-agents 第二章的要点总结,梳理智能体从符号主义到LLM的70年演进历程。


📚 前言

在正式开始构建 Agent 之前,理解其发展历史至关重要。正如教程所言:“每一个新范式的出现,都是为了解决上一代范式的核心痛点”。本章以"问题驱动进化"为主线,带我们穿越半个世纪的 AI 发展史。


🧠 一、符号主义时代(1950s-1980s)

1.1 核心思想:智能 = 符号 + 规则

理论基础:物理符号系统假说(PSSH, 1976)—— 纽厄尔 & 西蒙

充分性论断:任何物理符号系统都具备产生通用智能行为的充分手段
必要性论断:任何展现通用智能的系统,本质上必然是物理符号系统

通俗理解:智能的本质就是按规则处理符号,就像图书馆管理员按分类规则整理书籍。

1.2 代表系统
系统 年份 核心贡献
GPS 1957 通用问题求解器,处理"玩具问题"
ELIZA 1966 模式匹配聊天机器人,揭示"Eliza效应"
MYCIN 1972 医疗诊断专家系统,600+条规则,达到人类专家水平
SHRDLU 1970 积木世界智能体,首次集成语言+规划+记忆
1.3 专家系统架构
┌─────────────────────────────────────────┐
│              用户界面                    │
└─────────────────┬───────────────────────┘
                  ▼
┌─────────────────────────────────────────┐
│              推理机                      │
│    正向链:数据驱动(从事实推导结论)      │
│    反向链:目标驱动(从假设验证证据)      │
└─────────────────┬───────────────────────┘
                  ▼
┌─────────────────────────────────────────┐
│              知识库                      │
│    IF 发烧 AND 咳嗽 THEN 呼吸道感染      │
│    (产生式规则 / 置信因子 CF)           │
└─────────────────────────────────────────┘
1.4 符号主义的局限
局限 说明
知识获取瓶颈 手工编码规则成本极高,难以规模化
系统脆弱性 遇到训练外case就崩溃,缺乏泛化能力
规则冲突 600条规则已难以管理,维护成噩梦
常识缺失 无法处理隐性知识(如"石头比羽毛重")

🔗 二、联结主义时代(1980s-2010s)

2.1 核心思想:让机器从数据中自己学习!

关键突破:反向传播算法(1986)

符号主义:写规则 "四条腿+尖耳朵+胡须 = 猫"
           → 遇到无毛猫就崩溃

联结主义:给机器看1000张猫图片,让它自己总结规律
           → 能识别各种猫,甚至卡通猫
2.2 强化学习:试错中的智能

核心循环

        ┌──────────┐
        │   环境   │
        └────┬─────┘
             │ 状态
             ▼
        ┌──────────┐
        │  智能体  │◄──── 奖励信号
        └────┬─────┘
             │ 行动
             ▼
        └──────────┘

代表成果

系统 年份 突破
TD-Gammon 1992 自我对弈学习达到世界冠军水平
DQN 2015 深度Q网络,Atari游戏超越人类
2.3 优势与局限
优势 局限
解决知识获取瓶颈 黑盒模型,难以解释
处理非结构化数据 数据饥渴,需要大量标注
鲁棒性更强 泛化能力有限

🚀 三、深度学习时代(2010s-2022)

3.1 核心技术

深度神经网络 + 大规模数据 + GPU算力

3.2 代表成果
系统 年份 成就
AlphaGo 2016 击败围棋世界冠军李世石
ResNet 2015 图像识别突破
自动驾驶 2010s 感知+决策一体化
3.3 局限
  • 缺乏常识推理
  • 迁移能力差
  • 需要大量领域数据

🤖 四、LLM驱动时代(2022-至今)

4.1 核心架构:多模块协同

现代 Agent 采用 "感知-思考-行动-观察"闭环

┌─────────────────────────────────────────────────────────┐
│                     现代 Agent 架构                      │
├─────────────────────────────────────────────────────────┤
│  感知 ◄──── 环境观察(API/用户输入/传感器)               │
│   │                                                     │
│   ▼                                                     │
│  思考 ──── LLM核心 + 记忆模块(短期/长期记忆)            │
│   │                                                     │
│   ▼                                                     │
│  行动 ──── 调用工具(搜索/代码执行/API)                  │
│   │                                                     │
│   ▼                                                     │
│  观察 ◄──── 接收工具反馈,更新记忆,循环                   │
└─────────────────────────────────────────────────────────┘
4.2 代表系统
系统 特点
ChatGPT 通用对话,零样本学习能力
AutoGPT 自主任务分解与执行
Manus 端到端任务完成
4.3 融合优势
符号主义(可解释性)
      +
联结主义(学习能力)
      +
   LLM(通用性)
      ↓
  神经符号主义

📊 五、四大时代对比总结

维度 符号主义 联结主义 深度学习 LLM驱动
时间 1950s-1980s 1980s-2010s 2010s-2022 2022-至今
核心 规则+逻辑推理 神经网络+强化学习 深度神经网络 大语言模型+Prompting
知识来源 人工编写规则 从数据学习 大规模数据 互联网全部文本
代表 MYCIN、GPS TD-Gammon AlphaGo ChatGPT、AutoGPT
优势 可解释、精确 自动学习、泛化 超人表现(专用) 通用、零样本
劣势 知识瓶颈、脆弱 黑盒、数据饥渴 缺乏常识、迁移差 幻觉、成本高

💡 六、三个核心启示

6.1 没有银弹,只有权衡
符号主义:精确但僵化
联结主义:灵活但黑盒
LLM:通用但不稳定

→ 未来的智能体将是混合架构
6.2 环境决定设计
场景 推荐技术
封闭环境(围棋/游戏) 深度学习 + 强化学习
开放环境(现实世界) LLM + 工具调用
安全关键(医疗/自动驾驶) 符号系统 + 可解释AI
6.3 AGI仍是长期目标

LLM虽强,但真正的AGI还需突破:

  • ❌ 真正的"理解"(vs. 统计模式匹配)
  • ❌ 持续学习能力(vs. 固定模型)
  • ❌ 物理世界交互(vs. 纯数字)
  • ❌ 创造力和想象力

📝 七、学习心得

7.1 为什么学历史很重要
  1. 避免重复踩坑:符号主义的知识获取瓶颈告诉我们,手工编码规则不可持续
  2. 理解设计选择:为什么现代Agent要"工具调用"?因为单靠LLM不够
  3. 预测未来方向:混合架构、神经符号主义将是趋势
7.2 本章核心认知
概念 理解
物理符号系统假说 智能=符号操作,奠定了早期AI理论基础
知识获取瓶颈 专家系统衰落的主因,催生了机器学习
ReAct模式 Reasoning + Acting,现代Agent的核心范式
神经符号主义 结合神经网络(直觉)和符号系统(推理)
7.3 遇到的问题
问题 原因 解决方案
概念太多记不住 时间跨度大,技术迭代快 画时间轴图,对比记忆
理解不了反向传播 数学基础不够 先掌握直观理解,再补数学
不清楚现代Agent优势 缺乏实践经验 结合第一章的FirstAgentTest.py理解

🔗 参考资源

课程资料
  • 📖 项目教程地址:https://github.com/datawhalechina/hello-agents
  • 📝 第二章原文:https://datawhalechina.github.io/hello-agents/#/./chapter2/第二章%20智能体发展史
延伸阅读
  • 📄 物理符号系统假说论文:Newell & Simon, 1976
  • 📚 《人工智能:一种现代的方法》—— Stuart Russell
  • 🎬 AlphaGo纪录片(了解深度学习时代的里程碑)
Datawhale 社区
  • 🏠 Datawhale 官网:https://datawhale.club/
  • 💬 GitHub 讨论区:https://github.com/datawhalechina/hello-agents/discussions

🌟 结语

从符号主义的"死规则"到LLM的"思维链",智能体的70年演进告诉我们:没有完美的技术,只有不断解决问题的迭代。理解这段历史,让我们在面对技术选型时更有底气,也更能看清未来的方向。

下一章将进入大语言模型基础,敬请期待!


版权声明:本学习笔记基于 Datawhale 开源项目 hello-agents 整理,仅供学习交流使用。转载请注明出处。


📖 项目教程地址

hello-agents - Datawhale AI Agent 入门教程

👉 https://github.com/datawhalechina/hello-agents


记录时间:2026年3月19日

本文由AI润色输出总结

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐