【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章：智能体发展史深度解读

RSFeegg

374人浏览 · 2026-03-19 01:07:17

RSFeegg · 2026-03-19 01:07:17 发布

【AI Agent 学习笔记task2】Day3 Hello-Agents 第二章：智能体发展史深度解读

本笔记记录学习 Datawhale 开源项目 hello-agents 第二章的要点总结，梳理智能体从符号主义到LLM的70年演进历程。

📚 前言

在正式开始构建 Agent 之前，理解其发展历史至关重要。正如教程所言：“每一个新范式的出现，都是为了解决上一代范式的核心痛点”。本章以"问题驱动进化"为主线，带我们穿越半个世纪的 AI 发展史。

🧠 一、符号主义时代（1950s-1980s）

1.1 核心思想：智能 = 符号 + 规则

理论基础：物理符号系统假说（PSSH, 1976）—— 纽厄尔 & 西蒙

充分性论断：任何物理符号系统都具备产生通用智能行为的充分手段
必要性论断：任何展现通用智能的系统，本质上必然是物理符号系统

通俗理解：智能的本质就是按规则处理符号，就像图书馆管理员按分类规则整理书籍。

1.2 代表系统

系统	年份	核心贡献
GPS	1957	通用问题求解器，处理"玩具问题"
ELIZA	1966	模式匹配聊天机器人，揭示"Eliza效应"
MYCIN	1972	医疗诊断专家系统，600+条规则，达到人类专家水平
SHRDLU	1970	积木世界智能体，首次集成语言+规划+记忆

1.3 专家系统架构

┌─────────────────────────────────────────┐
│              用户界面                    │
└─────────────────┬───────────────────────┘
                  ▼
┌─────────────────────────────────────────┐
│              推理机                      │
│    正向链：数据驱动（从事实推导结论）      │
│    反向链：目标驱动（从假设验证证据）      │
└─────────────────┬───────────────────────┘
                  ▼
┌─────────────────────────────────────────┐
│              知识库                      │
│    IF 发烧 AND 咳嗽 THEN 呼吸道感染      │
│    （产生式规则 / 置信因子 CF）           │
└─────────────────────────────────────────┘

1.4 符号主义的局限

局限	说明
知识获取瓶颈	手工编码规则成本极高，难以规模化
系统脆弱性	遇到训练外case就崩溃，缺乏泛化能力
规则冲突	600条规则已难以管理，维护成噩梦
常识缺失	无法处理隐性知识（如"石头比羽毛重"）

🔗 二、联结主义时代（1980s-2010s）

2.1 核心思想：让机器从数据中自己学习！

关键突破：反向传播算法（1986）

符号主义：写规则 "四条腿+尖耳朵+胡须 = 猫"
           → 遇到无毛猫就崩溃

联结主义：给机器看1000张猫图片，让它自己总结规律
           → 能识别各种猫，甚至卡通猫

2.2 强化学习：试错中的智能

核心循环：

        ┌──────────┐
        │   环境   │
        └────┬─────┘
             │ 状态
             ▼
        ┌──────────┐
        │  智能体  │◄──── 奖励信号
        └────┬─────┘
             │ 行动
             ▼
        └──────────┘

代表成果：

系统	年份	突破
TD-Gammon	1992	自我对弈学习达到世界冠军水平
DQN	2015	深度Q网络，Atari游戏超越人类

2.3 优势与局限

优势	局限
解决知识获取瓶颈	黑盒模型，难以解释
处理非结构化数据	数据饥渴，需要大量标注
鲁棒性更强	泛化能力有限

🚀 三、深度学习时代（2010s-2022）

3.1 核心技术

深度神经网络 + 大规模数据 + GPU算力

3.2 代表成果

系统	年份	成就
AlphaGo	2016	击败围棋世界冠军李世石
ResNet	2015	图像识别突破
自动驾驶	2010s	感知+决策一体化

3.3 局限

缺乏常识推理
迁移能力差
需要大量领域数据

🤖 四、LLM驱动时代（2022-至今）

4.1 核心架构：多模块协同

现代 Agent 采用 "感知-思考-行动-观察"闭环：

┌─────────────────────────────────────────────────────────┐
│                     现代 Agent 架构                      │
├─────────────────────────────────────────────────────────┤
│  感知 ◄──── 环境观察（API/用户输入/传感器）               │
│   │                                                     │
│   ▼                                                     │
│  思考 ──── LLM核心 + 记忆模块（短期/长期记忆）            │
│   │                                                     │
│   ▼                                                     │
│  行动 ──── 调用工具（搜索/代码执行/API）                  │
│   │                                                     │
│   ▼                                                     │
│  观察 ◄──── 接收工具反馈，更新记忆，循环                   │
└─────────────────────────────────────────────────────────┘

4.2 代表系统

系统	特点
ChatGPT	通用对话，零样本学习能力
AutoGPT	自主任务分解与执行
Manus	端到端任务完成

4.3 融合优势

符号主义（可解释性）
      +
联结主义（学习能力）
      +
   LLM（通用性）
      ↓
  神经符号主义

📊 五、四大时代对比总结

维度	符号主义	联结主义	深度学习	LLM驱动
时间	1950s-1980s	1980s-2010s	2010s-2022	2022-至今
核心	规则+逻辑推理	神经网络+强化学习	深度神经网络	大语言模型+Prompting
知识来源	人工编写规则	从数据学习	大规模数据	互联网全部文本
代表	MYCIN、GPS	TD-Gammon	AlphaGo	ChatGPT、AutoGPT
优势	可解释、精确	自动学习、泛化	超人表现（专用）	通用、零样本
劣势	知识瓶颈、脆弱	黑盒、数据饥渴	缺乏常识、迁移差	幻觉、成本高

💡 六、三个核心启示

6.1 没有银弹，只有权衡

符号主义：精确但僵化
联结主义：灵活但黑盒
LLM：通用但不稳定

→ 未来的智能体将是混合架构

6.2 环境决定设计

场景	推荐技术
封闭环境（围棋/游戏）	深度学习 + 强化学习
开放环境（现实世界）	LLM + 工具调用
安全关键（医疗/自动驾驶）	符号系统 + 可解释AI

6.3 AGI仍是长期目标

LLM虽强，但真正的AGI还需突破：

❌ 真正的"理解"（vs. 统计模式匹配）
❌ 持续学习能力（vs. 固定模型）
❌ 物理世界交互（vs. 纯数字）
❌ 创造力和想象力

📝 七、学习心得

7.1 为什么学历史很重要

避免重复踩坑：符号主义的知识获取瓶颈告诉我们，手工编码规则不可持续
理解设计选择：为什么现代Agent要"工具调用"？因为单靠LLM不够
预测未来方向：混合架构、神经符号主义将是趋势

7.2 本章核心认知

概念	理解
物理符号系统假说	智能=符号操作，奠定了早期AI理论基础
知识获取瓶颈	专家系统衰落的主因，催生了机器学习
ReAct模式	Reasoning + Acting，现代Agent的核心范式
神经符号主义	结合神经网络（直觉）和符号系统（推理）

7.3 遇到的问题

问题	原因	解决方案
概念太多记不住	时间跨度大，技术迭代快	画时间轴图，对比记忆
理解不了反向传播	数学基础不够	先掌握直观理解，再补数学
不清楚现代Agent优势	缺乏实践经验	结合第一章的FirstAgentTest.py理解

🔗 参考资源

课程资料

📖 项目教程地址：https://github.com/datawhalechina/hello-agents
📝 第二章原文：https://datawhalechina.github.io/hello-agents/#/./chapter2/第二章%20智能体发展史

Datawhale 社区

🏠 Datawhale 官网：https://datawhale.club/
💬 GitHub 讨论区：https://github.com/datawhalechina/hello-agents/discussions

🌟 结语

从符号主义的"死规则"到LLM的"思维链"，智能体的70年演进告诉我们：没有完美的技术，只有不断解决问题的迭代。理解这段历史，让我们在面对技术选型时更有底气，也更能看清未来的方向。

下一章将进入大语言模型基础，敬请期待！

版权声明：本学习笔记基于 Datawhale 开源项目 hello-agents 整理，仅供学习交流使用。转载请注明出处。

📖 项目教程地址

hello-agents - Datawhale AI Agent 入门教程

👉 https://github.com/datawhalechina/hello-agents

记录时间：2026年3月19日

本文由AI润色输出总结

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

一个GitHub Issue就能投毒Claude Code？我拆解了整条供应链攻击链

上周Claude Code刚被AMD AI负责人用23万次调用记录实锤"越更新越差"[1]，这周它的GitHub Actions又被安全研究者扒出了一个供应链级别的漏洞——一个恶意GitHub Issue，就能让Claude Code帮你把仓库Secret全偷走，甚至往你的代码里投毒[2]。这个漏洞有多严重？CVSS v4.0评分7.8，Anthropic为此支付了4800美元赏金。更可怕的是，A