AI 解决问题的本质:图搜索模型
AI 解决问题的本质:图搜索模型
一个帮助理解 AI 工作方式的新视角
引言:从迷宫说起
想象你被关在一个巨大的迷宫里,需要从入口(问题)找到出口(答案)。
你不知道迷宫的全貌,只能一步步摸索:
- 有时候走到死胡同(尝试失败)
- 有时候走了很远才发现这不是最近的路(低效)
- 有时候有人告诉你"先向北走 3 步"(省了很多时间)
这就是 AI 解决问题的方式。
核心模型:问题是一张图
1. 什么是"图"?
不是画图,而是一张关系网络图。
简单类比:
- 从北京到上海,有多条路线
- 飞机
- 高铁
- 汽车
- 可能还有其他组合方式
- 每个路线都通过不同的"中转站"(北京→南京→上海,或北京→杭州→上海)
问题空间中的"图"就是这样:
【问题】
↓
多条可能的解决思路
↓
【答案】
2. 图的三个要素
| 要素 | 是什么 | 例子 |
|---|---|---|
| 节点 | 问题解决过程中的各个状态/信息 | 代码片段、文档、工具输出、中间结论 |
| 边 | 从一个状态到另一个状态的操作 | 阅读文档、调用工具、修改代码、推理 |
| 最短路 | 从问题到答案最快的路径 | 高效的解决方案 |
日常例子:
- 你要修家里的水龙头
- 节点:问题(龙头漏水)→ 获取工具 → 拆卸 → 维修 → 安装(解决)
- 边:每一个步骤的操作
- 最短路:不走弯路的修理流程
AI 的搜索方式:穿过迷宫找出口
3. 基本策略:逐步尝试
AI 的工作方式就是从起点开始,一步步尝试各条路,直到到达终点。
这像一个人在迷宫里:
- 从入口开始,有左、中、右三条分岔路
- 先尝试一条(比如左边)
- 走了一段,如果似乎有希望就继续深入
- 如果走不通,回头,再试其他的
- 重复这个过程
这就是"搜索"。
4. 搜索的代价
搜索需要时间和资源。
- 时间成本:AI "想"每一步需要时间(token预算)
- 精力成本:要记住走过的路、试过的死胡同
所以目标是:找到答案,并且走的弯路尽可能少。
优化搜索的五大策略
现在来看,怎么让 AI 更聪明地找路。
策略 1️⃣ :预先指路(Commands)
场景:你告诉迷宫里的人"先向北走"
这不是告诉他答案,而是指出一个好的初始方向,让他不浪费时间往南或往东。
不指路:AI 会尝试所有方向
指路:"用 /commit 命令" → AI 直接走向正确的方向
效果:大幅减少初期搜索的分散。
策略 2️⃣ :提供捷径(Skills)
场景:有人告诉你"从这里可以直接走地下通道到那里"
地下通道不是新发明的,而是已知的最优路线,谁都可以走。
不用 Skill:AI 要自己推理如何修改代码、如何测试、如何提交
使用 Skill:AI 直接调用 /commit,相当于走预制好的捷径
效果:消除重复思考,节省大量 token。
关键理解:Skill 不是限制 AI,而是让 AI 不必重复解决已解决的问题。
策略 3️⃣ :连接孤岛(MCP)
场景:迷宫的两个区域本来没有通道,但 MCP 挖出了一条新通路
问题:
- AI 知道"如何编写代码"
- AI 知道"如何查询数据库"
- 但 AI 不知道"怎么连接这两者"
MCP 的作用:
- 添加一条新的"边"
- 让 AI 可以在思考过程中直接查询数据库
例子:
- 没有 MCP:AI 只能说"应该查一下数据库",不能真的查
- 有 MCP:AI 可以直接执行查询,得到实际结果
效果:扩大 AI 能到达的区域。
策略 4️⃣ :标记热点(Memory)
场景:你在迷宫里留下标记"这条路经常有用"
下次来时,先往这条路走。
第一次:AI 花了 10 步找到解决方案
第二次:同类问题,AI 优先尝试同一类路线,快速找到答案
在代码项目中:
- 项目的常见问题 → 记录在 memory 里
- 编码规范 → 记录在 memory 里
- 下次 AI 遇到类似问题,优先想到这些规则
效果:提升重复任务的效率,减少搜索分散。
策略 5️⃣ :背景地图(知识库)
场景:你有一份迷宫的部分地图
虽然不完整,但能让你做更好的决策。
没有地图:你要走每一条路才知道它通不通
有地图:你看一眼就知道这条路应该往哪边走
在 AI 中:
- 团队知识库 = 这个项目的"地图"
- 编码规范文档 = 路线信息
- 架构设计文档 = 重要节点信息
效果:改进 AI 的"直觉",减少错误的尝试。
必要的约束:为什么要设置禁区
6. 为什么有些东西不能做
想象一个迷宫里设置了"禁区"——某些区域不能进。
这不是在难为你,而是在保护你:
- 某些死胡同特别深,浪费时间
- 某些操作太危险(比如直接修改生产数据库)
- 某些路太长,超过时间限制就会卡死
AI 的约束包括:
1. Token 限制 ← "你只有一小时找路,别浪费"
2. 权限限制 ← "有些文件夹你进不去"
3. CLAUDE.md 规则 ← "有些操作禁止做"
关键理解:这些约束不是限制,而是有效搜索的必要条件。
动态的图:问题在不断变化
7. 为什么 AI 有时候会"突然想到"新方法
迷宫不是静止的。每获取一个新信息,图就会改变。
第一步:读了一个文档
→ 发现了三条新的可能路线
第二步:尝试第一条路线,失败了
→ 这条路变成"已排除",图重新调整
第三步:调用了一个工具,得到新数据
→ 突然出现了新的机会
这就是为什么:
- 同一个问题,AI 可能给出不同的答案(因为搜索环境变了)
- 多尝试一次可能获得更好的答案(因为图已更新)
- 数据、文档、工具很重要(它们改变了可用的路线)
实际启示:怎样和 AI 更高效地合作
8. 应用这个模型
现在你知道了 AI 的工作原理,如何利用这个理解?
✅ 做这些事,帮助 AI 更快找到答案:
| 你的做法 | 对应的图论操作 | 效果 |
|---|---|---|
| 给出清晰的问题描述 | 准确定义起点和终点 | AI 不会往错误方向走 |
| 提供相关文档链接 | 提供部分地图信息 | AI 能做更好的决策 |
| 告诉 AI 用什么工具 | 预先指路(Strategy 1) | 减少初期分散 |
| 要求 AI 按照规范做 | 设置有效约束 | AI 不走弯路 |
| 记录项目的常见模式 | 维护 Memory(Strategy 4) | 重复任务快速解决 |
❌ 避免这些,否则会增加搜索成本:
| 你的做法 | 对应的图论问题 | 后果 |
|---|---|---|
| 模糊的、多义的问题 | 不清楚终点在哪 | AI 搜索分散,尝试各种方向 |
| 错误的假设 | 误导地图 | AI 往错地方走 |
| 频繁改需求 | 不断移动终点 | 之前的搜索都白费了 |
| 权限问题 | 突然禁入某个区域 | AI 的路被卡死,得重新规划 |
为什么 AI 有时候"不理解"
9. 搜索失败的三个原因
【情况 1】:图太稀疏
问题:信息不足,节点之间连接太少
原因:知识库缺少,文档不全
解决:补充信息
【情况 2】:搜索时间不足
问题:Token 用完了,还没找到答案
原因:问题太复杂,需要很多步才能解决
解决:拆分成更小的问题
【情况 3】:目标本身有问题
问题:AI 找不到任何通向终点的路
原因:需求本身矛盾,或需求超过 AI 能力
解决:重新审视目标是否合理
总结:AI 就是一个高级迷宫解决者
| 比喻 | 现实 |
|---|---|
| 迷宫 | 问题空间 |
| 入口 | 用户输入(问题) |
| 出口 | 答案 |
| 走路 | 推理和计算 |
| 指路 | Commands |
| 捷径 | Skills |
| 新通道 | MCP |
| 地图 | 知识库 |
| 标记 | Memory |
| 禁区 | 约束和权限 |
| 搜索步数 | Token 成本 |
核心理解:
- ✅ AI 不是"知道所有答案",而是"会搜索答案"
- ✅ 帮助 AI 找到答案的方式 = 优化搜索
- ✅ 优化搜索 = 提供更好的地图、指路、捷径
- ✅ 约束和权限不是限制,而是让搜索更高效
推荐阅读
如果你想进一步了解:
- 启发式搜索:为什么 AI 不是完全随机尝试,而是"有直觉"地选择
- 强化学习:为什么 AI 会从失败中学习,下次搜索会更聪明
- 知识图谱:如何组织信息,让搜索更高效
最后的话:
下次当 AI 给出一个出乎意料的答案时,不要认为它"太神奇"或"不可思议"。
它其实就是:在一个复杂的关系网络中,从你的问题出发,通过推理、调用工具、查询信息,一步步走向答案。
有时候快,有时候慢。有时候直接,有时候走了弯路。
就像任何聪明的问题解决者一样。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)