AI 解决问题的本质:图搜索模型

一个帮助理解 AI 工作方式的新视角


引言:从迷宫说起

想象你被关在一个巨大的迷宫里,需要从入口(问题)找到出口(答案)

你不知道迷宫的全貌,只能一步步摸索:

  • 有时候走到死胡同(尝试失败)
  • 有时候走了很远才发现这不是最近的路(低效)
  • 有时候有人告诉你"先向北走 3 步"(省了很多时间)

这就是 AI 解决问题的方式。


核心模型:问题是一张图

1. 什么是"图"?

不是画图,而是一张关系网络图

简单类比

  • 从北京到上海,有多条路线
    • 飞机
    • 高铁
    • 汽车
    • 可能还有其他组合方式
  • 每个路线都通过不同的"中转站"(北京→南京→上海,或北京→杭州→上海)
问题空间中的"图"就是这样:

    【问题】
      ↓
    多条可能的解决思路
      ↓
    【答案】

2. 图的三个要素

要素 是什么 例子
节点 问题解决过程中的各个状态/信息 代码片段、文档、工具输出、中间结论
从一个状态到另一个状态的操作 阅读文档、调用工具、修改代码、推理
最短路 从问题到答案最快的路径 高效的解决方案

日常例子

  • 你要修家里的水龙头
  • 节点:问题(龙头漏水)→ 获取工具 → 拆卸 → 维修 → 安装(解决)
  • 边:每一个步骤的操作
  • 最短路:不走弯路的修理流程

AI 的搜索方式:穿过迷宫找出口

3. 基本策略:逐步尝试

AI 的工作方式就是从起点开始,一步步尝试各条路,直到到达终点。

这像一个人在迷宫里:

  • 从入口开始,有左、中、右三条分岔路
  • 先尝试一条(比如左边)
  • 走了一段,如果似乎有希望就继续深入
  • 如果走不通,回头,再试其他的
  • 重复这个过程

这就是"搜索"

4. 搜索的代价

搜索需要时间和资源

  • 时间成本:AI "想"每一步需要时间(token预算)
  • 精力成本:要记住走过的路、试过的死胡同

所以目标是:找到答案,并且走的弯路尽可能少。


优化搜索的五大策略

现在来看,怎么让 AI 更聪明地找路。

策略 1️⃣ :预先指路(Commands)

场景:你告诉迷宫里的人"先向北走"

这不是告诉他答案,而是指出一个好的初始方向,让他不浪费时间往南或往东。

不指路:AI 会尝试所有方向
指路:"用 /commit 命令" → AI 直接走向正确的方向

效果:大幅减少初期搜索的分散。


策略 2️⃣ :提供捷径(Skills)

场景:有人告诉你"从这里可以直接走地下通道到那里"

地下通道不是新发明的,而是已知的最优路线,谁都可以走。

不用 Skill:AI 要自己推理如何修改代码、如何测试、如何提交
使用 Skill:AI 直接调用 /commit,相当于走预制好的捷径

效果:消除重复思考,节省大量 token。

关键理解:Skill 不是限制 AI,而是让 AI 不必重复解决已解决的问题。


策略 3️⃣ :连接孤岛(MCP)

场景:迷宫的两个区域本来没有通道,但 MCP 挖出了一条新通路

问题:
  - AI 知道"如何编写代码"
  - AI 知道"如何查询数据库"
  - 但 AI 不知道"怎么连接这两者"

MCP 的作用:
  - 添加一条新的"边"
  - 让 AI 可以在思考过程中直接查询数据库

例子

  • 没有 MCP:AI 只能说"应该查一下数据库",不能真的查
  • 有 MCP:AI 可以直接执行查询,得到实际结果

效果:扩大 AI 能到达的区域。


策略 4️⃣ :标记热点(Memory)

场景:你在迷宫里留下标记"这条路经常有用"

下次来时,先往这条路走。

第一次:AI 花了 10 步找到解决方案
第二次:同类问题,AI 优先尝试同一类路线,快速找到答案

在代码项目中

  • 项目的常见问题 → 记录在 memory 里
  • 编码规范 → 记录在 memory 里
  • 下次 AI 遇到类似问题,优先想到这些规则

效果:提升重复任务的效率,减少搜索分散。


策略 5️⃣ :背景地图(知识库)

场景:你有一份迷宫的部分地图

虽然不完整,但能让你做更好的决策。

没有地图:你要走每一条路才知道它通不通
有地图:你看一眼就知道这条路应该往哪边走

在 AI 中:

  • 团队知识库 = 这个项目的"地图"
  • 编码规范文档 = 路线信息
  • 架构设计文档 = 重要节点信息

效果:改进 AI 的"直觉",减少错误的尝试。


必要的约束:为什么要设置禁区

6. 为什么有些东西不能做

想象一个迷宫里设置了"禁区"——某些区域不能进。

这不是在难为你,而是在保护你

  • 某些死胡同特别深,浪费时间
  • 某些操作太危险(比如直接修改生产数据库)
  • 某些路太长,超过时间限制就会卡死
AI 的约束包括:
1. Token 限制 ← "你只有一小时找路,别浪费"
2. 权限限制 ← "有些文件夹你进不去"
3. CLAUDE.md 规则 ← "有些操作禁止做"

关键理解:这些约束不是限制,而是有效搜索的必要条件


动态的图:问题在不断变化

7. 为什么 AI 有时候会"突然想到"新方法

迷宫不是静止的。每获取一个新信息,图就会改变。

第一步:读了一个文档
  → 发现了三条新的可能路线

第二步:尝试第一条路线,失败了
  → 这条路变成"已排除",图重新调整

第三步:调用了一个工具,得到新数据
  → 突然出现了新的机会

这就是为什么:

  • 同一个问题,AI 可能给出不同的答案(因为搜索环境变了)
  • 多尝试一次可能获得更好的答案(因为图已更新)
  • 数据、文档、工具很重要(它们改变了可用的路线)

实际启示:怎样和 AI 更高效地合作

8. 应用这个模型

现在你知道了 AI 的工作原理,如何利用这个理解?

✅ 做这些事,帮助 AI 更快找到答案:
你的做法 对应的图论操作 效果
给出清晰的问题描述 准确定义起点和终点 AI 不会往错误方向走
提供相关文档链接 提供部分地图信息 AI 能做更好的决策
告诉 AI 用什么工具 预先指路(Strategy 1) 减少初期分散
要求 AI 按照规范做 设置有效约束 AI 不走弯路
记录项目的常见模式 维护 Memory(Strategy 4) 重复任务快速解决
❌ 避免这些,否则会增加搜索成本:
你的做法 对应的图论问题 后果
模糊的、多义的问题 不清楚终点在哪 AI 搜索分散,尝试各种方向
错误的假设 误导地图 AI 往错地方走
频繁改需求 不断移动终点 之前的搜索都白费了
权限问题 突然禁入某个区域 AI 的路被卡死,得重新规划

为什么 AI 有时候"不理解"

9. 搜索失败的三个原因

【情况 1】:图太稀疏
  问题:信息不足,节点之间连接太少
  原因:知识库缺少,文档不全
  解决:补充信息

【情况 2】:搜索时间不足
  问题:Token 用完了,还没找到答案
  原因:问题太复杂,需要很多步才能解决
  解决:拆分成更小的问题

【情况 3】:目标本身有问题
  问题:AI 找不到任何通向终点的路
  原因:需求本身矛盾,或需求超过 AI 能力
  解决:重新审视目标是否合理

总结:AI 就是一个高级迷宫解决者

比喻 现实
迷宫 问题空间
入口 用户输入(问题)
出口 答案
走路 推理和计算
指路 Commands
捷径 Skills
新通道 MCP
地图 知识库
标记 Memory
禁区 约束和权限
搜索步数 Token 成本

核心理解

  • ✅ AI 不是"知道所有答案",而是"会搜索答案"
  • ✅ 帮助 AI 找到答案的方式 = 优化搜索
  • ✅ 优化搜索 = 提供更好的地图、指路、捷径
  • ✅ 约束和权限不是限制,而是让搜索更高效

推荐阅读

如果你想进一步了解:

  • 启发式搜索:为什么 AI 不是完全随机尝试,而是"有直觉"地选择
  • 强化学习:为什么 AI 会从失败中学习,下次搜索会更聪明
  • 知识图谱:如何组织信息,让搜索更高效

最后的话

下次当 AI 给出一个出乎意料的答案时,不要认为它"太神奇"或"不可思议"。

它其实就是:在一个复杂的关系网络中,从你的问题出发,通过推理、调用工具、查询信息,一步步走向答案。

有时候快,有时候慢。有时候直接,有时候走了弯路。

就像任何聪明的问题解决者一样。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐