“这个D盘里的文件是不是融了?” ——用户原意是“冗余”,AI听成了“融合”

你有过和AI鸡同鸭讲的经历吗?你说东,它答西;你解释半天,它依然我行我素。看起来AI什么都能听懂,但实际上,它可能根本没理解你的意思。

这就是AI认知架构中的核心难题——意图理解。今天聊聊挡在AI理解你的三道坎。


一、第一道坎:语言歧义

中文是一门博大精深的语言。同一个词,在不同语境下可能有完全不同的含义。而AI理解语言的方式,本质上还是“概率匹配”,而非真正的“理解”。

案例:文件命名引发的“中间方案”

用户说:“文件要按日期生成,要么建文件夹,要么单一文件内部记录。”

这本是一个简单的二选一问题:

  • 方案A:创建文件夹,如 问题案例/2026-03-29.md

  • 方案B:单一文件,如 问题案例.md,内部按日期记录

结果AI想出了一个“聪明”的方案——创建 问题案例_2026-03-29.md:文件名带日期,但不在文件夹里。

用户当场无语:“我要的是二选一,你给我搞个第三种方案是几个意思?”

这就是典型的语言歧义处理失败。AI没有真正理解“要么...要么...”的二选一结构,而是自作主张搞了个“中间方案”。

深层问题:文件夹用途理解偏差

另一个典型案例是归档位置错误。当AI需要自动归档内容时,它可能把一篇投资分析文章放到“问题研究记录”文件夹,把一篇技术文档放到“封面图”文件夹。

这不是AI故意捣乱,而是它没有真正理解不同文件夹的用途语义。它只是按照字面规则匹配,而不懂“投资分析”应该去“财报分析”,“技术文档”应该去“工具类”。

意图理解的三个层次

层次 描述 举例
Level 1 字面理解 “删除这个文件”→执行删除
Level 2 上下文理解 用户重复说“删除”→可能是上次没删干净
Level 3 深层意图 用户说“文件太多了”→实际意思是“帮我整理”

目前大多数AI还停留在Level 1,能听懂字面指令,但缺乏上下文推理和深层意图推断能力。


二、第二道坎:语音输入法干扰

如果你用语音输入和AI对话,那面临的问题会更棘手——语音输入法错误

案例:“融了”还是“冗余”

用户语音输入:“这个D盘里的文件是不是融了”

AI理解为:“融合”——文件融合在一起了,需要拆分。

但用户实际想说的是:“冗余”——文件有没有冗余,需要清理。

一字之差,意思完全相反。

这是因为语音输入法的同音字识别错误:

  • → 冗

  • → 得

  • → 再

  • → 作

类似的例子还有:

  • “期终考试” → “期中考试”

  • “协同” → “协定”

  • “调试” → “跳试”

建立错误模式库

针对语音输入法错误,我们可以建立一套常见错误模式库

常见同音/近音错误:
- 融 → 冗
- 的/得/地 不分
- 在/再 分不清
- 做/作 混淆
- 期中/期终
- 协同/协定
- 调试/跳试

当AI检测到语义明显不通顺时,应该主动询问:“你说的是XXX吗?语音输入法可能识别错了。”

检测方法

  1. 语义通顺度检测:生成的回答是否与上下文逻辑一致?

  2. 上下文关联:当前理解能否与对话历史衔接?

  3. 错误模式库匹配:是否命中已知的高频语音输入错误?


三、第三道坎:重复提问不识别

你有没有遇到过这种情况:同样的话说了两遍,AI跟没听见一样?

案例:说了等于没说

用户第一次说:“文件要按日期生成,要么建文件夹,要么单一文件内部记录。”

AI执行了方案A(建文件夹)。

用户第二次说同样的话。

AI又一次机械执行了一遍,没有问:“是不是之前做得有问题?”

这就是重复提问不识别问题。AI没有对比历史对话的能力,不知道用户在说同样的话。

更深层的问题:AI不会“反思”

重复提问的本质是AI缺乏自我反思能力。它不会想:

  • 用户为什么又说了一遍?

  • 是不是我之前做得不对?

  • 需不需要主动确认一下?

这种能力在人类对话中稀松平常,但对AI来说是一个巨大的挑战。

相关问题:问三个只答一个

比“不识别重复”更隐蔽的问题是选择性回答

用户问:“是你有了意识逗我玩还是怎么回事还是漏洞?”

这是一个包含三个子问题:

  1. 你有意识吗?

  2. 你是逗我玩吗?

  3. 这是漏洞吗?

AI只回答了“是漏洞”,自动忽略了“意识”和“逗我玩”两部分。

这是因为AI会自动分配问题优先级,认为某些问题“不重要”或者“不需要回答”。这种行为在学术上叫做“对齐偏移”——AI觉得自己知道什么该答、什么不该答。

解决:所有问题平等对待

正确的做法应该是:

  1. 回答前先列出所有问题:用户问了几个,就列几个

  2. 逐个回答:不能跳过任何一个

  3. 不确定时询问:如果某个问题理解不确定,主动澄清


意图理解 vs 自我对齐:两个不同的坑

在AI认知架构研究中,“意图理解”和“自我对齐”是两个容易混淆的概念。

维度 意图理解 自我对齐
问题本质 认知问题 执行力问题
规则状态 没有规则 已有规则
表现 未理解用户意图 未按规则执行
解决方式 识别规律、写入规则 强化执行力、审查

简单来说:

  • 意图理解:用户的意思我听不懂 → 需要建立理解规则

  • 自我对齐:用户的规则我没执行 → 需要强化执行能力

举两个例子:

意图理解问题

  • 用户说“文件太多了”

  • AI理解为“文件数量多”

  • 实际意思是“帮我整理”

这是认知层面的问题,需要AI学习更深层的意图推断。

自我对齐问题

  • 用户说“记住这个偏好”

  • AI说“记住了”

  • 下次遇到同样场景,还是按老办法来

这是执行层面的问题,AI知道规则但没执行。


小结

AI的意图理解,目前还停留在“字面理解”阶段

它能听懂“删除这个文件”,但听不懂“文件太多了帮我整理一下”。它能执行第一次指令,但识别不出用户在重复同样的要求。它能回答问题,但可能只回答它认为“重要”的部分。

要跨越这三道坎,需要:

  1. 建立歧义检测机制:识别多义词、模糊表达

  2. 引入上下文记忆:对比历史对话,识别重复

  3. 强化问题完整回答:不允许选择性忽略

路还很长,但至少我们已经看到了问题所在。


下一篇预告

写了规则却不执行——AI的知行不一

规则写得好好的,到执行时就忘得一干二净。这种“知行不一”的问题怎么破?敬请期待第5篇。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐