对话模型为什么越聊越假？我们重做了一套AI聊天逻辑

SentiPulse

418人浏览 · 2026-04-21 20:31:44

SentiPulse · 2026-04-21 20:31:44 发布

摘要：当前大多数对话模型，本质上仍在优化单轮回复质量，却忽略了长期交互中人与 AI 的关系演化。本文从系统角度拆解模型“不会变化”的根本原因，并分享我们在推理架构（PTA）以及训练机制（Stateful GRPO）上的一套完整重构实践，尝试让对话模型具备持续成长的能力。

你有没有发现，很多 AI 一开始聊起来很好，但聊久了会变得无聊？

不是它不聪明，而是它从来没有真正发生过变化。

问题根源不在产品体验，而在对话模型本身的设计方式。

更具体地说，我们在尝试回答一个更长期的问题：人与 AI 之间，是否可以形成真正的关系？

一、为什么 AI 聊久了会“没感觉”？

在很多 AI 陪伴类产品中，用户往往会经历一个类似的过程。最开始的对话体验很好，模型回应得体、情绪稳定、表达自然。但随着对话持续，问题开始逐渐显现：无论聊了多久，你和 AI 的关系始终没有变化。模型不会因为更了解你而变得亲近，也不会因为一次不愉快而有所保留。所有互动看起来是连续的，但本质上仍然是“每一轮独立生成”。

这带来一个更底层的问题：如果一段交互始终不会变化，它还能被称为“关系”吗？我们认为，这不是产品层的问题，而是当前对话模型范式的限制。

从系统角度来看，这个问题主要来自两个层面：

推理层：长对话中，重要信息会被稀释

在推理层，问题源于基于 Transformer 的注意力机制。随着对话轮数增加，上下文不断变长，每一段信息分到的注意力逐渐降低。这会导致一个关键现象：重要信息在数学上“变轻了”。例如一句“我今天心情很差”，在人与人之间的关系中，这样的话往往会被放大理解，但在模型中，它只是数万个 token 中的一小部分，很难被突出建模。最终的结果是，情绪难以积累，语气很难发生明显变化，模型整体表现趋于稳定。

训练层：模型表达会趋于安全稳定

训练层的问题则更加隐蔽。当前主流对话模型大多基于 RLHF，其优化目标通常包括安全性、有用性和一致性。这会在长期训练中逐渐收敛到一套“高分策略”，表现为固定的表达长度、相似的句式结构以及稳定的语气风格。我们将这种现象称为：开放域对话的模式坍缩（Open-Domain Dialogue Mode Collapse）。更关键的是，现有的奖励函数通常是逐轮评估的，只关心当前这条回复是否足够好，却不会考虑它是否与历史回复过于相似，或者是否缺乏变化。一旦模型找到一套稳定高分的表达方式，就会反复使用，最终形成稳定的行为模式。

相比之下，我们更关注的是长期交互中人与 AI 的关系演化，而不仅仅是单轮回复质量。我们的目标是让 AI 在持续交互中具备变化和成长能力。为此，我们从单一角色 SUSU 出发，基于 8B 模型底座构建了一个真正会“成长”的对话模型，并在对话系统设计上做了三层重构，让模型能感知变化、做出不同决策。

二、重构陪伴类对话模型

做法一：状态建模，让当下变得更重要

首先是在状态建模上，我们不再依赖模型从上下文中自己理解，而是把额外的关键状态显式提供给它。在每一轮对话中，系统都会构建一个包含环境、时间、记忆、情感、话题和关系的六维全局状态 S_t。这些信息与用户输入一起作为模型的决策依据。

外部感知：

- 环境：对话发生在什么物理空间，有哪些视觉线索

- 时间：不只是时间戳，还包括相对感知（如：“明天”、“半小时后”）和语义融合（如：“你上周感冒了，现在好些了吗？”)

内部认知：

- 记忆：跨对话的长期存储，历史事件，用户画像

- 情感：当前会话的情绪状态，有惯性，会演化

- 话题：当前主题的连续性，支持发起、深化、转换

- 关系：社交距离的量化，从陌生到亲密，随每次交互动态更新

其中，“关系”是最关键的一维，它不再是一个静态标签，而是一个会随每轮对话动态变化的变量，可以前进，也可以后退，并直接影响后续的回复策略。这使得“关系”第一次成为一个可计算的对象，而不是人为设定的角色属性。

做法二：PTA 架构，让模型来得及思考

我们把决策过程拆成三层：感知、思考、行动（Perception-Thinking-Action，PTA），每层有不同的延迟预算。

P 感知层：判断发生了什么

感知层不生成内容，只做判断。把“当前发生了什么”拆成一组并行的二分类问题：情感有没有变化、话题有没有转移、需不需要调用记忆、需不需要搜索、要不要保持沉默......借助 Prefix Caching，所有判断共享同一份预计算好的 KV-cache，整个感知层的判断在 30-50ms 内完成。

这一层解决了注意力稀释问题。与其让模型自己从几万个 Token 里感知变化，不如把变化显式地标记出来，直接告诉后续层“这里发生了情感变化”、“话题转移了”，而不是让模型自己去猜。