AI大模型推理的不确定性建模有哪些方法

AI_Encyc · 2026-05-18 20:32:52 发布

不确定性建模是提升大型语言模型（LLM）可信度和可靠性的核心挑战。根据现有研究，主要方法可分为以下几大类：

贝叶斯方法是量化不确定性的理论基础，核心思想是将模型参数视为概率分布而非点估计。该方法可以优雅地将不确定性分解为两类：

贝叶斯神经网络（BNN）通过计算参数的后验分布来建模不确定性，但由于精确计算在大型模型中难以实现，实践中通常采用近似方法：

这些方法需要白盒访问模型参数，对基于API的黑盒模型适用性有限。

集成方法通过利用多个模型版本或输出之间的多样性来估计不确定性，可分为三类：

基于方差的方法：如蒙特卡罗Dropout和深度集成，通过预测之间的方差衡量不确定性
基于一致性的方法：特别适用于黑盒LLM，通过多次生成响应之间的一致性来评估不确定性。包括普通方法（同一提示多次呈现）、对抗性方法（对输入引入扰动）和重新验证方法（LLM检查自身响应的一致性）
基于相似性的方法：通过测量多个响应之间的语义相似性提供连续的不确定性估计，常采用自然语言推理（NLI）模型计算相似度

信息论度量提供了一种原则性的量化方法，特别适用于能输出令牌概率分布的模型：

针对大型推理模型（LRM），传统方法无法为推理答案的生成提供有限样本保证。共形推理-答案预测（CoRAP）框架 提出了联合量化推理-答案结构不确定性的方法，定义了三个质量函数：

该方法提供了统计上严格的保证，并开发了基于Shapley值的解释框架来识别关键训练示例和推理步骤。

上海AI Lab提出的RePro方法 从优化视角重塑推理过程，将推理轨迹视为在损失曲面上寻找最优解的路径。其核心思想包括：

代理目标函数J：量化模型在当前推理上下文下对正确答案的置信度，有效推理路径上J会平稳上升
双重评分机制：
- 强度评分（Magnitude Score）：衡量推理对答案信心的提升幅度
- 稳定性评分（Stability Score）：使用Kendall’s Tau相关系数衡量推理路径是否平滑上升
熵值筛选策略：只对推理链中熵最高的关键段落进行奖励计算，在模型最迷茫的时刻给予指引

这种方法不仅提高了准确率，还显著减少了推理token数量和回溯行为。

通过直接修改损失函数，对最终错误的预测给予更高的不确定性奖励，从而产生更可靠的估计。不确定性敏感调优方法教会模型在高不确定性情况下进行弃权（abstention），同时保持校准能力。

虽然量化主要用于加速推理，但不同的量化策略（FP32、FP16、BF16、INT8、INT4）对模型的校准能力有显著影响。选择合适的量化精度需要在效率与不确定性估计可靠性之间取得平衡。