ACL 2025 论文解读：《A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive》

m0_65481401

380人浏览 · 2026-05-10 22:25:16

m0_65481401 · 2026-05-10 22:25:16 发布

在这里插入图片描述

本文面向大模型工程师和 NLP 从业者，帮助理解 ACL 2025 最佳论文《A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive》的核心贡献、方法逻辑及工程启发，同时可用于面试复盘。

论文背景与研究问题

大语言模型（LLM）在自动化决策中被广泛使用，它们从大量可能输出中采样。
作者指出，LLM 的采样行为包含两种成分：

描述性成分（Descriptive）：反映统计常态，模型倾向选择概率高的选项
规范性成分（Prescriptive）：反映理想状态或偏好，模型偏向理想化选项

这种偏离统计常态的采样可能导致决策偏差。

过去方法与不足

早期研究关注输出连贯性，但未分析采样机制
LLM 概率采样表现不佳，生成样本与统计分布不一致
缺乏理论框架解释描述性与规范性偏差

核心思路与创新

提出 LLM 采样由描述性与规范性驱动
规范性偏差可能与人类偏好不一致
通过实验展示规范性偏差普遍存在
工程启发：理解偏差有助优化 LLM 决策并控制伦理风险

方法结构与关键公式

样本采样定义

LLM 从概念可能输出分布中采样：

$\sim f(\text{Descriptive Component}, \text{Prescriptive Component})$

公式符号解释：

$S (C)$ ：模型对概念 C 的采样输出
Descriptive Component：描述性成分
Prescriptive Component：规范性成分

偏离度量 α

$\alpha = (A(C) - S(C)) \times \text{sign}(A(C) - I(C))$

公式符号解释：

$A (C)$ ：统计平均
$I (C)$ ：理想值
$S (C)$ ：采样值
$α>0\alpha > 0$ ：样本向理想值偏移
$α^=α∣A(C)−I(C)∣\hat{\alpha} = \frac{\alpha}{|A(C) - I(C)|}$ ：归一化偏移

Softmax 采样概率

$\frac{e^{C_v(x)}}{\sum_{x'} e^{C_v(x')}} \times C_\mu(x)$

公式符号解释：

$C_v(x)$ ：规范性得分
$Cμ(x)C_\mu(x)$ ：统计概率
$P (x)$ ：采样概率

实验设计与结论

实验 1：虚构概念 Glubbing
- 结果显示样本平均 (S©) 随规范性变化
实验 2：真实概念 500 个，10 个领域
- 样本偏向理想值，规范性影响随模型大小增加
- RLHF 强化规范性偏差

示例表格：

模型	规范性偏差显著性 p	概念偏移比例
Llama-2-7B	6.837e-02	0.539
Llama-2-13B-chat	3.023e-10	0.642
GPT-4	5.506e-15	0.680
Claude	1.582e-16	0.688
Llama-3-70B-Instruct	5.382e-35	0.777

原型与规范性

LLM 对概念原型评估受统计平均与理想值影响
示例：

概念	平均	理想	原型
高中教师	2.75	3.66	3.86
祖母	4.16	4.66	4.75
狗	3.08	3.83	3.86

局限性与未来方向

规范性来源尚不清晰
未研究规范性对 System-2 决策长期影响
原型与采样偏差机制需进一步探索

工程落地启发

监控规范性偏差，尤其在医疗或经济场景
使用多模型验证偏移一致性
RLHF 设计需注意强化偏差风险
归一化指标 (\hat{\alpha}) 可量化偏差程度

面试可能问的问题

问题	回答思路
描述性和规范性成分？	描述性反映统计常态，规范性反映理想状态
LLM 样本偏移如何衡量？	使用 α 或 (\hat{\alpha}) 衡量偏移
规范性偏差与模型大小相关吗？	越大模型偏差越明显，RLHF 会强化
如何工程缓解？	监控分布，归一化训练数据，多模型评估

个人理解与总结

LLM 采样由描述性+规范性驱动，偏离统计均值向理想值
规范性偏差可能与人类理想不一致
α 和 (\hat{\alpha}) 可量化偏移
RLHF、模型大小、提示都影响规范性偏差

一句话总结：

ACL 2025 论文展示 LLM 采样的描述性和规范性偏差，提示在应用中关注规范性偏差对决策的影响，并提供量化和工程控制方法。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于模型预测算法的混合储能微电网双层能量管理系统研究(Matlab代码实现）

可再生能源（RES）和储能系统（ESS）在微电网中的集成为最终用户和系统运营商提供了潜在的利益。然而，对于微电网的经济运行，需要对可再生能源的间歇性问题和ESS的高成本进行审查。本文提出了一种由电池和超级电容器组成的混合ESS微电网的两层预测能量管理系统（EMS）。考虑到混合ESS在充电深度（DOD）和寿命方面的退化成本，电池和超级电容器的长期成本被建模并转化为与实时操作相关的短期成本。

AtomGit开源社区

发电机故障暂态仿真及电压电流变化特性研究（Simulink仿真实现）

同步发电机作为电力系统的核心发电设备，其运行稳定性直接决定电网供电可靠性。电网运行过程中各类短路、接地故障会引发发电机电磁暂态过程，造成机端电压、定子电流等电气参数剧烈波动，极易导致机组失稳、设备损毁甚至大面积停电事故。为系统探究发电机故障状态下的电气量演化规律，本文搭建标准化发电机电磁暂态仿真模型，模拟单相接地短路、两相短路、三相短路三类典型故障工况，通过仿真观测不同故障发生、发展及恢复全过程中

AtomGit开源社区

三相逆变器模型仿真LCL逆变器(软开关)研究（Simulink仿真实现）

新能源并网、储能变流与电机驱动场景对三相逆变器的转换效率、电能质量与电磁兼容性能提出更高要求。传统两电平硬开关三相逆变器搭配 LCL 滤波器方案存在高频开关损耗大、器件电压电流应力剧烈、高频电磁干扰突出等短板，限制开关频率提升与整机功率密度优化。软开关技术依托谐振辅助支路，令主功率器件在零电压或零电流状态完成开通与关断动作，可大幅削减开关损耗，同时抑制电压、电流变化速率，与 LCL 高阶滤波结构结