测量预测值Ŷ与某些真实值匹配程度。MSE 通常用作回归问题的损失函数。例如,根据其属性估算公寓的价格。

这是维基百科中定义的均方误差 (MSE) 公式。它代表了一个非常简单的概念,但如果您刚开始使用 ML,可能不太容易读懂。

让我们从内而外拆开包装。MSE 计算模型的预测 Ŷ 与真实标签 Y 的接近程度。您希望误差变为 0。如果您预测房价,误差可能是预测价格与实际价格之间的差异。


从标签中减去预测是行不通的。误差可能为负也可能为正,这是对样本求和时的问题。您可以取绝对值或误差的平方。取平方有一个特性,它惩罚更大的错误更多。

想象一下你对两栋房子的价格的

预测是这样的: 房子 1:实际 120K,预测 100K -> 误差 20K

房子 2:实际 60K,预测 80K -> 误差 -20K

如果你把这些加起来,误差将为 0,这显然是错误的......

在训练模型时,您的批次中将有许多样本 (n)。我们需要计算每一个的误差并求和。同样,在这里让误差始终≥ 0 很重要。

如果要比较不同大小批次的误差,则需要对样本数量进行归一化——取平均值。例如,您可能想查看哪个批次大小产生的误差较小。

现在应该更容易理解公式了!MSE 是 ML 回归模型(例如线性回归)中常用的统计度量和损失函数。您还应该查看平均绝对误差 (MAE),它可以更好地处理异常值。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐