二分类:与 Sigmoid 传递函数结合使用,标签为0或1。
多分类:与 Softmax 传递函数结合使用,将输出转换为概率分布,标签为one hot编码形式。


二元交叉熵误差函数(Binary Cross-Entropy Loss)是二分类问题中常用的误差函数,用于衡量模型预测概率与真实标签之间的差异。

二分类问题中,输出层只需要一个神经元,使用sigmoid函数,以确保预测概率在[0,1][0, 1][0,1] 之间,表示样本属于正类别的概率。而使用softmax函数时,输出层需要两个神经元,分别表示样本属于两个类别的概率。这两个概率值是冗余的(一个是1减去另一个),且会增加模型的复杂度和参数量。

对于二分类问题,使用二元交叉熵误差函数(Binary Cross-Entropy Loss),该误差函数与sigmoid函数的输出形式相匹配,直接计算预测概率与真实标签之间的差异。


对于单个样本,二元交叉熵误差函数为:

L=−[ylog⁡(p)+(1−y)log⁡(1−p)] L = -\left[ y \log(p) + (1- y) \log(1- p) \right] L=[ylog(p)+(1y)log(1p)]

其中

yyy:真实标签,取值为 0 或 1。
ppp:模型预测为正类的概率,取值范围为[0,1][0, 1][0,1]

对于包含NNN 个样本的数据集,总误差为:

L=−1N∑i=1N[yilog⁡(pi)+(1−yi)log⁡(1−pi)] L = -\frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(p_i) + (1- y_i) \log(1- p_i) \right] L=N1i=1N[yilog(pi)+(1yi)log(1pi)]


解释

y=1y = 1y=1 时:

L=−log⁡(p) L = -\log(p) L=log(p)

若模型预测p→1p \rightarrow 1p1,则误差L→0L \rightarrow 0L0,表示预测正确。
若模型预测p→0p \rightarrow 0p0,则误差L→+∞L \rightarrow +\inftyL+,表示预测错误。

y=0y = 0y=0 时:

L=−log⁡(1−p) L = -\log(1- p) L=log(1p)

若模型预测p→0p \rightarrow 0p0,则误差L→0L \rightarrow 0L0,表示预测正确。
若模型预测p→1p \rightarrow 1p1,则误差L→+∞L \rightarrow +\inftyL+,表示预测错误。


在二分类问题中,通常将 Sigmoid 函数作为输出层的传递函数,其输出值在[0,1][0, 1][0,1] 之间,与二元交叉熵误差函数的输入要求一致。

误差函数对错误的预测给予较大的惩罚,鼓励模型提高预测准确性。

相比均方误差等误差函数,交叉熵在处理接近 0 或 1 的概率时,梯度不会消失,保证了优化过程的稳定性。

对于类别不平衡的数据集,可通过引入类别权重或使用加权交叉熵误差函数,调整误差函数对不同类别的重视程度,缓解类别不平衡问题。


对于二分类问题,交叉熵损失定义为:
L=−1N∑i=1N[yilog⁡(pi)+(1−yi)log⁡(1−pi)] L = -\frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(p_i) + (1 - y_i) \log(1 - p_i) \right] L=N1i=1N[yilog(pi)+(1yi)log(1pi)]
其中,yiy_iyi是真实标签(0 或 1),pip_ipi是模型预测的概率,NNN是样本数量。


解释

二分类问题中,交叉熵损失函数可以表示为:

L=−[ylog⁡(p)+(1−y)log⁡(1−p)] L = - \left[ y \log(p) + (1 - y) \log(1 - p) \right] L=[ylog(p)+(1y)log(1p)]其中,yyy是真实标签(0 或 1),ppp是模型预测为正样本的概率。

  • y=1y = 1y=1时,损失函数简化为:
    L=−log⁡(p) L = - \log(p) L=log(p)即预测概率ppp越接近 1,损失越小。

  • y=0y = 0y=0时,损失函数简化为:
    L=−log⁡(1−p) L = - \log(1 - p) L=log(1p)即预测概率ppp越接近 0,损失越小。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐