交叉熵损失和二元交叉熵损失

飞机火车巴雷特

24989人浏览 · 2022-04-10 11:58:28

飞机火车巴雷特 · 2022-04-10 11:58:28 发布

一、什么是交叉熵损失(Cross Entropy Loss)

交叉熵是信息论的概念。WIKIPEDIA给出的交叉熵定义如下

上面的意思大概是说，给定两个概率分布p和q，通过q来表示p的交叉熵为

其中 $\mathit{E_p}[\cdot ]$ 是关于分布q的期望值算子。如果概率分布p和概率分布q是离散的，那么通过q来表示p的交叉熵为

交叉熵刻画的是两个概率分布之间的距离。交叉熵越小，两个概率分布越接近。举个例子

交叉熵损失定义为

其中， $\bold{y}_i$ 是标签值， $y_i'$ 是预测值。

注意，这里的预测值一般是通过数据和模型参数经过某种可导的计算后所求得的结果。交叉熵损失通过梯度下降来不断地使预测值的分布接近标签值的分布，与此同时模型的参数也得到更新，而这就是机器学习中所谓的学习。

二、什么是二元交叉熵损失(Binary Cross Entropy Loss)

二元交叉熵损失定义为

$\mathrm{BCELoss}=-\frac{1}{n}\sum_{i=1}^{n}[y_i\cdot \mathrm{log}p(y_i=1)+(1-y_i)\cdot \mathrm{log}(1-p(y_i=1))]$

其中 $\tiny y_i$ 是第i个样本的二元标签值0或者1（ground truth）， $\tiny p(y_i=1)$ 是模型对第i个样本的预测值，即模型预测第i个样本标签值为1的概率。

可以轻易地分析出来，当标签值 $\tiny y_i=1$ 时， $\tiny 1-y_i=1-1=0$ ；当标签值 $\tiny y_i=0$ 时， $\tiny 1-y_i=1-0=1$ 。也就是说，在二元交叉熵损失函数第一项 $\tiny y_i\cdot \mathrm{log}p(y_i=1)$ 和第二项 $\tiny (1-y_i)\cdot \mathrm{log}(1-p(y_i))$ 之中，必定有一项的值为0。

我们再来看第一项和第二项的函数图像（横坐标为 $\tiny p(y_i=1)$ ，纵坐标为第i个样本的 $\tiny \mathrm{BCELoss}$ ）：

当标签值 $\tiny y_i=1$ 时， $\tiny \mathrm{BCELoss}=-\mathrm{log}p(y_i=1)$ ，如果 $\tiny p(y_i=1)$ 接近1， $\tiny \mathrm{BCELoss}$ 接近0；如果 $\tiny p(y_i=1)$ 接近0， $\tiny \mathrm{BCELoss}$ 则变得无穷大。

当标签值 $\tiny y_i=0$ 时， $\tiny \mathrm{BCELoss}=-\mathrm{log}(1-p(y_i=1))$ ，如果 $\tiny p(y_i=1)$ 接近1， $\tiny \mathrm{BCELoss}$ 变得无穷大；如果 $\tiny p(y_i=1)$ 接近0， $\tiny \mathrm{BCELoss}$ 接近0。

通过以上的简单分析，当预测值接近标签值时损失很小，当预测值远离标签值时损失很大，这一特性是有利于模型的学习的。

三、参考

交叉熵损失函数

Cross Entropy

binary cross entropy in its core

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m