参考:

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。其于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。

基本参数

下面我们以一个实际的箱状图为例,说明其中的常用参数。
在这里插入图片描述

  • 上/下边缘:图中上下两个短横线,代表统计数据的最大值与最小值。
  • 中位数:顾名思义,代表统计数据的中位数,相对于均值对噪声的影响不明显,所以更加常用。
  • 下四分位数:即数据中25%的值小于该值。
  • 上四分位数:即数据中75%的值小于该值。

属性

  • 当箱形图很短时,这意味着大部分数据点都相似,因为大多数值在在很小的范围内
  • 当箱形图很高时,这意味着大部分数据点都非常不同,因为这些值分布在很广的范围内
  • 如果中值接近底部,那么我们知道大多数数据具有较低的值。如果中值接近顶部,那么我们知道大多数数据具有更高的值。所以,如果中值的线不在框的中间,则表明数据分布不均匀。
  • 是否有长尾? 如果有长尾,这意味着数据具有较高的标准偏差和方差,即数值分散且变化很大。如果盒子的一侧有须,而另一侧没有,那么统计数据可能只在一个方向上变化很大。
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐