参考:

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。其于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。

基本参数

下面我们以一个实际的箱状图为例,说明其中的常用参数。
在这里插入图片描述

  • 上/下边缘:图中上下两个短横线,代表统计数据的最大值与最小值。
  • 中位数:顾名思义,代表统计数据的中位数,相对于均值对噪声的影响不明显,所以更加常用。
  • 下四分位数:即数据中25%的值小于该值。
  • 上四分位数:即数据中75%的值小于该值。

属性

  • 当箱形图很短时,这意味着大部分数据点都相似,因为大多数值在在很小的范围内
  • 当箱形图很高时,这意味着大部分数据点都非常不同,因为这些值分布在很广的范围内
  • 如果中值接近底部,那么我们知道大多数数据具有较低的值。如果中值接近顶部,那么我们知道大多数数据具有更高的值。所以,如果中值的线不在框的中间,则表明数据分布不均匀。
  • 是否有长尾? 如果有长尾,这意味着数据具有较高的标准偏差和方差,即数值分散且变化很大。如果盒子的一侧有须,而另一侧没有,那么统计数据可能只在一个方向上变化很大。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐