数据可视化

一、用Excel绘制饼图

二、用Excel绘制柱形(状)图和条形图

三、用Excel绘制直方图

四、用Excel绘制折线图

五、用Excel绘制散点图

 六、用Excel绘制箱线图

 七、总结


一、用Excel绘制饼图

最适合采用饼图的情形:
①只有一个数据系列(单分类数据);
②任何数据值都大于零;
类别不超过七个,因为七个以上的扇区会使图表难以阅读;
④划分的类别最好是完整的,一般不完整时可以加其他;
⑤类别过多可用复合饼图时,千万别硬要画一个完整饼图;
⑥类别只有两个时就不用画图了,没多大必要。

绘制饼图小技巧:
①一般不直接在图中加标题,而是在论文正文中加入(表上图下);
②图表边框设置为无线条,图例尽量放在图表的右侧;
③如果分组不是以时间为维度,可考虑先排序后画图;
画出来的图一定要有分析,要告诉读者你画图的目的是什么;
⑤如果论文要黑白打印,注意饼图每个扇形区域颜色亮暗有区分度。

样例:(简单饼图、排序后再画的饼图、复合饼图)
                                                             

二、用Excel绘制柱形(状)图和条形图

簇状柱形图常常用于展示多个分类(单个分类也可以)的数据变化和同类别各变量之间的比较情况
堆积柱形图可用于比较同类别各变量和不同类别变量总和差异
百分比堆积柱形图适合展示同类别的每个变量的比例
④柱形图可切换行和列;
⑤条形图就是横过来的柱形图;
⑥类别数过多时,如果要加入数据标签,那么使用条形图比较合适(柱形图的数看起来有点拥挤);
⑦双向条形图(可视化人口年龄结构);
⑧用柱形图可视化回归结果。

样例:(簇状柱形图、堆积柱形图、百分比堆积柱形图、簇状条形图、双向条形图、可视化回归结果)
 
                                 
                        
   

三、用Excel绘制直方图

直方图:直方图是显示数据频数或频率的柱状图
直方图横坐标生成组距小技巧:先确定好每个组距的分点(区间的后部),再用字符串函数进行拼接,然后下拉。eg:  ="("&D2&","&D3&"]"  \Rightarrow  (D2,D3]
直方图与柱状图的区别:
①直方图展示数据的分布,柱状图比较数据的大小;
②直方图x轴为定量数据,柱状图X轴为分类数据;
③直方图y轴为数据的频数或频率,柱状图y轴为数据实际大小。

样例:(频率分布直方图)
        ​​​​​​​        ​​​​​​​        

四、用Excel绘制折线图

适合采用折线图的情形:
        如果数据是时间序列数据(如日、月、季度或年度数据),则应该考虑使用折线图,尤其是时间跨度长且存在多个时间序列时,更应该使用折线图 。(折线图也经常被称为时间序列图,或简称为时序图)  当然,时间序列期数较少时,也可以考虑使用柱状图。
        注:时间序列作为横坐标时需设置成文本格式(可在前面加 ' )。
进阶:
1、双坐标轴折线图(次坐标轴的图形通常在最高一层显示,建议颜色深些)
        

 2、柱形图(面积图)顶端的折线图,显然展现的效果更加清晰明了、高端大气
  

五、用Excel绘制散点图

1、简单散点图
        
2、带标识的散点图
        

 六、用Excel绘制箱线图

        箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。
                

计算过程(注意:箱线图有不同的画法,下面介绍的是用的较多的一种画法):
1、计算上四分位数、中位数、下四分位数以及均值;
2、计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range);
3、绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数,在箱子内部中位数的位置绘制横线;
4、大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers);
5、排除掉异常值之外,在剩下的数据的最大值和最小值处画横线,作为箱线图的上下边缘;
6、极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍‐3倍四分位数差之间的异常值,用空心点表示;
7、为箱线图添加名称、数轴等,并在图中用×标记出数据的均值位置。

箱线图的作用:
        箱线图最有效的使用方法是作比较
        假设要比较男女生的身高,用什么工具最好?答案是箱线图。
        箱线图明显更加有效,能够从平均水平(中位数)、波动程度(箱子高度)以及异常值对男女生身高或者男女教师的教学评估得分等等进行比较,而直方图却做不到。    

 七、总结

        统计图最常用的就几种:饼图、柱状图、条形图、直方图、折线 图 、散点图、箱线图等。对于同一组数据,不同的人绘制出来的效果可能截然不同,好的图形能够让读者一眼就能看出数据的规律和特点,其传递给读者的信息是准确和有效的。准确是指我们不能随意绘制图形,因为每个统计图适用的数据是有限制的;有效是指图形传递出来的信息和你得到的结论是吻合的;这是一个图形要满足的最基本两点。
        另外,要评价一个图形是否画的好,主要看其是否简洁和美观,我们绘制出来的图表包含的信息一定要清晰明显,不能花里胡哨,另外一定要注意图形的配色


  

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐