盒形图是统计分析中一个重要的分析工作。可以显示数据的5个特征数值,最大数,最小数,中位数,两个四分位数。
盒子的中间线代表数据的中位数,即数据中有一半在该值之上,一半在该值之下;
盒子上下两条边线代表上下四分位数,即数据有1/4的数值大于上四分位数,盒子的高度为四分位距,有一半的数据在中间盒子内,另有一半的数据分布在盒子的上下两边;
盒子外纵向两个端点分别表示数据的最大值,最小值。
菱形的中间代表平均值,菱形端点到中间距离为两倍标准差,如果变量服从正态分布,那么菱形的上下端点之间包括大学95%观测。
比较不同总体间数据对比。