·av68916814
·均值
·标准差:偏离均值
·正态分布:最高点为均值 95%的数据处在两个标准差之间 可查表
·中心极限定理:n次取样,无论全体是什么分布,样本均值是正态分布
例子:(原文链接:https://blog.csdn.net/qq_25366173/article/details/80151629)
现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理说:这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。 最后,当我们再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。
应用:水房拥挤问题(原文链接:https://wiki.mbalib.com/wiki/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86)
·置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度。
·线性回归: y=ax+b
·方差分析:通过组间方差与组内方差的对比来判断分组是否准确
·象形统计图:表现统计数字大小和变动的各种图形总称。其中有条形统计图、扇形统计图、折线统计图、象形图等。
·条形图:
簇状条形图和三维簇状条形图:簇状条形图比较各个类别的值。在簇状条形图中,通常沿垂直轴组织类别,而沿水平轴组织数值。三维簇状条形图以三维格式显示水平矩形,而不以三维格式显示数据。
堆积条形图和三维堆积条形图:堆积条形图显示单个项目与整体之间的关系。三维堆积条形图以三维格式显示水平矩形,而不以三维格式显示数据。
百分比堆积条形图和三维百分比堆积条形图:此类型的图表比较各个类别的每一数值所占总数值的百分比大小。三维百分比堆积条形图表以三维格式显示水平矩形,而不以三维格式显示数据。
·折线图:
趋势分析
差异分析
·饼图:
饼图和三维饼图:饼图以二维或三维格式显示每一数值相对于总数值的大小。
复合饼图和条饼图:复合饼图或复合条饼图显示将用户定义的数值从主饼图中提取并组合到第二个饼图或堆积条形图的饼图。
分离型饼图和三维饼图:分离型饼图显示每一数值相对于总数值的大小,同时强调每个数值。分离型饼图可以以三维格式显示。
·散点图
相关性分析
·茎叶图:将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少
·箱线图:显示出一组数据的最大值、最小值、中位数及上下四分位数,可以被用于异常值的检测。
例子:https://www.sohu.com/a/134414348_455817
https://www.cnblogs.com/wyy1480/p/9526264.html
·P-P图:反映变量的积累比例与指定分布的积累比例的关系图,当数据点呈线性分布的时候,观测样本越趋近给定分布。(SPSS)
·Q_Q图:二元分位数分析。斜率为标准差,截距为均值。(SPSS)
·误差分析图:分为系统误差和随机误差,衡量观测的精确度(包括测量的准确度和模型选取是否合理)。根据实际情况绘图即可。
·残差分析图:表征取样的合理性,即样本是否具有代表性。
·概率分布图:表述随机变量取值的概率规律,常用的如正态分布、指数分布等。
·漏斗模型(三角图):一般表述转化率(如营销客户转化),由上而下代表不同层级,转化率逐级降低并形成漏斗形状。
·金字塔模型:不同层次依然由上而下分布,但处于上层的是重要的(或数量较少)的层次,并按重要性(或数量)逐级递减(递增)。
·等高线图:有二维、三维等高线图。在数据分析中,高度表示为该点的数量或出现次数,该指标相同则在一条环线(或高度)处。
·词云
热点分布
·散点地图
地区相关分析
·雷达图
多属性画像
统计图表部分参考自https://blog.csdn.net/u014565726/article/details/81626857