1 采用matplotlib绘制常见统计图
常见的统计图主要有折线图,散点图,柱状图,直方图和饼图,他们之间最明显的特征特点区别如下:
| 各种图名称 | 图意义 和区别 |
|---|---|
| 折线图 | 变化情况趋势 |
| 散点图 | 变量之间关系 |
| 柱状图 | 分类变量数量对比 |
| 直方图 | 连续变量统计分布 |
| 饼图 | 总体构成百分比 |
2 折线图的特点及应用场景
折线图:以折线的上升或下降来表示统计数量的增减变化的统计图
特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)
绘制部分请见:https://blog.csdn.net/lbj1260200629/article/details/88417791
应用场景
- 呈现公司产品(不同区域)每天活跃用户数
- 呈现app每天下载数量
- 呈现产品新功能上线后,用户点击次数随时间的变化
- 拓展:画各种数学函数图像
3 散点图的特点以及API
3.1 散点图的特点
散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)
3. 2 散点图的API - matplotlib.pyplot. scatter()
matplotlib.pyplot. scatter (x, y, s=none, c=none, marker=none, cmap= None,norm=none, vmin=none, vmax=none, alpha=none, Linewidths=none,verts=none, edgecolors=none, hold=none, data= None, **kwargs)
- 参数:
- x,y:相同长度的数组序列
- s :散点的大小标量或形同数组,可选参数,默认20
- c :散点的色彩或颜色序列,可选
- maker:标记风格,可选,默认是‘o’
- norm:数据的亮度
- alpha:散点的透明度
3.3 绘制散点图
def MyScatter():
"""
绘制散点图
:return:
"""
import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as np
# 设置在jupyter中matplotlib的显示情况
# % matplotlib inline
# 解决中文显示问题
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(8, 6))
n = 1000
# rand 均匀分布和 randn高斯分布
x = np.random.randn(1, n)
y = np.random.randn(1, n)
T = np.arctan2(x, y) # np.random.rand(n) * 125
plt.scatter(x, y, c=T, s=30, alpha=0.4, marker='o')
# T:散点的颜色
# s:散点的大小
# alpha:是透明程度
plt.show()
MyScatter()
3.4 散点图应用场
- 探究不同变量之间的内在关系