pandas.pivot_table()

几个重要的参数
data:DataFrame对象
values:源数据中的一列,数据透视表中用于观察分析的数据值,类似Excel中的值字段
index:源数据中的一列,数据透视表用于行索引的数据值,类似Excel中的行字段
columns:源数据中的一列,数据透视表用于列索引的数据值,类似Excel中列字段
aggfunc:根据当前的行、列索引生成的数据透视表中有多个数据需要进行聚合时,对这多个数据需要进行的操作,默认为np.mean()

示例数据集

下面的Excel表格分别记录了武汉和北京一周(2018/07/22-2018/07/28)的日最高温度和日最低温度,对数据进行以下的分析:

  • 武汉、北京一周的日最高、最低气温趋势变化;
  • 两城市一周的平均日最高、最低气温变化趋势;
    pandas数据透视表 pd.pivot_table()
    HT: the highest temperature, 日最高气温
    LT: the lowest temperature, 日最低气温

创建DataFrame对象

pd.read_excel()
pandas数据透视表 pd.pivot_table()

分别分析日最高、最低温度

pd.pivot_table(),也可以用作method,DataFrame.pivot_table()
pandas数据透视表 pd.pivot_table()

分析日平均最高、最低温度

分析日平均最高温度时涉及到对两个城市日最高温度的取平均运算,需要设置参数aggfunc=np.mean(也可以不设置,默认情况下aggfunc为均值运算),日平均最低温度同理。这里设置行字段参数index=['HT','LT']可同时分析日平均最高和最低温度。
pandas数据透视表 pd.pivot_table()

相关文章: