pd.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None)

frame--数据集

id_vars--需要保留的原始列

values_vars--需要被转换成变量值的数据列

var_name--转换后变量的列名

value_name--数值变量的列名

参考链接:http://shzhangji.com/cnblogs/2017/09/30/pandas-and-tidy-data/

dt.describe()#可用于Series也可用于dataframe,输出所有列的统计信息

pandas----melt、describe、、crosstab、query函数

pd.crosstab(dt['column_name1'], dt['column_name'],margin=True)#指定列形成交叉表,统计分组频率(按类别分组,统计各个分组中产地的频数)margin=True,多一列All,一行All,计算总和

pandas----melt、describe、、crosstab、query函数

dt.query('column_name > xx  &  column_name <  xx')#查询函数,括号为条件

pandas----melt、describe、、crosstab、query函数

 

相关文章: