接下来我们介绍Pandas库常用对象中的DataFrame:
DateFrame类型:
特征:
1:是一个表格型的数据类型,每一列的数值类型可以相同也可以不同。
2:有行索引,也有列索引。
3:常用于表达二维数据,也可以表达多维数据。
创建:
可以由:二维array对象创建;一维array,列表,字典,元组,Series构成的字典创建Series类型创建。反正很多。。。
1:用array创建对象,自动添加了行列索引:
2:用字典创建对象,自动添加了索引,其中字典键默认作为列索引,Series的index作为行索引,自动对齐。
3:由列表类型的字典创建。
若是Series在DataFrame中填充,则会在1轴方向填充。
横向索引我们叫做index,纵向索引我们叫column,但是返回的都是index类型。对横向与纵向索引进行访问,返回的都是index类型,对values进行访问,返回的是array类型。
想要具体获得某一列元素或者某一行元素可以通过如下索引方式:a.iloc(index)获得一行元素。这里新的版本不要用.ix[index];a[index]获得某一列元素。
总而言之,DataFrame是一个二维的带标签的数组。
重排:
DataFrame重新索引.reindex可以将index和columns序列重排。
pd.reindex(index,columnns,fill_value,method,limit,copy)
fill_value是NaN填充的值。
可以通过对索引的修改更改DataFrame。
例如:
可以使用drop函数删除对应索引的数据,但是drop默认操作零轴上的元素 :
可以这么说,对于Pandas中数据对象的操作,几乎都是对于其索引的操作。