Python Pandas缺省值(NaN)处理
创建一个包含缺省值的Series对象和一个包含缺省值的DataFrame对象。
发现缺省值,返回布尔类型的掩码数据
isnull()
发现非缺省值,返回布尔类型的掩码数据
notnull()
与isnull()作用相反。
取出缺省值
dropna()DataFrame.dropna(axis = <0,1>, how = <'all','any'>, thresh = <N>)
对于DataFrame对象:
默认情况下(没有任何参数控制),删除所有包含缺省值的行和列;
axis为0,表示删除包含缺省值的行;
axis为1,表示删除包含缺省值的列;
how为‘all’表示删除全为NaN的行或列;
how为‘any’表示删除包含NaN的行或列;
thresh=N表示删除包含NaN个数大于等于N的行或列(例如下)。
填充缺省值
fillna(axis = <0,1>, method = <'ffill, bfill'>)method表示使用前一个位置的值填充,还是用后一个位置的值填充。
例如,用0填充Series对象,用‘Hi’填充DataFrame对象。
例如,用列方向后一个位置的值填充。
参考文献:
《Python数据科学手册》