pandas中用函数isnull 和notnull 来检测数据丢失

python pandas判断缺失值一般采用 isnull(),生成的是所有数据的true/false矩阵

1 pd.isnull()

元素级别的判断,把对应的所有元素的位置都列出来,元素为空或者NA就显示True,否则就是False

会产生如下结果
pd.isnull,pd.notnull

2 pd.isnull().any()

列级别的判断,只要该列有为空或者NA的元素,就为True,否则False

则会判断哪些”列”存在缺失值
pd.isnull,pd.notnull

3 pd[pd.isnull().values==True]

可以只显示存在缺失值的行列,清楚的确定缺失值的位置。

pd.isnull,pd.notnull

4 iris.columns[iris.isnull().any()].tolist()

iris是dataframe对象,将为空或者NA的列找出来

5 isnull().sum()

将列中为空的个数统计出来

参考:https://blog.csdn.net/xiaoxiaosuwy/article/details/81187694

相关文章: