【发布时间】:2023-01-13 21:48:22
【问题描述】:
在通过 Python 创建清洁项目时,我发现了这段代码:
# let's see if there is any missing data
for col in df.columns:
pct_missing = np.mean(df[col].isnull())
print('{} - {}%'.format(col, round(pct_missing,2)))
这实际上工作正常,返回数据框中每列的空值百分比,但我对它的工作方式有点困惑:
首先,我们为数据框中的每一列定义一个循环,然后我们执行那个意思,但究竟是什么意思?每列空单元格数量的平均值或什么?
仅供参考,我已经解决了这个问题:
NullValues=df.isnull().sum()/len(df)
print('{} - {}%'.format(col, round(NullValues,2)))
这给了我基本相同的结果,但只是为了理解机制……我对第一段代码感到困惑……
【问题讨论】:
标签: python python-3.x