【问题标题】:How to identify columns that contain only NULL values?如何识别仅包含 NULL 值的列?
【发布时间】:2020-05-14 21:24:52
【问题描述】:

我有一个包含 400 多列的 CSV 文件。他们中的许多人没有记录。我正在使用以下内容来显示 all 列并显示每列的记录数:

pd.set_option('display.max_columns', None)
df.isna().sum()

结果集仅显示前 5 列和后 5 列。我需要查看 all 400 多列,每个列都有 NULL 的总和。

我该怎么做?我正在使用 Jupyter Notebook 和 Python 3。

【问题讨论】:

  • 根据我的经验(不是很大),pandas 默认表示仅显示大框架的边缘。数据都在结果中,但为了便于理解,只显示用户能感知到的。如果你迭代数据,或者以某种方式进一步减少它,你可以看到它就在那里。
  • 谢谢,阿米泰。是否有一个简单的代码可以用来显示每列的名称以及每列的 NULL 总和?

标签: python pandas null jupyter-notebook


【解决方案1】:

正如@Amitai Irron 在他的评论中指出的那样,它只会向您显示框架的边缘,但是,您可以更改该打印的 Jupyter 选项以将行/列显示最大值设置为无,这将向您显示所有数据帧:

with pd.option_context('display.max_rows', None, 'display.max_columns', None):
    print(df) #or display(df)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-06-09
    • 1970-01-01
    • 2018-04-13
    • 2016-03-12
    • 2021-01-17
    • 1970-01-01
    • 2021-12-27
    相关资源
    最近更新 更多