【问题标题】:Enable full pandas summary on a huge data frame在巨大的数据框上启用完整的 pandas 摘要
【发布时间】:2012-11-17 18:39:46
【问题描述】:

我有一个大数据框。通常,当我有这样的数据框时,我会获得该数据框的摘要,其中我会获得每列和列名中有多少非 NaN 值的信息。然而,对于这个,我得到了一个更简短的总结:

<class 'pandas.core.frame.DataFrame'>
Index: 138289 entries, 1993-07-23 to 2012-11-26
Columns: 101 entries, AAT to ZZT
dtypes: object(101)

我想获得一份标准摘要,其中包含有关每列的信息。

我正在使用 ipython notebook 和 pandas 0.9.1,如果这与它有关的话

【问题讨论】:

    标签: python pandas options summary output-formatting


    【解决方案1】:

    不幸的是,DataFrame.info 被黑客入侵,无法显示完整的摘要,除非列数少于 100(查看源代码)。我们会在 0.10 修复它:

    https://github.com/pydata/pandas/issues/2524

    【讨论】:

      【解决方案2】:

      当数据框很大时,它不会显示在 ipython notebook 中。 我只是强迫它:

      from IPython.display import HTML
      HTML(df.head().to_html())
      

      确保使用 head :)

      【讨论】:

      • 这会产生前 5 列的完整输出。
      【解决方案3】:

      尝试使用 set_printoptions 设置 DataFrame 中显示的最大行数:

      pd.set_printoptions(max_columns=101)
      

      这应该允许您查看(汇总的)DataFrame 中的所有列。

      max_rowsmax_columns 控制默认显示 DataFrame 对象的行数和列数。

      【讨论】:

      • 他的dataframe中有101个columns,所以max_columns应该改一下。
      • 我仍然得到相同的输出。
      猜你喜欢
      • 2020-04-30
      • 2014-03-11
      • 2018-05-29
      • 1970-01-01
      • 1970-01-01
      • 2019-07-12
      • 2020-02-05
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多