【问题标题】:Unable to run a selective pandas profiling for large dataset无法为大型数据集运行选择性 pandas 分析
【发布时间】:2020-12-19 19:24:48
【问题描述】:

我有一个包含 100 列和 100000 行的大型数据集,我正在尝试运行 pandas 配置文件报告,但它会生成一个非常大的文件 html 文件(300MB)。无法在任何浏览器上打开该文件。

所以我尝试了 minimum=True 但这只是提供交互。

我可以运行选择性 pandas 分析报告以仅查看交互报告或仅查看缺少 _values 报告

我试过了,但遇到了错误

ProfileReport(df,variables=False,Interactions=True, Correlations=False, Missing_values=False, Sample=False)

【问题讨论】:

  • 请同时发布错误和您的系统配置。

标签: python pandas-profiling


【解决方案1】:

通过调整配置可以有多种可能的改进:

  • 绘制 100 列的交互作用会生成 100 x 100 = 10.000 个图。您可以通过指定目标将范围缩小到您感兴趣的目标(请参阅文档)
  • ProfileReport(df,variables=False,Interactions=True, Correlations=False, Missing_values=False, Sample=False) 的语法不正确(请不要使用大写字母,请使用 None 而不是 False,请参阅 this page)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-05-06
    • 1970-01-01
    • 2020-04-16
    • 2016-05-24
    • 1970-01-01
    • 2020-06-13
    • 2021-01-25
    相关资源
    最近更新 更多