【问题标题】:How can I resolve a value error when trying to use Dask Describe?尝试使用 Dask Describe 时如何解决值错误?
【发布时间】:2020-11-01 22:42:41
【问题描述】:

我正在处理一个超过 10GB 的数据集。我已经设法使用代码将其导入到 dask 数据框中:

df = dd.read_csv('FileName.csv', dtype = dt, parse_dates = ['date'])
dt = ... # a list of columns names with their data type such as 'objects' and 'floats'.

我一直在尝试运行 .describe() 函数,但我不断收到错误消息: ValueError: 没有找到重要的数组

有谁知道如何克服这个错误?

【问题讨论】:

  • 不知道为什么会出错,但请尝试df.describe(percentiles_method="tdigest", include=dt).compute()。它应该避免当前的错误。
  • 另外,describe 仅适用于数字和日期时间列。
  • @kate-melnykova 谢谢 kate,你知道我如何排除所有与对象相关的数据类型吗?

标签: python dataframe dask dask-dataframe


【解决方案1】:

正如 cmets 中提到的 @kate-melnykova 所描述的,仅适用于数字和日期时间列。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-05-27
    • 2023-04-05
    • 1970-01-01
    • 1970-01-01
    • 2021-12-13
    • 2021-08-20
    • 2019-01-02
    • 1970-01-01
    相关资源
    最近更新 更多