【问题标题】:Set partitions on existing index in Dask dataframe在 Dask 数据框中的现有索引上设置分区
【发布时间】:2017-12-16 21:33:34
【问题描述】:

如果我有一个已经被索引的 Dask 数据框

>>> A.divisions
(None, None)
>>> A.npartitions
1

我想设置分区,到目前为止我正在做

A.reset_index().set_index("index", divisions=sorted(divisions))

因为A.repartition(divisions=sorted(divisions)) 抱怨“新旧分区的左侧不同”。有没有更好的办法?

【问题讨论】:

    标签: dask


    【解决方案1】:

    截至dask.__version__ == '0.16.0',如果您碰巧知道现有数据框的划分,您可以直接分配它们。

    A.divisions = tuple(divisions)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-12-02
      • 2021-02-14
      • 1970-01-01
      • 2017-11-23
      • 1970-01-01
      • 2018-06-03
      • 2021-12-31
      相关资源
      最近更新 更多