【发布时间】:2021-02-05 02:53:34
【问题描述】:
我遵循了此文档 dask.dataframe.from_pandas,并且有一些可选参数称为 npartitions 和 chunksize。
所以我试着写这样的东西:
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame(...)
df = dd.from_pandas(data=df)
它会引发该消息的错误:
ValueError: Exactly one of npartitions and chunksize must be specified.
我想知道如何解决它,我应该如何计算 DataFrame 的 npartitions 或 chunksize,就像 Dask 在调用 dask.dataframe.read_csv 时所做的那样?
【问题讨论】:
-
有一个公式可以计算其中一个吗?
标签: python pandas dask partition chunks