【发布时间】:2018-03-20 14:32:21
【问题描述】:
我在很多函数中都看到了参数npartitions,但我不明白它有什么用/有什么用。
http://dask.pydata.org/en/latest/dataframe-api.html#dask.dataframe.read_csv
头(...)
元素仅取自第一个 npartition,默认值为 1。如果第一个 npartition 中的行数少于 n,则会发出警告并返回任何找到的行。传递 -1 以使用所有分区。
重新分区(...)
输出的分区数,必须小于输入的 npartitions。仅在未指定除法时使用。
在这种情况下分区数可能是5:
(图片来源:http://dask.pydata.org/en/latest/dataframe-overview.html)
【问题讨论】: