【发布时间】:2021-04-12 19:57:21
【问题描述】:
拆分pandas DFs后是否可以得到dask中的partition_id
例如:
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame(np.random.randn(10,2), columns=["A","B"])
df_parts = dd.from_pandas(df, npartitions=2)
part1 = df_parts.get_partition(0)
在 2 个部分中,part1 是 first_partition。那么是否可以执行以下操作:
part1.get_partition_id() => which will return 0 or 1
或者是否可以通过迭代df_partsget the partition ID?
【问题讨论】:
标签: pandas dataframe dask dask-delayed dask-dataframe