【发布时间】:2018-10-05 18:46:28
【问题描述】:
我创建了一个 Dask Dataframe(称为“df”),索引为“11”的列具有整数值:
In [62]: df[11]
Out[62]:
Dask Series Structure:
npartitions=42
int64
...
...
...
...
Name: 11, dtype: int64
Dask Name: getitem, 168 tasks
我试图将这些总结为:
df[11].sum()
我得到了dd.Scalar<series-..., dtype=int64> 返回。尽管研究了这可能意味着什么,但我仍然对为什么没有返回数值存在分歧。我怎样才能把它翻译成它的数值?
【问题讨论】:
-
df[11].sum().compute()也不工作? -
效果很好!我在 .sum() 的文档中找不到 .compute(),我一定在这里遗漏了一些东西。或者特别是在 dask 文档中的任何地方。所以我不确定为什么这会奏效。你介意给我指出正确的方向吗?
标签: python pandas dataframe dask