【发布时间】:2017-10-16 10:40:20
【问题描述】:
我刚试过
import dask.dataframe as dd
df = dd.read_csv("data.csv")
print(df.describe())
给了
Dask DataFrame Structure:
SOME_COL FOO BAR
npartitions=1 float64 float64 float64
... ... ...
Dask Name: describe, 1234 tasks
有两个问题:
- 我认为没有完成任何操作,因为这是一个 4GB 的 CSV 文件,因此至少需要几秒钟才能读取,但会立即打印。
- 我希望得到最小值、25%、中值、75% 和最大值,但没有显示这些描述性值。
有什么问题?
【问题讨论】: