【发布时间】:2019-08-26 18:55:27
【问题描述】:
我想从 AWS S3 读取 Parquet 文件的选定列表。我知道如何使用 *parquet 读取目录中的所有文件,或者仅通过指定该键来读取一个文件。但是,我想根据一些先前的用户输入仅读取特定的文件列表。
这可能吗?
以下代码来自他们的 API Docs,但不能满足我的要求:
import dask.dataframe as dd
df = dd.read_parquet('s3://bucket/path/to/data-*.parque')
(OR)
df = dd.read_parquet('s3://bucket/path/to/file.parque')
有没有办法在 read_parquet 参数中传入目标文件列表?
【问题讨论】:
标签: python dataframe amazon-s3 dask