【发布时间】:2020-01-25 00:39:24
【问题描述】:
我想访问 HDFS 上的 parquet 文件并想使用 arrow 库。但是,我需要知道客户端还需要安装哪些其他依赖项?例如,following page 解释了将箭头用于 python (pyarrow) 需要哪些依赖项,但我找不到 R 的那些依赖项。
【问题讨论】:
标签: pyarrow apache-arrow
我想访问 HDFS 上的 parquet 文件并想使用 arrow 库。但是,我需要知道客户端还需要安装哪些其他依赖项?例如,following page 解释了将箭头用于 python (pyarrow) 需要哪些依赖项,但我找不到 R 的那些依赖项。
【问题讨论】:
标签: pyarrow apache-arrow
从 0.14.1 开始,R 箭头绑定尚不支持 HDFS。目前最好的选择可能是在使用它们之前将文件同步到本地文件系统。
【讨论】:
arrow 来读取它们。