【发布时间】:2018-01-08 01:43:24
【问题描述】:
我们生成了一个 parquet 文件,一个在 Dask (Python) 中,另一个在 R Drill 中(使用 Sergeant 数据包)。他们使用 parquet see my other parquet question 的不同实现
我们无法交叉读取文件(python 无法读取 R 文件,反之亦然)。
在 R 环境中读取 Python parquet 文件时,我们收到以下错误:system error: Illegalstatexception: UTF8 can only annotate binary filed。
在 Dask 中读取 R/Drill parquet 文件时,我们得到一个 FileNotFoundError: [Error 2] no such file or directory ...\_metadata(这是不言自明的)。
在 R 和 Python 之间交叉读取镶木地板文件的选项有哪些?
我们将不胜感激。
【问题讨论】: