【发布时间】:2018-01-07 00:32:16
【问题描述】:
我们在Dask(Python)和Drill(R使用Sergeant数据包)中生成了一个parquet文件。我们注意到了一些问题:
-
Dask的格式(即fastparquet)有一个_metadata和一个_common_metadata文件,而R \ Drill中的parquet文件没有这些文件,而是有parquet.crc文件(可以删除)。这些parquet实现之间有什么区别?
【问题讨论】:
-
我知道parquet versions有各种不同,但很难理解其中的区别
-
您应该将这三个问题作为单独的问题发布在 Stack Overflow 上。将多个作为单个实例发布是很难回答和集成到 SO UI 中的。
-
感谢输入 - 会这样做
标签: r parquet dask apache-drill fastparquet