【问题标题】:How to create and populate Parquet files in HDFS using Java?如何使用 Java 在 HDFS 中创建和填充 Parquet 文件?
【发布时间】:2017-03-19 11:44:32
【问题描述】:

在不支持 Hive 或 Impala 库的情况下,使用 Java 在 HDFS 中创建和填充 Parquet 文件的最佳方法是什么?

我的目标是将简单的 csv 记录(字符串)写入位于 HDFS 中的 Parquet 文件中。

之前提出的所有问题/答案都令人困惑。

【问题讨论】:

    标签: java hadoop hdfs parquet


    【解决方案1】:

    似乎parquet-mr 是要走的路。它们为 Thrift 和 Avro 提供实现。自己的实现应该基于ParquetOutputFormat,并且可能看起来类似于进行实际转换的AvroParquetOutputFormatAvroWriteSupport

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-10-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-03-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多