【问题标题】:Parquet Output From Kafka Connect to S3从 Kafka 连接到 S3 的 Parquet 输出
【发布时间】:2017-10-08 06:57:55
【问题描述】:

我看到 Kafka Connect 可以以 Avro 或 JSON 格式写入 S3。但是没有 Parquet 支持。这有多难添加?

【问题讨论】:

标签: apache-kafka parquet apache-kafka-connect


【解决方案1】:

Qubole 连接器支持写出 parquet - https://github.com/qubole/streamx

【讨论】:

    【解决方案2】:

    试试secor: https://github.com/pinterest/secor

    可与 AWS S3、谷歌云、Azure 的 blob 存储等配合使用。

    请注意,您选择的解决方案必须具有以下关键功能: 保证每条消息只写一次,负载分配、容错、监控、数据分区等。

    Secor 拥有一切,如上所述,可以轻松地与其他“s3”风格的服务一起使用..

    【讨论】:

      【解决方案3】:

      从 Confluent 5.4.0 开始,官方支持 Parquet 输出到 S3。

      【讨论】:

        猜你喜欢
        • 2022-07-07
        • 2021-10-06
        • 1970-01-01
        • 2020-01-18
        • 2019-10-28
        • 2017-08-22
        • 2020-07-25
        • 2021-02-25
        • 2021-10-12
        相关资源
        最近更新 更多