【问题标题】:Azure Data Factory Copy activity not applying compression for avroAzure 数据工厂复制活动未对 avro 应用压缩
【发布时间】:2019-12-02 14:31:43
【问题描述】:

我正在为 avro 数据集应用 "avroCompressionCodec": "snappy"。但是,Azure 数据工厂 V2 管道中的复制活动会忽略压缩。在设计时它会显示一个警告 - 当使用 Avro 数据集作为复制目标时,压缩类型将被忽略。

我们知道在这种情况下如何应用压缩吗?

【问题讨论】:

    标签: copy compression azure-pipelines avro azure-data-factory


    【解决方案1】:

    正如official documents 中所述。 AvroFormat 数据目前不支持压缩设置。

    AvroFormat、OrcFormat 或 ParquetFormat 中的数据不支持压缩设置。读取这些格式的文件时,数据工厂会检测并使用元数据中的压缩编解码器。以这些格式写入文件时,数据工厂会选择该格式的默认压缩编解码器。例如,用于 OrcFormat 的 ZLIB 和用于 ParquetFormat 的 SNAPPY。

    您可以将您的想法发布到 Microsoft here,要求该功能支持 AvroFormat 数据的压缩设置。

    【讨论】:

    • 感谢您的回复。您能否进一步阐明数据工厂对 Avro 格式使用的默认压缩编解码器是什么(答案提到了 orc 和 parquet 的默认值)?此外,是否有可能很快支持压缩设置?官方文档中的示例json提到使用“avroCompressionCodec”:.
    • Avro 的 default compressioncodec 为“无”。您可以enter your idea 到 Microsoft Azure 数据工厂团队,提交您的请求以支持 avro 压缩类型。 azure 数据工厂开发团队希望能够审查此请求并尽快修复它。
    猜你喜欢
    • 2022-01-04
    • 1970-01-01
    • 1970-01-01
    • 2020-09-15
    • 1970-01-01
    • 2021-06-10
    • 2021-01-16
    • 1970-01-01
    • 2020-06-27
    相关资源
    最近更新 更多