【发布时间】:2019-12-02 14:31:43
【问题描述】:
我正在为 avro 数据集应用 "avroCompressionCodec": "snappy"。但是,Azure 数据工厂 V2 管道中的复制活动会忽略压缩。在设计时它会显示一个警告 - 当使用 Avro 数据集作为复制目标时,压缩类型将被忽略。
我们知道在这种情况下如何应用压缩吗?
【问题讨论】:
标签: copy compression azure-pipelines avro azure-data-factory
我正在为 avro 数据集应用 "avroCompressionCodec": "snappy"。但是,Azure 数据工厂 V2 管道中的复制活动会忽略压缩。在设计时它会显示一个警告 - 当使用 Avro 数据集作为复制目标时,压缩类型将被忽略。
我们知道在这种情况下如何应用压缩吗?
【问题讨论】:
标签: copy compression azure-pipelines avro azure-data-factory
正如official documents 中所述。 AvroFormat 数据目前不支持压缩设置。
AvroFormat、OrcFormat 或 ParquetFormat 中的数据不支持压缩设置。读取这些格式的文件时,数据工厂会检测并使用元数据中的压缩编解码器。以这些格式写入文件时,数据工厂会选择该格式的默认压缩编解码器。例如,用于 OrcFormat 的 ZLIB 和用于 ParquetFormat 的 SNAPPY。
您可以将您的想法发布到 Microsoft here,要求该功能支持 AvroFormat 数据的压缩设置。
【讨论】: