【发布时间】:2013-06-18 22:27:31
【问题描述】:
与我的其他问题有关,但不同:
someMap.saveAsTextFile("hdfs://HOST:PORT/out")
如果我将 RDD 保存到 HDFS,我如何告诉 spark 使用 gzip 压缩输出? 在 Hadoop 中,可以设置
mapred.output.compress = true
并选择压缩算法
mapred.output.compression.codec = <<classname of compression codec>>
我将如何在 spark 中执行此操作?这也可以吗?
编辑:使用 spark-0.7.2
【问题讨论】:
标签: scala compression hdfs apache-spark