【发布时间】:2013-07-02 22:00:45
【问题描述】:
在 Scala 中,如何解压缩 file.gz 中包含的文本以便对其进行处理?我很乐意将文件的内容存储在变量中,或者将其保存为本地文件,以便之后程序可以读取它。
具体来说,我是使用 Scalding 来处理压缩的日志数据,但是 Scalding 并没有在FileSource.scala 中定义读取它们的方式。
【问题讨论】:
-
您可以使用 Java
java.util.zip. GZipInputStream从 gzip 中提取内容,然后使用其内容 -
使用更好的文件库,它是
myFile.newInputStream.gzipped.lines,根据github.com/pathikrit/better-files/blob/master/README.md