【发布时间】:2018-05-22 08:59:54
【问题描述】:
List<String> list= jsc.wholeTextFiles(hdfsPath).keys().collect();
for (String string : list) {
System.out.println(string);
}
我在这里获取所有 zip 文件。从这里我无法继续如何提取每个文件并使用相同的 zipname 文件夹存储到 hdfs 路径中
【问题讨论】:
-
我建议您可以使用 Java 进行本机编码并进行解压缩。 Spark 可以帮助您使用 wholeTextFiles 读取文件
标签: java hadoop apache-spark hdfs