【发布时间】:2015-08-26 18:01:12
【问题描述】:
如果我们有一个文件夹folder 包含所有.txt 文件,我们可以使用sc.textFile("folder/*.txt") 读取它们。但是,如果我有一个文件夹 folder 包含更多名为 datewise 的文件夹,例如 03、04、...,其中还包含一些 .log 文件。如何在 Spark 中阅读这些内容?
在我的例子中,结构更加嵌套和复杂,因此首选通用答案。
【问题讨论】:
标签: apache-spark