【发布时间】:2018-12-21 23:08:19
【问题描述】:
我想使用这个语法:
sc.textFile(','.join(files))
不过,我还需要将每一行与相应的文本文件进行匹配,并稍后将其保存到 db。有没有办法将文件名附加到 rdd 或以某种方式知道我当前正在阅读哪个文件?最后我想要一个带有字符串(文件行内容)和另一个字符串(相应文件名)的df。
【问题讨论】:
-
您可能希望提供更完整的代码 sn-p 以便我们了解一些上下文
-
rdd和df是什么?