【发布时间】:2019-10-23 14:24:23
【问题描述】:
我正在尝试使用 spark-submit 将文件写入 hdfs。 写入文件时,我想将一个文件拆分为多个,例如 mapreduce 的结果而不是一个。(例如 part-0000,park-0001)
这里是示例代码 我应该设置哪些选项
val conf = new Configuration()
val fs= FileSystem.get(conf)
val output = fs.create(new Path("/user/foo/test.txt"))
val writer = new PrintWriter(output)
writer.write("Hellow World1\n")
writer.write("Hellow World2\n")
...
writer.write("Hellow World3\n")
【问题讨论】:
标签: scala hdfs spark-submit