【问题标题】:Hdfs file list in scalascala中的hdfs文件列表
【发布时间】:2016-04-20 07:38:50
【问题描述】:

我正在尝试在 hdfs 目录中查找文件列表,但是当我尝试运行以下代码时,将其预期文件的代码作为输入。

val TestPath2="hdfs://localhost:8020/user/hdfs/QERESULTS1.csv"
val hdfs: org.apache.hadoop.fs.FileSystem = org.apache.hadoop.fs.FileSystem.get(sc.hadoopConfiguration)
      val hadoopPath = new org.apache.hadoop.fs.Path(TestPath1)
      val recursive = true
     // val ri = hdfs.listFiles(hadoopPath, recursive)()
      //println(hdfs.getChildFileSystems)
      //hdfs.get(sc

val ri=hdfs.listFiles(hadoopPath, true)
println(ri)

【问题讨论】:

  • 您收到的错误信息是什么?你能简单介绍一下这个问题吗?
  • 错误的 FS:hdfs://localhost:8020/user/hdfs/QERESULTS1.csv,预期:文件:/// at org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java :642)
  • 我正在尝试使用 scala 查找 hdfs 目录中的文件列表

标签: scala hadoop apache-spark hdfs


【解决方案1】:

你应该先将你的默认文件系统设置为 hdfs://,我好像你的默认文件系统是 file://

val conf = sc.hadoopConfiguration 
conf.set("fs.defaultFS", "hdfs://some-path")

val hdfs: org.apache.hadoop.fs.FileSystem = org.apache.hadoop.fs.FileSystem.get(conf)

...

【讨论】:

    猜你喜欢
    • 2019-11-14
    • 2021-06-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-09-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多