【发布时间】:2014-03-13 09:22:29
【问题描述】:
我想每周自动将文件从 ftp 服务器下载到 CDH5 hadoop 集群。最好的方法是什么?
我正在考虑一份 Oozie 协调员的工作,但我想不出下载文件的好方法。
【问题讨论】:
-
也是个好主意,但是下载文件呢?我在考虑使用 distcp,但也许有更优雅的解决方案?
-
distcp 很优雅!我想不出更优雅的东西:)
-
当我使用这个命令时:hadoop distcp ftpserveraddress hdfs:/user/myuser/test/ 我得到一个 java.io.IOException: Login failed on server - serveraddress, port - 21 异常.. . 我可以毫无问题地卷曲。我应该使用 21 以外的其他端口吗?或者也许是 hftp?
标签: hadoop ftp hdfs cloudera oozie