【问题标题】:How can I use Oozie to copy remote files into HDFS?如何使用 Oozie 将远程文件复制到 HDFS?
【发布时间】:2014-08-23 12:06:22
【问题描述】:

我必须将远程文件复制到 HDFS。我想使用 Oozie,因为我需要每天在特定时间运行这项工作。

【问题讨论】:

  • 到目前为止你尝试了什么?

标签: hadoop hdfs oozie


【解决方案1】:

Oozie 可以帮助您创建工作流程。使用 oozie,您可以调用能够将文件从源复制到 HDFS 的外部操作,但 oozie 不会自动执行此操作。

以下是一些建议:

  1. 使用自定义程序将文件写入 hdfs,例如使用 SequenceFile.Writer。
  2. Flume 可能会有所帮助。
  3. 使用像 camel-hdfs 这样的集成组件将文件移动到 hdfs。
  4. ftp 文件到 hdfs 节点,然后从本地磁盘复制到 hdfs。

调查可能适合您的情况的更多选项。

【讨论】:

    猜你喜欢
    • 2018-10-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-18
    • 2019-11-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-23
    相关资源
    最近更新 更多