【发布时间】:2015-12-16 06:30:22
【问题描述】:
我的本地机器没有安装 hdfs。我想从远程 hdfs 集群中检索文件。实现这一目标的最佳方法是什么?我是否需要 get 将文件从 hdfs 发送到集群机器 fs 之一,然后使用 ssh 检索它们?我希望能够通过 bash 脚本以编程方式执行此操作。
【问题讨论】:
我的本地机器没有安装 hdfs。我想从远程 hdfs 集群中检索文件。实现这一目标的最佳方法是什么?我是否需要 get 将文件从 hdfs 发送到集群机器 fs 之一,然后使用 ssh 检索它们?我希望能够通过 bash 脚本以编程方式执行此操作。
【问题讨论】:
步骤如下:
hadoop fs -get命令直接获取文件还有其他选择
如果您的主机无法将 Hadoop 二进制文件安装为客户端,那么您可以使用以下说明。
ssh <user>@<host> "hadoop fs -get <hdfs_path> <os_path>"
【讨论】: