【发布时间】:2016-11-21 12:08:13
【问题描述】:
我有一个 python 脚本,它为我想要导入 Hive 的目录中的文件生成模式、删除表和加载表命令。然后我可以在 Ambari 中运行这些来导入文件。可以执行多个“创建表”命令,但是在上传文件以导入各自的 Hive 表时,我一次只能上传一个文件。
有没有办法将这些命令放在一个文件中并一次全部执行,以便创建所有表并将相关文件随后上传到各自的表中?
我还尝试将文件导入 HDFS,然后使用“hdfs dfs -copyFromLocal /home/ixroot/Documents/ImportToHDFS /hadoop/hdfs”命令通过 Linux 将它们发送到 Hive,但出现诸如“no such”之类的错误关于 'hadoop/hdfs' 的目录'突然出现。我曾尝试使用 chmod 更改权限,但这些似乎也没有效果。
如果有人能告诉我在将多个文件有效地导入 Hive 中各自的表中时,我将非常感激。
【问题讨论】: