【发布时间】:2017-09-21 14:29:48
【问题描述】:
我有一个 Hive 表来存储一些 csv 路径,以便加载它们。
我想在加载一些数据时使用我的配置单元表。
例如:-
LOAD DATA INPATH (select path from my_path_table) OVERWRITE INTO TABLE my_result_table
Hive 可以做到吗?
谢谢
【问题讨论】:
-
你为什么要做这样的事情?
我有一个 Hive 表来存储一些 csv 路径,以便加载它们。
我想在加载一些数据时使用我的配置单元表。
例如:-
LOAD DATA INPATH (select path from my_path_table) OVERWRITE INTO TABLE my_result_table
Hive 可以做到吗?
谢谢
【问题讨论】:
您可以在查询中提供硬编码的路径。
另一种选择是,您可以通过提供相同的位置来创建外部表。在这种情况下,您不需要运行覆盖命令。无论 HDFS 位置有什么数据,您都可以直接从该表中查看。
CREATE EXTERNAL TABLE my_result_table(col string)
LOCATION 'hdfs location'
希望对你有帮助。
我可能以错误的方式解释问题:
根据我现在的理解,您的 my_path_table 中有可用的路径,并且您希望将这些路径插入到最终表格中。
INSERT OVERWRITE TABLE my_result_table select path from my_path_table;
谢谢, 手动
【讨论】: