【发布时间】:2013-10-07 11:12:22
【问题描述】:
我有这个 hdfs 结构:
根目录/folder1/a1.avro
根目录/folder1/b1.avro
根目录/folder2/a2.avro
root/folder2/b2.avro
a1, a2 - 有 schemaA
b1, b2 - 有架构B
我想:
在 hive 中为所有数据创建外部表
或
为 a 数据创建外部表并为 b 数据创建外部表。
我该怎么做?
谢谢
【问题讨论】:
我有这个 hdfs 结构:
根目录/folder1/a1.avro
根目录/folder1/b1.avro
根目录/folder2/a2.avro
root/folder2/b2.avro
a1, a2 - 有 schemaA
b1, b2 - 有架构B
我想:
在 hive 中为所有数据创建外部表
或
为 a 数据创建外部表并为 b 数据创建外部表。
我该怎么做?
谢谢
【问题讨论】:
好的,我创建了 2 个 Hive 外部表,用于架构 A 的 Table_A 和用于架构 B 的 Table_B。
一旦我有 2 个表,我就会运行 2 组“alter table add partition”语句:
Alter table table_a 添加分区 ... 'root/folder1/a1.avro'; 更改表 table_a 添加分区 ... 'root/folder2/a2.avro';
Alter table table_b add partition … 'root/folder1/b1.avro'; 更改表 table_b 添加分区 ... 'root/folder2/b2.avro';
【讨论】: