【发布时间】:2017-01-25 11:20:57
【问题描述】:
我按照我拥有的命令和 avro 模式创建了一个 hive 表。
CREATE TABLE table_name
PARTITIONED BY (t string, y string, m string, d string, h string, hh string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat'
TBLPROPERTIES (
'avro.schema.url'='hdfs://location/schema.avsc');
现在我想将我在 HDFS 中的数据转储到创建的表中。
我有一个 HDFS 位置,其中我的目录结构中的数据为 t/y/m/d/h/hh/data.avro 根据分区,我有多个目录,因为那是我的分区列。
我想将所有数据转储到创建的表中。
我尝试使用外部表,但它给出了异常。
【问题讨论】: