【发布时间】:2017-11-27 09:13:56
【问题描述】:
我在 HDFS 中有一些使用 Sqoop 导入的数据。数据导入为 ORC,压缩为 Snappy。
我正在尝试使用以下 DDL 语句在此数据之上创建一个表。但是,我收到以下错误。
失败:SemanticException [错误 10043]:列列表或 应指定自定义序列化程序
但是,我通过定义 ROW FORMAT SERDE and STORED AS INPUTFORMAT and OUTPUTFORMAT 来定义“自定义序列化程序”
DDL 声明:
CREATE EXTERNAL TABLE test_db.my_table_orc
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION '/hdfs/app/DL/ORC_DATA_LOCATION'
tblproperties ("orc.compress"="SNAPPY");
【问题讨论】:
标签: hadoop hive cloudera hiveql orc