【发布时间】:2016-03-29 09:16:38
【问题描述】:
我的工作是按照以下格式将文件写入 hdfs:
/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro
是否可以在不移动文件和重命名目录的情况下定义同时按年份和时间戳 (HH:mm:ss) 分区的 Hive 外部表?
【问题讨论】:
标签: hive hdfs datetime-format hiveql
我的工作是按照以下格式将文件写入 hdfs:
/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro
是否可以在不移动文件和重命名目录的情况下定义同时按年份和时间戳 (HH:mm:ss) 分区的 Hive 外部表?
【问题讨论】:
标签: hive hdfs datetime-format hiveql
您可以通过为每个 yyyy/HH/mm/ss 实例编写加载数据语句来实现这一点。
LOAD DATA INPATH '/table_name/yyyy/MM/dd/HH/mm/ss/file_name.avro' INTO TABLE tablename PARTITION (year=yyyy, hour=HH, minute=mm, second=ss)
【讨论】:
ALTER TABLE table_name ADD PARTITION partition(tstamp='yyyy_hh_mm_ss') LOCATION '/table_name/yyyy/MM/dd/HH/mm/ss'