【发布时间】:2012-09-03 11:44:25
【问题描述】:
我有一组日志文件,创建了一个 Hive 表,现在我想根据 col 对表进行分区,我不明白并且没有看到示例是如何为分区指定列 如何指定列/字段 前任。这是日志中的一行
2012-04-11 16:49:10,629 ~ [http-7001-11] ~DE1F6F6667913022AE2620D1228817D6 ~ END ~ /admin/bp/setup/newedit/ok ~ pt ~ 219 ~
表结构是 CREATE TABLE log (starttime STRING, thread STRING, session STRING, method STRING, targeturl STRING, registry string, ipaddress STRING, details STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'; 现在,如果我希望 6the col 即 'registry' 成为日志的分区,我将如何编写分区语句。 一般来说,如果我有一行(行)与 cols c1,c2,..... c10 如何在分区中指定col ci? 谢谢
【问题讨论】:
标签: hadoop hive hadoop-partitioning