【发布时间】:2016-03-18 06:06:52
【问题描述】:
我正在尝试在 Hive 中的另一个表(保存相同的数据但始终保持)中汇总 1 个表(其数据每月重新计算)中的数据。但是,每当我尝试合并数据时,都会出现以下错误:
FAILED: SemanticException [Error 10094]: Line 3:74 Dynamic partition cannot be the parent of a static partition 'category'
我用来创建表格的代码如下:
create table my_data_by_category (views int, submissions int)
partitioned by (category string)
row format delimited
fields terminated by ','
escaped by '\\'
location '${hiveconf:OUTPUT}/${hiveconf:DATE_DIR}/my_data_by_category';
create table if not exists my_data_lifetime_total_by_category
like my_data_by_category
row format delimited
fields terminated by ','
escaped by '\\'
stored as textfile
location '${hiveconf:OUTPUT}/lifetime-totals/my_data_by_category';
我用来填充表格的代码如下:
insert overwrite table my_data_by_category partition(category)
select mdcc.col1, mdcc2.col2, pcc.category
from my_data_col1_counts_by_category mdcc
left outer join my_data_col2_counts_by_category mdcc2 where mdcc.category = mdcc2.category
group by mdcc.category, mdcc.col1, mdcc2.col2;
insert overwrite table my_data_lifetime_total_by_category partition(category)
select mdltc.col1 + mdc.col1 as col1, mdltc.col2 + mdc.col2, mdc.category
from my_data_lifetime_total_by_category mdltc
full outer join my_data_by_category mdc on mdltc.category = mdc.category
where mdltc.col1 is not null and mdltc.col2 is not null;
令人沮丧的部分是我将这些数据分区到另一列上,并且对该分区重复相同的过程没有问题。我试过用谷歌搜索“动态分区不能是静态分区的父级”错误消息,但我找不到任何关于导致此问题的原因或如何修复它的指导。我很确定我的一个或多个表的设置方式存在问题,但我看不出是什么。是什么导致了这个错误,我能做些什么来解决它?
【问题讨论】:
-
我知道这确实很旧,但我遇到了这个问题,并且没有关于这个错误的任何信息。至少对我来说,问题是由于计算字段没有列别名。在上述情况下,
mdltc.col2 + mdc.col2应该是mdltc.col2 + mdc.col2 as col2。关于错误的任何内容都不会表明这是问题,但这绝对是为我解决问题的原因。
标签: hive