【发布时间】:2020-08-19 20:11:17
【问题描述】:
我想保留旧表中的所有 10 个变量,但只选择基于 3 个变量 (var1 var2 var3) 的不同记录,如何将所有 10 个变量保留在 HIVE 的新表中?
(新建表为 选择不同的 变量 1、变量 2、变量 3 从旧的);
【问题讨论】:
-
。 . SQL 使用术语“列”来描述表中的属性,而不是“字段”。
我想保留旧表中的所有 10 个变量,但只选择基于 3 个变量 (var1 var2 var3) 的不同记录,如何将所有 10 个变量保留在 HIVE 的新表中?
(新建表为 选择不同的 变量 1、变量 2、变量 3 从旧的);
【问题讨论】:
您可以使用row_number() -- 如果您不关心选择了哪些行:
select . . . -- whatever columns you want
from (select t.*,
row_number() over (partition by var1, var2, var3 order by var1) as seqnum
from t
) t
where seqnum = 1
【讨论】: