【发布时间】:2020-01-18 05:09:38
【问题描述】:
我遇到了一个 Hive 查询计算 count distinct 没有分组,运行速度非常慢。所以我想知道这个功能是如何在 Hive 中实现的,有 UDAFCountDistinct 吗?
【问题讨论】:
标签: hive query-optimization hiveql
我遇到了一个 Hive 查询计算 count distinct 没有分组,运行速度非常慢。所以我想知道这个功能是如何在 Hive 中实现的,有 UDAFCountDistinct 吗?
【问题讨论】:
标签: hive query-optimization hiveql
Hive 1.2.0+ 提供auto-rewrite optimization for count(distinct)。检查此设置:
hive.optimize.distinct.rewrite=true;
【讨论】: