【发布时间】:2018-07-22 07:24:07
【问题描述】:
根据 hive 模板:
hive.optimize.skewjoin : 是否开启倾斜连接优化。该算法如下: 在运行时,检测具有较大偏差的键。不要处理这些密钥,而是将它们临时存储在 HDFS 目录中。在后续的 map-reduce 作业中,处理那些倾斜的键。不需要为所有表倾斜相同的键,因此,后续的 map-reduce 作业(对于倾斜的键)会快得多,因为它是一个 map-join。
hive.groupby.skewindata : 数据中是否存在倾斜以优化分组查询
但我不明白是否
hive.groupby.skewindata 是否依赖于hive.optimize.skewjoin?
【问题讨论】:
标签: hadoop hive bigdata hiveql