【发布时间】:2019-03-07 14:13:47
【问题描述】:
由于事务表中的数据量很大,我们每天都在下面运行这个查询,这个查询运行了 3 个小时左右。有什么方法可以调整此查询或减少执行时间?
CREATE TEMPORARY TABLE t1 AS
SELECT DISTINCT EVENT_DATE FROM (
SELECT DISTINCT EVENT_DATE FROM mstr_wrk.cust_transation
WHERE load_date BETWEEN CAST(CAST('2019-03-05 04:00:31.0' AS TIMESTAMP) AS DATE) AND CURRENT_DATE() AND event_title = 'SETUP'
AND state != 'INACTIVE' AND mode != 'DORMANT') T
我尝试减少减速器的数量以帮助加快速度,还尝试启用矢量化,但运气不佳。我们在 tez 上运行。
【问题讨论】:
标签: hadoop hive query-optimization hadoop-yarn