带limit的hivesql排序
 
select requestdomain,count(1) as cnt from ods_cndns_real_log where dt = 20160707 group by requestdomain order by cnt desc limit 1000;
生成两个mr:第一步先group by;第二步将数据放到一个reduce上执行。如果group by后的数据量超大,不可取。任务可能会失败。
 
select requestdomain,count(1) as cnt from ods_cndns_real_log where dt = 20160707 group by requestdomain sort by cnt desc limit 1000;
生成三个mr:第一步先group by:第二步将每个reduce上的数据按照cnt进行倒叙排列;第三步将第二步中每个reduce上倒序前10000个数据放入下一个任务中,即一个reduce上进行排序。
 
待更新。。。

相关文章:

  • 2021-12-09
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-11-25
  • 2021-05-24
  • 2021-12-24
  • 2022-01-30
猜你喜欢
  • 2021-10-30
  • 2021-09-17
  • 2022-12-23
  • 2022-02-03
  • 2021-06-26
  • 2021-09-26
  • 2022-01-17
相关资源
相似解决方案