Hadoop生态圈-Azkaban实现hive脚本执行

                                      作者:尹正杰

版权声明:原创作品,谢绝转载!否则将追究法律责任。

 

 

   本篇博客中在HDFS分布式系统取的数据,而这个数据的是有之前我通过MapReduce生产的数据,详情请参考:https://www.cnblogs.com/yinzhengjie/p/9233393.html

 

 

1>.创建job文件

use yinzhengjie;
create table if not exists az_wc(word string, count int) row format delimited fields terminated by '\t';
load data inpath '/azkaban_out/part-r-00000' into table az_wc;
create table if not exists az_top3 like az_wc;
insert overwrite table az_top3 select * from az_wc order by count desc limit 3;
创建SQL文件(hive.sql)

相关文章:

  • 2022-12-23
  • 2021-10-26
  • 2022-12-23
  • 2020-12-17
  • 2021-12-27
猜你喜欢
  • 2021-10-12
  • 2021-05-17
  • 2022-02-09
  • 2021-07-06
  • 2021-08-22
  • 2022-12-23
  • 2021-10-21
相关资源
相似解决方案