Clark-Shao

1、数据导入:

要求将样表文件中的(sales_sample_20170310)数据导入 HIVE 数据仓库中。

 

 

 

2、数据清洗:

要求将 day_id 一列中的数值清洗为真实的日期格式,可用字符串表示。

数据 1 对应日期 2021-09-01,依次类推,15 对应日期 2021-09-15

 

 

 

3、数据分析处理:

1)统计每天各个机场的销售数量和销售金额。

要求的输出字段

day_id,sale_nbr,,cnt,round

日期编号,卖出方代码,数量,金额

 

 

 

2)统计每天各个代理商的销售数量和销售金额。

要求的输出字段

day_id,sale_nbr,,cnt,round

日期编号,卖出方代码,数量,金额

 

 

 

3)统计每天各个代理商的销售活跃度。

要求的输出字段

day_id,sale_nbr, sale_number

日期编号,卖出方代码,交易次数(买入或者卖出均算交易次数)

 

 

 

4)汇总统计 9 月 1 日到 9 月 15 日之间各个代理商的销售利润。

编号,卖出方代码,买入数量,买入金额,卖出数量,卖出金额,销售利润(卖出金额-买入金额)

 

 

 

4、处理结果入库:

将上述统计分析的结果数据保存到 mySQL 数据库中。

 

 

 

 

 

 

 

 

 

5、数据可视化展示:

利用 Echarts 将上述统计结果以图形化展示的方式展现出来:饼图、柱状图、地图、折线图等。

 

 

 

 

 

 

 

 

分类:

技术点:

相关文章: