reja-boomboom

一、分析思路

前面已通过python+tableau实现对淘宝用户行为数据的分析,前文地址:https://www.cnblogs.com/reja-boomboom/p/12602661.html

此次使用MySQL实现同等分析操作。分析思路依旧:

二、数据背景

数据来源阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649

 三、数据清洗

①数据拆分

出于电脑性能考虑,源数据过大,利用python拆分3000000条数据进行分析。

 ②导入数据库

设定存储列不为空值,保证数据无缺失值。

 导入后数据结果为

 ③根据时戳值转化类型,新增datetime列,将datetime列拆分dates列和hours列

 拆分结果为

 ④删除异常数据

  

可知超出时间范围的数据均为异常值,删除。

四、数据分析

1.流失和转化分析

①pv点击量到购买量的转化

 

导出数据用tableau展示各环节转化率

②uv访客量到购买量的转化

 

 导出数据用tableau展示各环节的转化率

 2.用户行为的时间模式分析

①用户该时期每天活跃度

 导出数据用tableau展示结果

 ②用户一天各时间段活跃度

将hours列设置成小时单位

结果为

 按各时间段统计活跃度

 导出数据用tableau展示结果

 3.商品和商品种类分析

①商品种类点击量和购买量之间的关系

 按转化率降序排序结果为

 导出数据用tableau展示相关性

 ②商品类目前10点击量和购买量

③商品点击量和购买量之间的关系

  按转化率降序排列结果为

 导出数据用tableau展示相关性

④商品前10点击量和购买量

 

4.用户价值分析

对用户分层

①统计每个用户的购买次数

 

 ②统计每个用户最近购买时间

 

 ③将结果导出新建“用户购买次数”,“用户最近购买时间”表

 ④根据购买次数对用户分层

 

 ⑤根据用户最近购买时间对用户分层

 

 ⑥构建RFM模型综合评估用户

 

 导出用户价值分类表,可以根据RF值找出各层用户,实现精准对策。

五、总结

利用MySQL+Tableau可同样实现Python数据分析操作。

 

分类:

技术点:

相关文章: