使用逻辑树细化分析业务问题

分析业务问题时,常用思维导图将业务问题拆分来做分析,主要方法如下:
使用逻辑树细化分析业务问题

一、分析背景

2013年11月,我国十八届三中全会通过的《 中共中央关于全面深化改革若干重大问题的决定》对外发布,其中提到“坚持计划生育的基本国策,启动实施一方是独生子女的夫妇可生育两个孩子的政策”,标志着“单独二孩”政策正式实施。这一政策的实施和新生代父母的消费能力与意识升级为母婴用品市场带来巨大的发展空间。《2014年中国母婴行业线上数据洞察报告》显示,我国母婴行业线上发展时间虽短,但形态丰富。除了垂直平台的发展,综合电商平台也纷纷抢滩母婴用品市场。如果想保持行业内竞争力、扩大市场份额,就需要分析如何提高商品销量。

二、分析目的

提高婴儿用品销量。

三、数据来源及业务指标理解

3.1 数据来源

采用数据源为阿里云天池中关于淘宝天猫婴儿用品购买情况的数据集,时间区间自2012年7月2日至2015年2月5日。数据集中包含两张表单:

表一:商品信息表,共有29971条数据,包含字段:

user_id:用户id

auction_id:购买行为编号

cat_id:商品种类ID

cat1:商品属于哪个类别

property:商品属性

buy_mount:购买数量

day:购买时间

表二:婴儿用户相关信息,共有953条数据,包含字段:

user_id:用户id

birthday:出生日期

gender:性别(0 男性;1 女性)

3.2 提出问题

① 哪个商品类别最受用户欢迎?

② 商品的成交数量随时间的变化规律是怎样的?

③ 用户群的性别和年龄与销量之间有什么关系?

3.3 业务指标

根据现有数据集,可从以下两个指标分析:

商品销量:不同维度下购买数量的差别。如同一年度中不同月份的成交数量,不同商品类别的成交数量,不同性别、不同年龄婴儿的成交数量等。

成交用户数:不同维度下用户数量的差别。

复购率:消费两次以上的人数/付费用户数,表示商品的用户黏性。

四、构建模型分析问题

4.1 分析模型

使用逻辑树细化分析业务问题

4.2 数据清洗

复制一份数据集(保留原始数据以便核查),将不需要的列隐藏。

删除重复值

对表1和表2全选删除重复值,均无重复值。
使用逻辑树细化分析业务问题
检查缺失值

将表2中出生日期和性别根据用户id使用VLOOKUP函数匹配到表1右侧空白列,全选工作表,使用定位功能,定义定位条件为空值,检查是否有缺失值。结果显示内容比较完整。对缺少出生日期的用户购买信息,将在涉及婴儿信息时删除。

异常值处理

青中年人不能算作婴儿,将出生日期在1984年的用户购买信息,和无法辨别性别(“性别”为“2”)的合计27条数据,在涉及婴儿信息时删除。

数据格式转换

通过检查,发现购买时间和出生日期列格式为常规,而在实际运用中需要使用短日期格式,因此运用分列将其转换。
使用逻辑树细化分析业务问题

4.3 分析问题

1. 最受用户欢迎的商品类别

· 商品销量

在数据集中,按不同商品类别的销量排序:28>50014815>50008168>38>50022520>122650008
使用逻辑树细化分析业务问题
· 复购情况

由于有16个用户重复购买四类商品,总计非初次下单次数为18次,因此在29971条数据中实际总体购买人数为29953人。
商品种类复购率排序:38>50008168>28>50014815>其他种类,虽然种类“38”复购率最高,但0.17%的复购水平仍然很低。
使用逻辑树细化分析业务问题

2. 商品集中成交月份

由于2012年和2015年仅有部分月份数据,因此仅分析2013年和2014年数据。
使用逻辑树细化分析业务问题
由上图可知,2013年和2014年均在5月、9月销量相对较高,2013年7月、12月和2014年3月、11月有较高销量。将维度细化到日,探寻产生销量高峰的原因。
使用逻辑树细化分析业务问题
2013年和2014年都在2月底3月初和年中有相对较高销量,一方面受到例如妇女节、“520”等特殊节日的影响,另一方面也有年中大促等活动等促进。可以清晰看到中2013年12月20日左右和2014年的9月20日、11月11日附近产生峰值,主要是2013年开始推出年度最大折扣的双十二活动,以及2014年9月21-23日天猫丰收购物节和双十一购物节的影响。

由此可见,购物折扣活动对提高婴儿用品销量产生很大推动作用。

3. 用户黏性

使用逻辑树细化分析业务问题
仅就数据集中整体情况来看,全商品类别的复购率仅为0.05%,剔除无复购情况商品后复购率为0.06%,单个商品类别复购率最高也仅为0.17%,用户黏性很低。

4. 用户群性别与销量之间的关系

表2婴儿总数有926位,男婴儿有488位,女婴儿有438位。使用逻辑树细化分析业务问题
男女婴儿用品的销售比重大约为6:4。使用逻辑树细化分析业务问题
将各商品类别不同婴儿性别的购买量细分,可以看到类别50014815、类别38男婴用品销量较女婴用品购买更多,类别50022520是唯一女婴用品比男婴用品销量高的商品类别。

5.用户群年龄分布与销量之间的关系

使用逻辑树细化分析业务问题
婴儿年龄在0-2岁的商品销量最大,而后逐年递减。

取不同年龄购买商品数量前三的商品种类进行销量合计:
使用逻辑树细化分析业务问题
可以看出商品类别50014815、类别50008168年龄跨度更大,其他类别相对更受婴儿年龄限制。

五、总结

  1. 销量最高的三个商品类别是“28”、“50014815”、“50008168”,复购率最高的商品种类是“38”、“50008168”、“28”,但复购率最高仅为0.17%;

  2. 商品的成交数量对季节性敏感度不高,主要靠促销活动提高销量;

  3. 全婴儿用品商品类别的用户黏性都不高,仅为0.05%;

  4. 男女婴儿用品销量比例约为6:4,受性别影响不大。唯一女婴用品比男婴用品销量高的类别是“50022520”;

  5. 婴儿用品需求量最大的是0-2岁,商品类别“50014815”、“50008168”相对受婴儿年龄影响较小。

六、可视化报告

使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题
使用逻辑树细化分析业务问题使用逻辑树细化分析业务问题使用逻辑树细化分析业务问题使用逻辑树细化分析业务问题使用逻辑树细化分析业务问题使用逻辑树细化分析业务问题

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-05-21
  • 2022-01-19
  • 2021-07-07
  • 2022-12-23
  • 2021-05-29
猜你喜欢
  • 2021-12-05
  • 2022-02-14
  • 2021-10-12
  • 2021-12-17
  • 2021-07-14
  • 2022-12-23
相关资源
相似解决方案