摘要:

先整体数据进行分析,得到一般性结论,在通过对每个顾客的数据进行线性回归,得到顾客的购买趋势,据此判断是否具有购买潜力。在整个分析过程中,大量绘制图表,并将最终结果整理为Excel文件。


一、整体数据分析


  • 平均购买金额能够很好反映顾客购买金额和购买次数之间的联系。

根据公式

ν=a/c ν=a/c vac (v表示平均购买金额,a表示总金额,c表示购买次数)

计算便能得到每个顾客平均购买金额。


绘制v-c散点图
关于最具购买力的顾客分析
由上图可以得出:

  • 购买次数集中在22到33之间
  • 相同的购买次数,平均购买金额也会相差很大
  • 图中的点相对集中,越往中间,不同次数之间点的密度越相近。
  • 图中存在一些点,分散在图的周围,这反应了消费的不同顾客之间的消费差异。
  • 图中的每个点都代表一个顾客(可能有些点重合了)

关于最具购买力的顾客分析

对所有数据进行分析,得到下面的表格:

消费次数 消费金额 平均消费金额
平均值 26.792988 112.548431 4.197935
最大值 46.000000 221.550000 5.704286
最小值 12.000000 50.850000 2.944545

关于最具购买力的顾客分析

  • 图中红色的点是消费次数和平均消费金额都高于平均值的点。这些点的数量约占整体数量的25%。

二、顾客数据分析

以customer_id为1的顾客进行举例分析。
绘制该顾客消费曲线图
关于最具购买力的顾客分析

  • 该顾客的消费次数和消费金额都高于平均值。
  • 每个顾客的消费曲线都不相同,通过对每个顾客的数据进行线性回归处理,并预测该顾客未来10次的消费曲线。
  • 可以认为未来10次消费曲线上升的顾客是具有购买潜力的顾客,据此便可以判断该顾客是否具有购买潜力。

关于最具购买力的顾客分析

三、总结

  • 将每个顾客的每次购买金额与对应次数组成数据,对其进行线性回归分析,得到每位顾客的未来10次的购买趋势。
  • 线性回归一定程度上揭示了每个顾客购买金额与次序之间的关系。
    每个顾客的数据量过少,线性回归预测的结果可靠性并不大。
  • 顾客后续购买的时间是不确定的,虽然有相应的购买时间数据,但该时间数据过于集中或离散(顾客一天之类有几次购买,相隔不定天数后再次购买),致使数据处理变得复杂。分析下次购买时间也会产生问题,以怎样的时间为标准来判定该顾客是否在时间内故本次分析没有结合具体购买时间或者两次购买之间的时间差。

附:

百度网盘链接

链接:https://pan.baidu.com/s/1XbT6DpaoXfD0Qic65I3TXw
提取码:5pwi

相关文章:

  • 2021-10-26
  • 2021-12-24
  • 2021-08-05
  • 2021-12-27
  • 2021-06-11
  • 2021-11-19
  • 2018-12-22
  • 2021-04-25
猜你喜欢
  • 2021-05-14
  • 2019-01-09
  • 2021-11-23
  • 2021-11-05
  • 2021-10-16
  • 2021-05-21
  • 2021-11-13
  • 2021-07-29
相关资源
相似解决方案