购物篮分析模型原理

描述

要想做好数据分析必定要理解和熟悉掌握各类数据分析模型,但大部分文章只是给你罗列出了有哪几种数据分析模型及对应理论,并未用实例来辅助说明

很多时候这些模型都进了收藏夹吃灰,大家也没有深刻理解这种分析模型,等到下次要开始分析数据了,又是一脸懵,然后再去收藏夹里翻文章。

学东西在精不在多,今天就分享1个常用的数据分析模型——购物篮分析模型,并附上应用实例,希望能让大家真正掌握这个分析模型,并在之后分析数据时能自己把模型灵活用起来!

购物篮分析模型原理

据说上个世纪九十年代,沃尔玛的超市管理人‎‎员分析销售数据时发现了一‎‎个令人难于理解的现象,婴儿的纸尿裤和啤酒放通常会出现在一个订单里,经过数据分析发现,买尿不湿的家长以父亲居多,如果他们在买尿不湿的同时恰好看到了啤酒,就会有很大的概率购买,从而就能提高啤酒的销售量。

 

当然,这个案例现在已被证实是虚构的,但这个故事仍让可以给我们很大的启发,商品之间的关联关系是客观存在的,这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。

看到这,你可能会觉得这不是常识吗?为什么还是个数据分析模型。

其实不然。虽然这种现象你看过去是常识,但这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,即购物篮分析模型。需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度,常用于零售行业。

这个模型一般是用来找出顾客购买行为的模式:

①比如用户买了A商品,是否会对B商品产生什么影响?
②不同的用户是否具有不同的购买模式?
③哪些产品应该放在一起进行捆绑销售?

在分析案例前,先解释下这三个指标分别代表的意思和计算方法。

1 「支持度」

A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。

计算公式:同时购买A和B订单数 / 总购买订单数

今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。

2 「置信度」

因为购买了A所以购买了B的概率,注意与支持度区分。

计算公式:同时购买A和B订单数 / 购买A的订单数

今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%

3 「提升度」

先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。

计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )

今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的。

讲完购物篮模型的原理和计算公式,只能大概掌握一些皮毛,接下来就带你用实例来应用一下购物篮分析模型,加深印象。

案例分析

以我们最为熟悉的超市为例。

案例背景是A集团超市最近在准备周年大促,需要根据近3个月A集团超市旗下各门店商品销售明细,来确定哪些商品需要组合起来捆绑促销。

先不急着分析,先理清一下思路,要解决这个问题,我们需要从以下五个步骤进行思考。

第一步 
确定使用工具、数据来源

使用工具:FineBI数据分析工具
数据来源:A集团超市商品销售总表(已脱敏处理)

数据分析▲A超市商品销售总表▲

第二步 
计算指标

根据上述计算公式可知,我们需要计算:

①总购买订单数 ②同时购买A和B的订单数 ③分别购买A和B的订单数

接下来,我们就在FineBI的自助数据集中逐个计算。

①总购买订单数

要计算总购买订单数,首先我们要先勾选「单据编码」,添加分组汇总,设置汇总方式为「去重计数」,对单据编码个数求和,从而轻松计算出总购买订单数。

数据分析

②计算同时购买A和B订单数

要计算同时购买A和B的订单数,就需要复制一列相同的商品类别,将两列合并在一起,就可以分出比如A+A、A+B、B+A等的商品组合。

让表左右合并,而后选择并集合并,合并依据为单据编码。

数据分析

将商品名称作为A商品,集团商品总表-商品名称作为B商品。显然,不需要类似 A+A 的组合,因此需要将该数据过滤掉,输入函数【商品名称!=集团商品销售总表-商品名称】即可。

③计算分别购买A和B的订单数

添加左右合并,并将合并结果命名为「购买A的次数」,B商品同理计算。

数据分析

第三步  
计算支持度、置信度、提升度

得到上面三个指标后,我们就可以开始计算支持度、置信度、提升度了。

支持度=同时购买A和B订单数/总购买订单数,新增列。置信度,提升度同理,就不列举了。

数据分析

第四步  
数据分析

计算得到支持度、置信度、提升度的结果后,我们就可以开始进行数据分析了。

使用FineBI的自定义图表,分析商品间的关联程度,用颜色的深浅和具体计算数字来表示关联程度的高低。

数据分析▲商品关联分析▲ 数据分析▲商品支持度分析▲ 数据分析▲商品置信度分析▲ 数据分析▲商品提升度分析▲

第五步  
得出分析结论

(1)微爽日用卫生巾和家之寓圆形夹晒架的支持度(同时购买概率)最高,为5.95。且购买家之寓圆形夹晒架后又购买微爽日用卫生巾的置信度较高,为0.27,大于平均置信度,因此两者被一起购买的概率很大,可放置在货架的相邻位置,刺激顾客购买欲。

(2)本地小白菜和香妃蜜瓜的置信度最高,为0.42。因此可将小白菜和香妃蜜瓜放在果蔬货架的相邻位置或捆绑销售。

(3)青葱和雪碧的提升度最高,为8.44。即购买雪碧后对购买青葱有较大的提升作用,但考虑到青葱和雪碧的购买量都较大,且都为常备品,基于实际情况来说,不适合捆绑销售。

(4)盐津铺子和嘉士利威化饼的提升度较高,为4.54,大于1。两个都为零食货柜商品,因此可考虑捆绑销售。

总结

经过上述五个步骤,我们可以得出初步的分析结论。当然,最后的零售促销方案还是得根据超市的实际情况来判断合不合适(例如分析结论中的青葱和雪碧),数据只能辅助我们的决策,而不能直接给予决策。  

      审核编辑:彭静
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分