数据建模实战:方寸之间玩转购物篮分析
购物篮分析是零售行业里非常重要经典的一个模型,曾经被大家津津乐道的啤酒与尿布的故事,相信大家都还记忆犹新,这个故事很好地诠释了商品关联性对销售额的提升作用,时至今日,仍有很强的现实指导意义。这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析的实现方法有很多,下面教一下大家如何去制作一个完整的购物篮分析模型。
一、前言:
在开始制作购物篮分析模型之前,我们先来理解一下购物篮分析模型的价值在哪里。购物篮分析的本质是研究商品与商品间的关联关系,比如分析A商品和哪个商品搭配会卖的更好,或者分析客户在购买了A商品之后,对B商品会产生什么影响等等。通过这种交叉分析,我们便可以对客户感兴趣的商品组合去做出相应的调整,或者据此去深入研究更高层次的推荐算法。
做购物篮分析还得先理解三个概念,支持度、置信度与提升度。支持度指A商品和B商品同时被购买的概率,用公式表示就是支持度=同时购买A和B订单数/总购买订单数;置信度是指购买A之后又购买B的条件概率,用公式表示就是置信度=同时购买A和B订单数/购买A的订单数;提升度指的是先购买A对购买B的提升作用,用公式表示就是提升度=支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))。看不懂的小伙伴可以看下图的举例说明,加深理解:
二、购物篮分析步骤:
首先要准备一份零售行业的数据源,需包含单据编码、商品名称等信息,文中提供的案例数据源大家可以在根据文末提供的信息进行获取。如果用Excel做购物篮分析,难度会很大,建议用其他工具进行制作,本文选择用SQL语句的方式去制作:
第一步,新建一个临时表,对商品名称进行交叉关联,为每一组交叉商品增加一列总订单数的字段,并把该临时表命名为t1:
执行语句后,可得出以下4个字段:
第二步,新建一个临时表t2,对商品名称进行交叉关联,算出同时购买A商品与B商品的订单数:
执行语句后,可得出以下3个字段:
第三步,把t1与t2两个临时表的字段进行关联:
执行语句后,可得出以下4个字段:
第四步,新建一个临时表t4,算出A商品的订单数:
执行语句后,可得出以下2个字段:
第五步,新建一个临时表t5,算出B商品的订单数:
执行语句后,可得出以下2个字段:
最后一步,根据支持度、置信度与提升度的公式,以及我们得出的这5个临时表的数据,我们就可以开始进行运算了。根据t3表里‘’同时购买A和B订单数‘’与‘’总订单数‘’这两个字段,我们可以算出支持度的数据。根据t3表里‘’同时购买A和B订单数‘’与t4表里‘’A商品订单数‘’这两个字段,我们可以算出置信度的数据。同理,利用‘’同时购买A和B订单数‘’、‘’购买A订单数‘’、‘’购买B订单数‘’与‘’总订单数‘’这几个字段,我们最后就可以得出提升度的数据了。
最后得出的结果如下:
三、后续建议:
从上面的制作过程来看,如果要制作一个完整的购物篮分析模型,过程还是挺复杂的。为了对数据建模以及多维分析有更深的认识,小编推荐大家利用智分析的数据模型去制作购物篮分析,智分析的数据模型具有非常强大的多维分析能力,不仅支持自助取数,还支持SQL、MDX等高阶的查询语法。智分析的数据源接口同样也很丰富,可以连接各种数据库,也可以以Excel文件导入的方式进行导入:
进入数据模型的界面后,便可以开始搭建购物篮分析的数据模型了,这里依然是选择用SQL查询的方法去做购物篮分析,新建一个SQL查询,输入语句,执行后便可以得出购物篮分析模型的数据:
数据模型搭建之后,可以借助智分析自助仪表盘对购物篮分析的数据进行可视化呈现,仪表盘可以进行下钻、筛选、轮播等高级的操作,非常适合展示购物篮分析、RFM分析、ABC分析等数据模型:
PS:关于文中提到的数据源以及模型资料,大家可以点关注之后私信我进行获取
数据建模实战:方寸之间玩转购物篮分析相关推荐
- 数据建模实战,Smartbi带你玩转购物篮分析
购物篮分析是一个非常重要的模型,关于啤酒与尿布的故事,这个故事很好地解释了商品关联性的作用,时至今日,仍有很强的现实指导意义.这种数据,将不同商品关联起来,并挖掘二者之间联系的分析方法,就叫作&quo ...
- 购物篮分析( Apriori算法)—零售数据实战
购物篮分析( Apriori算法)-零售数据实战 [开题]在我从事零售行业的期间,曾拜读过"啤酒与尿布"一书,对于沃尔玛的购物篮分析模型产生极大的兴趣.由于网上对Aprioro算法 ...
- 数据挖掘实战—商品零售购物篮分析
文章目录 引言 一.数据探索性分析 1.数据质量分析 1.1 缺失值分析 1.2 异常值分析 1.3 重复数据分析 2.数据特征分析 2.1 描述性统计分析 2.2 分布分析 2.2.1 商品热销情况 ...
- 关联规则与购物篮分析实战
导读:本文介绍了关联规则原理及Apriori算法实现购物篮分析,以一个真实案例辅助理解关联分析. 背景与需求 客户A企业是一家全球知名家具和家居零售商,销售主要包括座椅/沙发系列.办公用品.卧室系列. ...
- python数据分析与挖掘实战(商品零售购物篮分析)
一.引言 购物篮分析是商业领域最前沿.最具挑战性的问题之一,也是许多企业重点研究的问题.购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究顾客的购买行为,从而辅助零售企业制定 ...
- tableau实战系列(二十八)-以可视化的方式打开关联分析算法购物篮分析(Market Basket Analysis)
关于购物篮分析 购物篮分析 Market Basket Analysis 是销售数据研究顾客的购买行为.零售.电信.金融服务.保险.医疗等多行业,可通过了解顾客的购买习惯和规则,挖掘商业利益并建立竞争 ...
- 关联规则之购物篮分析
购物篮分析常用于许多实体商店和在线零售的推荐系统,通过关联规则,可以将经常一起购买的商品进行组合,实现销量的提升. 关联规则中有三个非常重要的指标:支持度.可信度和提升度. 支持度,指所有项集中,同时 ...
- 啤酒和尿不湿?购物篮分析、商品关联分析和关联规则算法都给你搞清楚(上—理论篇)
不管是不是搞数据分析的,相信应该都听过啤酒尿不湿的故事,说的是美国的沃尔玛超市管理人员分析销售数据时发现了一个令人难以理解的现象:"啤酒"与"尿布湿"这两件看上 ...
- 使用Apriori关联规则算法实现购物篮分析
Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,而且算法已经被广泛的应用到商业,网络安全等各个领域. 购物篮分析是通过发视频顾 ...
最新文章
- 这个GAN没见过猪,却能把狗变成猪
- 爱立信思科结盟背后:几家欢喜几家愁
- java 原生sql批量插入,Java对象集合转MySQL批量插入语句
- optXXX方法,optBoolean
- Work Queue based multi-threading
- lwip+freeRTOS 故障容错 客户端主动发起连接
- Transactional 事务
- [LUOGU] P2024 食物链
- Module-Zero之组织单元(OU)管理【新增】
- hadoop hdfs空间满后重新启动不了
- 计算机网络中采用最基本的多路复用技术是,2013年华南理工-计算机网络技术试题...
- 「前端早读君008」新手必踩坑之display: inline-block
- java中static代码块_java中静态代码块详解
- AMS1117-5.0-ASEMI低压差线性稳压IC详细解析
- 高数 | 华里士公式大全
- libmodbus 封装成dll_Windows Visual Studio 2017 编译 libmodbus
- qq空间留言板删除 php,QQ空间刷留言php代码
- 无法直接安装Ubuntu16.04的Win10系统安装教程
- 小白菜 docker 高级命令整理
- gitlab rpm包安装方法