数据分析方法(3)之AARRR模型
数据分析方法以往期数:
数据分析方法(1)之漏斗分析
AAARR模型所使用数据集和漏斗分析数据是一样的,两篇可以结合来看。
数据分析方法(2)之5W2H理论
文章目录
- 1、理论
- 1.1、定义
- 1.2、AARRR解释
- 1.2.1、Acquisition [获取]
- 1.2.2、Activation [激活]
- 1.2.3、Retention [存留]
- 1.2.4、Revenue [收益]
- 1.2.5、 Referral [传播]
- 二、AARRR模型python实战
- 2.1、 数据预处理
- 2.2、活跃度分析
- 2.3、复购率分析
- 2.3.1、用户购买次数直方图分布
- 2.3.2、复购率 = 购买次数大于1的用户数量/有购买行为的用户总数
1、理论
1.1、定义
AARRR模型因其掠夺式的增长方式也被称为海盗模型,核心就是AARRR漏斗模型,对应客户生命周期帮助大家更好地理解获客和维护客户的原理。
1.2、AARRR解释
- AARRR模型形成了一个闭环,即自己成为用户后,进行传播给好友,好友成为用户后,继续传播给好友的好友,以此成为指数增长趋势。
1.2.1、Acquisition [获取]
- app上线之后,最重要的就是用户了,没有用户,app很难获得收益,而且很有可能令app下线。通过各种推广渠道来获取新用户,并对获客渠道进行评估,看看哪个渠道获客量最大,以重视该渠道,减少获客成本(CAC)。
- 指标:日新增用户数、注册转化率分析(注册完是否消费了)
- 解决问题:渠道贡献率(哪个渠道获客少的就可以舍掉了),优化推广策略
1.2.2、Activation [激活]
- 很多用户可能是被动进入应用的(例如浏览网页时误点了,或者是app进入封面时的广告),如何把他们转化为活跃用户就是运营者的一大问题。此外还有些应用会通过良好的新手教程吸引用户(游戏app常见)。
- 指标:日活跃用户数(DAU)、月活跃用户数(MAU)、日均使用时长、用户每月访问app的平均天数(DAU\MAU )
- 解决问题:用户活跃率分析、活跃用户规模、一天中哪个时间段最活跃
1.2.3、Retention [存留]
- 活跃度解决后,就要研究用户的留存率了,有些用户来的快走的也快即每有用户粘性(留不住人)。很多应用确实并不清楚用户是在什么时间流失的,他们不断获取新用户,同时大量老用户又流失。而且获取新用户的获客成本要远远高于留住老客户。因此我们就要研究如何留住老用户。留存率时产品质量的重要标准。
- 指标:次日、三日、七日留存率(过了多久还剩下多少老用户);流失率;复购率等
- 解决问题:app质量评估、留存用户特征分析、流失用户分析
1.2.4、Revenue [收益]
- 获取收入才是运营最关心的一块了。收益来源也有很多,例如付费应用、应用内付费(游戏皮肤)、以及广告(微博封面推广)。无论是哪种都是源于用户,因此前面提到的获客,留存等非常重要,有用户才有钱挣。
- 指标:付费率(付费用户/活跃用户)、付费用户规模、用户人均收入、生命周期价值(用户从注册到不再使用app创造的平台收入)
- 解决问题:付费转化率效果评估、付费用户分析、获客渠道质量分析
1.2.5、 Referral [传播]
- 以前的运营模型到第四个层次就结束了,但是社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能非常好。(拼多多砍一刀、邀请新用户得钱)
- 指标:K因子,K=(每个用户向他的朋友们发出的邀请的数量)×(接收到邀请的人转化为新用户的转化率);
- K>1时,用户群就会像滚雪球一样增大,指数增长。
- K<1时,用户群到某个规模时就会停止通过自传播增长。
以上是AARRR模型的数据指标体系。建立完善的数据指标体系,我们后续才可以对用户行为进行更全面的分析。
二、AARRR模型python实战
2.1、 数据预处理
本数据集(来自天池)共有大约1200万条数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共6列字段,列字段分别是:
user_id:用户身份,脱敏
item_id:商品ID,脱敏
behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示)
user_geohash:地理位置
item_category:品类ID(商品所属的品类)
time:用户行为发生的时间
import pandas as pd
import numpy as np
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')data = pd.read_csv('E:/a学习材料/excel +sql++/双十二/tianchi_mobile_recommend_train_user.csv')
# 删除重复值
data.drop_duplicates(inplace=True)
# 重置索引
data = data.reset_index(drop=True)
# 将time列转为日期格式
data['time'] = pd.to_datetime(data['time'])
data['date'] = data['time'].dt.date
data['hour'] = data['time'].dt.hour
#将item_id和item_category转换成str
data['item_id'] = data['item_id'].astype(str)
data['item_category'] = data['item_category'].astype(str)
data.drop('time',axis=1,inplace=True)
data['date'] = pd.to_datetime(data['date'])
data.info()
data.head()
2.2、活跃度分析
day_act = pd.DataFrame()
day_act['日活'] = data.groupby('date')['user_id'].nunique()
plt.figure(figsize=(12,5))
plt.plot(day_act.index,day_act['日活'],c='r')
plt.xticks(pd.date_range('2014-11-18','2014-12-18',15))
plt.gcf().autofmt_xdate()
plt.show()
- 结论:在12月5日之前,活跃度在一定水平上波动。12月5日后,活跃度开始明显上升,并在双十二当天达到峰值。
- 可能原因:12月5日之后双十二预热活动开始,用户活跃度上升。
hour_act = pd.DataFrame()
hour_act['时活'] = data.groupby('hour')['user_id'].nunique()
plt.figure(figsize=(12,5))
plt.plot(hour_act.index,hour_act['时活'],c='r')
plt.xticks(np.arange(len(hour_act)),hour_act.index,size=13)
plt.gcf().autofmt_xdate()
plt.show()
- 结论:双十二当天0点和18点之后淘宝用户活跃度较高,凌晨4点活跃人数最低。
- 建议:商家可以在18点后设置优惠券或采取其他促销手段,吸引更多人消费,提高购买率。
2.3、复购率分析
2.3.1、用户购买次数直方图分布
user_buy_cnt = data[data['behavior_type']==4].groupby('user_id')['behavior_type'].count()
user_buy_cnt.plot(kind='box') # 从箱线图可以看出购买次数>100次的用户很少,因此画直方图只研究100次以内的用户
plt.figure(figsize=(12,5))
# 仅选取购买次数在100次以内的, 100次以外的用户太少; 将0—100划分为20个区间
plt.hist(user_buy_cnt[user_buy_cnt.values<100].values,bins=20)
plt.xticks(np.arange(0,100,5))
plt.show()
- 属于长尾分布,购买次数为0—5次的用户最多,其次就是5—20次,购买次数大于50次的人数很少。
2.3.2、复购率 = 购买次数大于1的用户数量/有购买行为的用户总数
# 选出购买过产品的用户,按照用户分组,计算购买次数
user_buy = data[data['behavior_type']==4].groupby('user_id')['behavior_type'].count()
user_more_buy = len(user_buy[user_buy.values>1])/len(user_buy)
user_more_buy # 0.9144 复购率=91.44% 11-18到12-18间的复购率挺高
参考:
用户分析 | 如何建立超详细的AARRR模型数据指标体系?
数据分析方法(3)之AARRR模型相关推荐
- 【数据分析框架】AARRR模型的数据指标体系
AARRR模型是运营里面一个非常有名的用户分析模型,也是一个典型的漏斗模型,前段时间工作上写的分析材料里面也提到了这个模型,这个模型也可以作为数据分析的框架,这里结合了网上的一些参考资料,总结了模 ...
- 数据分析方法中的杜邦分析法
我们在前面提到了5w2h方法,以及AARRR模型,5w2h就是5W2H分析法的内容,有7个单词组成,分别是What(用户要什么?)Why(为什么要?)Where(从哪儿得到?)When(我们什么时候做 ...
- 【数据分析】数据分析方法(七):AARRR 模型分析 漏斗分析
数据分析方法(七):AARRR 模型分析 & 漏斗分析 1. AARRR 模型分析方法 如果把产品看作一个鱼塘,使用产品的用户看作鱼塘里的鱼.AARRR 模型的五个环节可以描述如下. 获取用户 ...
- 数据分析方法-AARRR用户增长模型
AARRR模型因其掠夺式的增长方式也被称为海盗模型,<增长黑客>一书的核心思想就是AARRR漏斗模型. AARRR模型的核心要点主要是把控产品的整体收益情况,用户生命周期价值(LTV)远大 ...
- 数据分析常用五个方法三个模型(逻辑分析、多维度拆解、对比分析、假设验证、相关性分析、RFM模型、漏斗分析模型、AARRR模型)
目录 一.逻辑树分析法 二.多维度拆解分析法 三.对比分析法 四.假设检验法/归因分析法 五. 相关性分析法 六. RFM分析模型 七. 漏斗分析模型 八. AARRR模型 一.逻辑树分析法 定义:将 ...
- 运用AARRR模型对App进行系统性的数据分析
数据分析入门与实战 公众号: weic2c 从流量经济到粉丝经济 迄今为止,大多数公司只关注三件事:流量.用户.收入.他们关注的是通过大批流量的入口,招来大批用户,然后再带来大量收入,或者换言之,这 ...
- 36个数据分析方法与模型
目录 一.战略与组织 二.质量与生产 三.营销服务 四.财务管理 五.人力资源 六.互联网运营 好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型. 这样得出的结论不仅具备条理性 ...
- 【点赞收藏】36个顶级数据分析方法与模型!
来源:数据分析不是个事儿 好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型. 这样得出的结论不仅具备条理性和逻辑性,而且还更具备结构化和体系化,并保证分析结果的有效性和准确性. ...
- 数据分析方法-RFM用户价值分层模型
这是一个从交易数据反推用户价值的方法 RFM各项定义与影响现象 定义 R(recency):最近一次消费 F(frequency):一定时间内,消费频率 M(monetary):一定时间内,消费金额 ...
- 数据分析从0到1之AARRR模型 - Blog2
今天也要加油鸭- 这是一份总结的学习笔记 路漫漫其修远兮,吾将上下而求索 可阅读可评论可分享可转载,希望向优秀的人学习 1.什么是AARRR模型? AARRR增长漏斗模型分别对应用户生命周期中的5个重 ...
最新文章
- pytorch 学习笔记目录
- Shiro集成Web时的Shiro JSP标签
- 01_数据库连接池,数据源,ResultSetMetaData,jdbc优化
- why some product does not have Note assignment block
- Java编写基于netty的RPC框架
- 研究生从事学术研究的20条法则:导师错的时候不多!
- mysql主从不同步不报错_MySQL主从不同步解决
- [GO]append的扩容
- 结合Kubernetes解读微服务的12要素
- linux部署was找不到8879端口,WAS8.0与IHS集群安装与配置指导手册
- 学计算机拼音摇号,拼音真的很难教?要不要提前学?我们一起陪娃做好这些就够了!...
- 学习管理系统 LMS
- 服务器如何通过域共享文件夹,如何在域中共享文件夹
- CTeX:中英文混排无法正常换行+字体调整+行距调整
- BSC上匿名项目DCS 保护个人金融隐私不被侵犯
- cad快速选择命令快捷键_学好CAD必须掌握的20个常用快捷键命令
- 运行elevation_mapping流程记录
- Siri语音测试用例设计点
- ADI家的DSP和TI家的DSP有什么区别,我的一些不成熟的看法如下
- 【源码】iOS指纹解锁Touch ID的开发