数据分析方法以往期数:

数据分析方法(1)之漏斗分析
AAARR模型所使用数据集和漏斗分析数据是一样的,两篇可以结合来看。

数据分析方法(2)之5W2H理论

文章目录

  • 1、理论
    • 1.1、定义
    • 1.2、AARRR解释
      • 1.2.1、Acquisition [获取]
      • 1.2.2、Activation [激活]
      • 1.2.3、Retention [存留]
      • 1.2.4、Revenue [收益]
      • 1.2.5、 Referral [传播]
  • 二、AARRR模型python实战
    • 2.1、 数据预处理
    • 2.2、活跃度分析
    • 2.3、复购率分析
      • 2.3.1、用户购买次数直方图分布
      • 2.3.2、复购率 = 购买次数大于1的用户数量/有购买行为的用户总数

1、理论

1.1、定义

AARRR模型因其掠夺式的增长方式也被称为海盗模型,核心就是AARRR漏斗模型,对应客户生命周期帮助大家更好地理解获客和维护客户的原理。

1.2、AARRR解释

  • AARRR模型形成了一个闭环,即自己成为用户后,进行传播给好友,好友成为用户后,继续传播给好友的好友,以此成为指数增长趋势。

1.2.1、Acquisition [获取]

  • app上线之后,最重要的就是用户了,没有用户,app很难获得收益,而且很有可能令app下线。通过各种推广渠道来获取新用户,并对获客渠道进行评估,看看哪个渠道获客量最大,以重视该渠道,减少获客成本(CAC)。
  • 指标:日新增用户数、注册转化率分析(注册完是否消费了)
  • 解决问题:渠道贡献率(哪个渠道获客少的就可以舍掉了),优化推广策略

1.2.2、Activation [激活]

  • 很多用户可能是被动进入应用的(例如浏览网页时误点了,或者是app进入封面时的广告),如何把他们转化为活跃用户就是运营者的一大问题。此外还有些应用会通过良好的新手教程吸引用户(游戏app常见)。
  • 指标:日活跃用户数(DAU)、月活跃用户数(MAU)、日均使用时长、用户每月访问app的平均天数(DAU\MAU )
  • 解决问题:用户活跃率分析、活跃用户规模、一天中哪个时间段最活跃

1.2.3、Retention [存留]

  • 活跃度解决后,就要研究用户的留存率了,有些用户来的快走的也快即每有用户粘性(留不住人)。很多应用确实并不清楚用户是在什么时间流失的,他们不断获取新用户,同时大量老用户又流失。而且获取新用户的获客成本要远远高于留住老客户。因此我们就要研究如何留住老用户。留存率时产品质量的重要标准。
  • 指标:次日、三日、七日留存率(过了多久还剩下多少老用户);流失率;复购率等
  • 解决问题:app质量评估、留存用户特征分析、流失用户分析

1.2.4、Revenue [收益]

  • 获取收入才是运营最关心的一块了。收益来源也有很多,例如付费应用、应用内付费(游戏皮肤)、以及广告(微博封面推广)。无论是哪种都是源于用户,因此前面提到的获客,留存等非常重要,有用户才有钱挣。
  • 指标:付费率(付费用户/活跃用户)、付费用户规模、用户人均收入、生命周期价值(用户从注册到不再使用app创造的平台收入)
  • 解决问题:付费转化率效果评估、付费用户分析、获客渠道质量分析

1.2.5、 Referral [传播]

  • 以前的运营模型到第四个层次就结束了,但是社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能非常好。(拼多多砍一刀、邀请新用户得钱)
  • 指标:K因子,K=(每个用户向他的朋友们发出的邀请的数量)×(接收到邀请的人转化为新用户的转化率);
    • K>1时,用户群就会像滚雪球一样增大,指数增长。
    • K<1时,用户群到某个规模时就会停止通过自传播增长。

以上是AARRR模型的数据指标体系。建立完善的数据指标体系,我们后续才可以对用户行为进行更全面的分析。

二、AARRR模型python实战

2.1、 数据预处理

本数据集(来自天池)共有大约1200万条数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共6列字段,列字段分别是:
user_id:用户身份,脱敏
item_id:商品ID,脱敏
behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示)
user_geohash:地理位置
item_category:品类ID(商品所属的品类)
time:用户行为发生的时间
import pandas as pd
import numpy as np
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')data = pd.read_csv('E:/a学习材料/excel +sql++/双十二/tianchi_mobile_recommend_train_user.csv')
# 删除重复值
data.drop_duplicates(inplace=True)
# 重置索引
data = data.reset_index(drop=True)
# 将time列转为日期格式
data['time'] = pd.to_datetime(data['time'])
data['date'] = data['time'].dt.date
data['hour'] = data['time'].dt.hour
#将item_id和item_category转换成str
data['item_id'] = data['item_id'].astype(str)
data['item_category'] = data['item_category'].astype(str)
data.drop('time',axis=1,inplace=True)
data['date'] = pd.to_datetime(data['date'])
data.info()
data.head()


2.2、活跃度分析

day_act = pd.DataFrame()
day_act['日活'] = data.groupby('date')['user_id'].nunique()
plt.figure(figsize=(12,5))
plt.plot(day_act.index,day_act['日活'],c='r')
plt.xticks(pd.date_range('2014-11-18','2014-12-18',15))
plt.gcf().autofmt_xdate()
plt.show()

  • 结论:在12月5日之前,活跃度在一定水平上波动。12月5日后,活跃度开始明显上升,并在双十二当天达到峰值。
  • 可能原因:12月5日之后双十二预热活动开始,用户活跃度上升。
hour_act = pd.DataFrame()
hour_act['时活'] = data.groupby('hour')['user_id'].nunique()
plt.figure(figsize=(12,5))
plt.plot(hour_act.index,hour_act['时活'],c='r')
plt.xticks(np.arange(len(hour_act)),hour_act.index,size=13)
plt.gcf().autofmt_xdate()
plt.show()

  • 结论:双十二当天0点和18点之后淘宝用户活跃度较高,凌晨4点活跃人数最低。
  • 建议:商家可以在18点后设置优惠券或采取其他促销手段,吸引更多人消费,提高购买率。

2.3、复购率分析

2.3.1、用户购买次数直方图分布

user_buy_cnt = data[data['behavior_type']==4].groupby('user_id')['behavior_type'].count()
user_buy_cnt.plot(kind='box') # 从箱线图可以看出购买次数>100次的用户很少,因此画直方图只研究100次以内的用户

plt.figure(figsize=(12,5))
# 仅选取购买次数在100次以内的, 100次以外的用户太少; 将0—100划分为20个区间
plt.hist(user_buy_cnt[user_buy_cnt.values<100].values,bins=20)
plt.xticks(np.arange(0,100,5))
plt.show()

  • 属于长尾分布,购买次数为0—5次的用户最多,其次就是5—20次,购买次数大于50次的人数很少。

2.3.2、复购率 = 购买次数大于1的用户数量/有购买行为的用户总数

# 选出购买过产品的用户,按照用户分组,计算购买次数
user_buy = data[data['behavior_type']==4].groupby('user_id')['behavior_type'].count()
user_more_buy = len(user_buy[user_buy.values>1])/len(user_buy)
user_more_buy  # 0.9144  复购率=91.44% 11-18到12-18间的复购率挺高

参考:
用户分析 | 如何建立超详细的AARRR模型数据指标体系?

数据分析方法(3)之AARRR模型相关推荐

  1. 【数据分析框架】AARRR模型的数据指标体系

      AARRR模型是运营里面一个非常有名的用户分析模型,也是一个典型的漏斗模型,前段时间工作上写的分析材料里面也提到了这个模型,这个模型也可以作为数据分析的框架,这里结合了网上的一些参考资料,总结了模 ...

  2. 数据分析方法中的杜邦分析法

    我们在前面提到了5w2h方法,以及AARRR模型,5w2h就是5W2H分析法的内容,有7个单词组成,分别是What(用户要什么?)Why(为什么要?)Where(从哪儿得到?)When(我们什么时候做 ...

  3. 【数据分析】数据分析方法(七):AARRR 模型分析 漏斗分析

    数据分析方法(七):AARRR 模型分析 & 漏斗分析 1. AARRR 模型分析方法 如果把产品看作一个鱼塘,使用产品的用户看作鱼塘里的鱼.AARRR 模型的五个环节可以描述如下. 获取用户 ...

  4. 数据分析方法-AARRR用户增长模型

    AARRR模型因其掠夺式的增长方式也被称为海盗模型,<增长黑客>一书的核心思想就是AARRR漏斗模型. AARRR模型的核心要点主要是把控产品的整体收益情况,用户生命周期价值(LTV)远大 ...

  5. 数据分析常用五个方法三个模型(逻辑分析、多维度拆解、对比分析、假设验证、相关性分析、RFM模型、漏斗分析模型、AARRR模型)

    目录 一.逻辑树分析法 二.多维度拆解分析法 三.对比分析法 四.假设检验法/归因分析法 五. 相关性分析法 六. RFM分析模型 七. 漏斗分析模型 八. AARRR模型 一.逻辑树分析法 定义:将 ...

  6. 运用AARRR模型对App进行系统性的数据分析

    数据分析入门与实战  公众号: weic2c 从流量经济到粉丝经济 迄今为止,大多数公司只关注三件事:流量.用户.收入.他们关注的是通过大批流量的入口,招来大批用户,然后再带来大量收入,或者换言之,这 ...

  7. 36个数据分析方法与模型

    目录 一.战略与组织 二.质量与生产 三.营销服务 四.财务管理 五.人力资源 六.互联网运营 好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型. 这样得出的结论不仅具备条理性 ...

  8. 【点赞收藏】36个顶级数据分析方法与模型!

    来源:数据分析不是个事儿 好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型. 这样得出的结论不仅具备条理性和逻辑性,而且还更具备结构化和体系化,并保证分析结果的有效性和准确性. ...

  9. 数据分析方法-RFM用户价值分层模型

    这是一个从交易数据反推用户价值的方法 RFM各项定义与影响现象 定义 R(recency):最近一次消费 F(frequency):一定时间内,消费频率 M(monetary):一定时间内,消费金额 ...

  10. 数据分析从0到1之AARRR模型 - Blog2

    今天也要加油鸭- 这是一份总结的学习笔记 路漫漫其修远兮,吾将上下而求索 可阅读可评论可分享可转载,希望向优秀的人学习 1.什么是AARRR模型? AARRR增长漏斗模型分别对应用户生命周期中的5个重 ...

最新文章

  1. pytorch 学习笔记目录
  2. Shiro集成Web时的Shiro JSP标签
  3. 01_数据库连接池,数据源,ResultSetMetaData,jdbc优化
  4. why some product does not have Note assignment block
  5. Java编写基于netty的RPC框架
  6. 研究生从事学术研究的20条法则:导师错的时候不多!
  7. mysql主从不同步不报错_MySQL主从不同步解决
  8. [GO]append的扩容
  9. 结合Kubernetes解读微服务的12要素
  10. linux部署was找不到8879端口,WAS8.0与IHS集群安装与配置指导手册
  11. 学计算机拼音摇号,拼音真的很难教?要不要提前学?我们一起陪娃做好这些就够了!...
  12. 学习管理系统 LMS
  13. 服务器如何通过域共享文件夹,如何在域中共享文件夹
  14. CTeX:中英文混排无法正常换行+字体调整+行距调整
  15. BSC上匿名项目DCS 保护个人金融隐私不被侵犯
  16. cad快速选择命令快捷键_学好CAD必须掌握的20个常用快捷键命令
  17. 运行elevation_mapping流程记录
  18. Siri语音测试用例设计点
  19. ADI家的DSP和TI家的DSP有什么区别,我的一些不成熟的看法如下
  20. 【源码】iOS指纹解锁Touch ID的开发

热门文章

  1. cython使用说明
  2. 关于Node.js中内存管理的思考与实践
  3. python 自动登录网站_Python使用selenium实现网页用户名 密码 验证码自动登录功能...
  4. 【Transformer】李沐论文逐段精读学习笔记
  5. requirement生成和使用
  6. 企业邮箱怎么弄企业邮箱是什么邮箱求一个企业邮箱账号
  7. 论站长赚钱之七剑下天山
  8. 【记坑】大白菜或老毛桃制作U盘后BIOS找不到系统
  9. 数字图像处理Project1——指纹图片的增强
  10. 分布式事务中的时间戳详解