【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性
问题背景
最近某个游戏内测,给到一批内测用户,并且将每位用户标记为RPG游戏用户,休闲游戏用户和卡牌游戏用户中的一种。期望分别统计出这几类用户的次日留存率,并观察是否有明显的区别,用于指导后续开展游戏运营活动。
这里记录使用卡方检验技术验证用户种类与次日行为的独立性,作为备忘。
统计结果
经过数据清理和统计,得到下面的结果
用户类型 |
注册日期 |
注册人数 |
次日留存用户 |
次日留存率 |
平均次日留存率 |
RPG |
day1 |
2,504 |
752 |
69.97% |
74.50% |
RPG |
day2 |
2,718 |
701 |
74.21% |
|
RPG |
day3 |
2,538 |
692 |
72.73% |
|
RPG |
day4 |
2,207 |
540 |
75.53% |
|
RPG |
day5 |
2,004 |
464 |
76.85% |
|
RPG |
day6 |
1,899 |
458 |
75.88% |
|
RPG |
day7 |
1,243 |
294 |
76.35% |
|
休闲 |
day1 |
2,983 |
925 |
68.99% |
73.45% |
休闲 |
day2 |
3,219 |
864 |
73.16% |
|
休闲 |
day3 |
3,067 |
863 |
71.86% |
|
休闲 |
day4 |
2,715 |
686 |
74.73% |
|
休闲 |
day5 |
2,442 |
607 |
75.14% |
|
休闲 |
day6 |
2,295 |
584 |
74.55% |
|
休闲 |
day7 |
1,523 |
370 |
75.71% |
|
卡牌 |
day1 |
2,102 |
675 |
67.89% |
73.04% |
卡牌 |
day2 |
2,198 |
584 |
73.43% |
|
卡牌 |
day3 |
1,908 |
542 |
71.59% |
|
卡牌 |
day4 |
1,643 |
422 |
74.32% |
|
卡牌 |
day5 |
1,454 |
372 |
74.42% |
|
卡牌 |
day6 |
1,382 |
370 |
73.23% |
|
卡牌 |
day7 |
883 |
208 |
76.44% |
‘
P.S.: 上面数据在不影响效果的基础上,进行过处理,并不代表真实的业务数据。
通过观察上面的数据,基本上可以判断不同类型游戏的次日留存率没有显著区别。但是,真的是这样吗?
卡方检验
可以通过卡方[1]检验来验证不同类别的游戏用户的流失和留存人数是否相互独立。
假设
原始假设H0:用户次日行为与用户类别相互独立。
备选假设Ha:用户次日行为与用户类别有相关性。
PS:次日行为指次日流失或留存,用户类别为RPG,休闲或卡片类
选择显著性水平α=1%
统计
在R中,通过卡方检验,可以得到如下统计结果
卡方值:9.36, p值[4]:0.9%
结论
由于P值=0.9%,小于显著性水平α=1%,所以可以拒绝原始假设H0,接受备选假设Ha,也就是用户的类别的确影响了用户的次日留存情况,并不是相互独立的。
这里下载统计代码和数据。
参考
[1] 卡方检验wiki
[2] 卡方检验实战
[3] 《深入浅出统计学/Head First Statistics》第十四章
[4] P值wiki
转载于:https://www.cnblogs.com/bourneli/p/3949474.html
【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性相关推荐
- 【Paddle 经验分享】利用PaddleHub 2.x 完成文本分类训练的坑
CSDN原文链接:https://blog.csdn.net/kinfey/article/details/117254781 基于项目选择了PaddlePaddle 作为文本分类的基础,经过一周多的 ...
- 【实战经验分享】一劳永逸的解决网线随意热插拔问题
[实战经验分享]一劳永逸的解决网线随意热插拔问题 参考文章: (1)[实战经验分享]一劳永逸的解决网线随意热插拔问题 (2)https://www.cnblogs.com/armfly/p/11818 ...
- 【线上直播】深度学习简介与落地实战经验分享
分享嘉宾: 嘉宾简介: 郑泽宇,知衣科技联合创始人兼CEO,美国Carnegie Mellon University(CMU)硕士,畅销书<TensorFlow:实战Google深度学习框架&g ...
- RabbitMQ实战经验分享
RabbitMQ实战经验分享 原文:RabbitMQ实战经验分享 前言 最近在忙一个高考项目,看着系统顺利完成了这次高考,终于可以松口气了.看到那些即将参加高考的学生,也想起当年高三的自己. 下面分享 ...
- Spring Cloud在云计算SaaS中的实战经验分享
摘要 云帐房CTO张英磊基于自己的个人经验,分享Spring Cloud在云计算SaaS中的实战经验,希望能为大家带来一些思路上的帮助. 内容来源:2017年5月6日,云帐房CTO张英磊在" ...
- MongoDB实战经验分享
2019独角兽企业重金招聘Python工程师标准>>> 转自: http://www.cnblogs.com/ymind/archive/2012/04/25/2470551.htm ...
- 银行数据仓库体系实践_【实战剖析】某国际性商业银行的数据仓库建设经验分享...
原标题:[实战剖析]某国际性商业银行的数据仓库建设经验分享 编者按 全面的信息体系架构,是支持商业银行战略决策.经营管理和风险控制的坚实基础.在中国科学院大学金融科技研究中心主任.吉贝克董事长刘世平博 ...
- “喜茶Go”微信小程序新零售商业实战案例经验分享-概述
作者介绍:郝天翔,10年移动互联网软件行业经验,全栈高级软件工程师,微信生态开发先行者,主要参与智慧城市新零售电商领域方案的设计与实施,本次分享商业案例"喜茶Go"已落地于全国多座 ...
- 基金知识汇总和实战经验分享
基金知识汇总和实战经验分享 分享一份基金知识给大家,同时分享下个人观点: 引用PMP项目风险管理的经验,无论是玩基金还是股票都要清晰明确的认识到自身的风险承受力,通俗一点就是你最多能接受你投入的本钱亏 ...
- IT实施计划实战经验分享:避免失败
我们在之前文章<IT实施计划实战经验分享:如何制定>中描述了如何针对企业新的业务项目制定高质量的IT实施计划,例如首先针对新应用的设计和发布开发成熟的模式和方法论来实施标准化的流程等等.本 ...
最新文章
- linux检查正则表达式,正则表达式及Linux文本检查工具
- 港府拟修例禁止电子烟入口及销售 保障市民健康
- 【PP生产订单】入门介绍(七)
- PURE DORM IS GREAT
- weka的java环境配置_Linux(ubuntu)环境下配置weka
- 【英语学习】【English L06】U03 House L5 Renting a House
- ES6——rest参数
- Redis和MongoDB通讯协议简介
- python分布式爬虫系统_python简单分布式爬虫
- Linux远程传输命令scp、rsync(tar打包归档并在系统之间传输文件)
- 白话空间统计之二十五:空间权重矩阵(四)R语言中的空间权重矩阵(1)
- linux下的经典软件总结
- winrar打包bat成exe并自动运行
- Web版SSH客戶端Sshwifty
- bootice添加linux_用BOOTICE工具在U盘上实现SYSLINUX与GRUB4DOS双启动 - 图文
- UI设计的色彩搭配及原则
- 文件误删除如何找回呢?四步妙招解决
- DDD领域驱动设计实战(六)-领域服务
- 奇妙的数学:蓝眼睛岛和强弱共识
- 自己动手编译最新Android源码及SDK(Ubuntu)
热门文章
- 浅谈URL生成方式的演变
- 对“最大子序列和问题”的一点思考
- linux 随机函数,Linux系统产生随机数方法
- (十一)洞悉linux下的Netfilteriptables:iptables命令行工具源码解析【上】
- G.711U在RTP中的展现
- L2-010 排座位 (25 分)
- H - Color the ball(树状数组)(区间更新)(求单点)(线段树)
- mysql 分区 range_Mysql分区|mysql分区表|mysql partition|by range
- 复制过去格式不一样_疫情过去后,打卡不一样的过山车
- sklearn pipeline_使用python+sklearn实现管道、Anova和SVM