基于游戏付费数据,对战数据分析
理解数据
本次测试集数据共828934条,109个字段
主要对于以下10个字段进行分析
字段 | 解释 |
---|---|
user_id | 玩家唯一id |
pay_price | 付费金额 |
rigister_time | 玩家注册时间 |
avg_online_minutes | 在线时长 |
pvp_battle_count | 玩家之间对战次数 |
pvp_lanch_count | 主动发起pvp次数 |
pvp_win_count | pvp胜利次数 |
pve_battle_count | 玩家-电脑之间的对战次数 |
pve_lanch_count | 玩家主动发起PVE次数 |
pve_win_count | pve胜利次数 |
主要从以下四个方面进行分析
- 新增玩家分析:玩家数量,付费玩家占比,每日新增
- 玩家活跃度分析:在线时长,分布特征
- 付费情况分析:PUR,ARPPU,ARPU等关键指标情况分析
- 游戏习惯分析:从PVP,PVE两个指标情况进行分析
数据分析
1.新增玩家分析
- 1.1新增玩家数量
SELECT count(DISTINCT user_id)
FROM tap_fun_test
- 1.2付费玩家数量
SELECT count(DISTINCT user_id) 新增付费玩家
FROM tap_fun_test
WHERE pay_price>0
- 1.3付费玩家占比
SELECT b.`新增付费玩家`/a.`新增玩家` AS 付费玩家占比
FROM
(SELECT count(DISTINCT user_id) 新增玩家
FROM tap_fun_test) a,
(SELECT count(DISTINCT user_id) 新增付费玩家
FROM tap_fun_test
WHERE pay_price>0)b
新增玩家共828394人,付费玩家有19549人,付费人数占注册总人数2.36%
- 1.4每日新增用户数量
SELECT date(register_time) as 日期,
count(DISTINCT user_id) as 当日新增玩家
FROM tap_fun_test
GROUP BY date(register_time)
- 1.5每日新增付费用户数量
SELECT date(register_time) as 日期,
count(DISTINCT user_id) as 当日新增付费玩家
FROM tap_fun_test
WHERE pay_price>0
GROUP BY date(register_time)
数据可视化:
由图可得:
每日新增玩家数在3.10日有一次大高峰增长,3.13一次小高峰增长,是由于两个时间点举办了游戏活动,但是游戏活动过了以后,后续注册量没有显著提升。
活动需要保持力度与一定时间维度,给玩家充分的时间去了解游戏。
2.玩家活跃度分析
- 2.1平均在线时长
SELECT AVG(avg_online_minutes)
FROM tap_fun_test
- 2.2付费玩家平均在线时长
SELECT AVG(avg_online_minutes)
FROM tap_fun_test
WHERE pay_price>0
明显得出:付费玩家平均在线时长远远大于全体玩家平均值
- 2.3平均在线时长分布特点
#求全部玩家四分位
SELECT ROUND(COUNT(DISTINCT user_id)/4) AS 下四分位数,
ROUND(COUNT(DISTINCT user_id)/2) AS 中位数,
ROUND(COUNT(DISTINCT user_id)/4*3) AS 上四分位数
FROM tap_fun_test
207234 414467 621701
#求全部玩家在线时长的关键值
SELECT MIN(avg_online_minutes+0) as 最小值,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 207234,1) AS 下四分位数,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 414467,1) AS 中位数,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 621701,1) AS 上四分位数,
MAX(avg_online_minutes+0) as 最大值
from tap_fun_test
0 0.5 1.666667 5.0 1605.833333
#付费玩家游戏时长四分位
SELECT ROUND(COUNT(DISTINCT user_id)/4) AS 下四分位数,
ROUND(COUNT(DISTINCT user_id)/2) AS 中位数,
ROUND(COUNT(DISTINCT user_id)/4*3) AS 上四分位数
FROM tap_fun_test
WHERE pay_price>0
4887 9775 14662
#付费玩家游戏时长关键值
SELECT MIN(avg_online_minutes+0) as 最小值,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 4887,1) AS 下四分位数,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 9775,1) AS 中位数,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 14667,1) AS 上四分位数,
MAX(avg_online_minutes+0) as 最大值
from tap_fun_test
WHERE pay_price>0
0.333333 30.666666999999997 84.666667 191.333333 1081.5
将数据可视化:
由图可得:
百分之75的玩家平均在线时长只有5分钟以内,可见玩家流失情况较严重。
付费玩家的在线时长下四分位数为30.6,所以可见百分之75以上的付费用户时长平均在线时长超过30分钟
3.玩家付费情况分析
关键指标:
AU:活跃用户 游戏时长>15分钟
PU:付费用户
APA:活跃付费用户数
ARPU:平均活跃用户收入
ARPPU:平均每个活跃付费用户收入
PUR:付费比率 APA/AU
3.1 ARPU 平均活跃玩家收入
SELECT COUNT(DISTINCT user_id) as 活跃玩家数量,
SUM(pay_price) as 活跃玩家总付费,
FORMAT(SUM(pay_price)/COUNT(DISTINCT user_id),2) as ARPU
FROM tap_fun_test
WHERE avg_online_minutes>=15
3.2 ARPPU 平均每个活跃付费玩家收入
SELECT COUNT(DISTINCT user_id) as 活跃付费玩家数量,
SUM(pay_price) as 活跃付费玩家总付费,
FORMAT(SUM(pay_price)/COUNT(DISTINCT user_id),2) as ARPPU
FROM tap_fun_test
WHERE avg_online_minutes>=15 AND pay_price>0
3.3 PUR:付费比率 APA/AU
SELECT COUNT(DISTINCT user_id) as APA,
(SELECT count(DISTINCT user_id)
FROM tap_fun_test
WHERE avg_online_minutes>=15) AS AU,
COUNT(DISTINCT user_id)/(SELECT count(DISTINCT user_id)
FROM tap_fun_test
WHERE avg_online_minutes>=15) AS PUR
FROM tap_fun_test
WHERE avg_online_minutes>=15 AND pay_price>0
将数据可视化:
由图可得:
1.该游戏人均付费率很低,游戏收入表现较差
2.但是根据第二张图,ARPPU是ARPU的六倍,说明玩家付费能力强,可以做一些付费的优化,让人民币玩家玩的开心愉快
4.玩家游戏习惯分析
4.1 AU玩家pvp情况
SELECT count(DISTINCT user_id) AS AU,
FORMAT(AVG(pvp_battle_count),1) AS AU人均pvp局数,
FORMAT(AVG(pvp_lanch_count),1) AS AU人均发起pvp局数,
FORMAT(SUM(pvp_lanch_count)/SUM(pvp_battle_count),2) AS AU主动发起概率,
FORMAT(SUM(pvp_win_count)/SUM(pvp_battle_count),2) AS AU胜利概率
FROM tap_fun_test
WHERE avg_online_minutes >=15
4.2 APA 的PVP情况
SELECT count(DISTINCT user_id) AS AU,
FORMAT(AVG(pvp_battle_count),1) AS AU人均pvp局数,
FORMAT(AVG(pvp_lanch_count),1) AS AU人均发起pvp局数,
FORMAT(SUM(pvp_lanch_count)/SUM(pvp_battle_count),2) AS AU主动发起概率,
FORMAT(SUM(pvp_win_count)/SUM(pvp_battle_count),2) AS AU胜利概率
FROM tap_fun_test
WHERE avg_online_minutes >=15
4.3 AU的PVE情况
SELECT count(DISTINCT user_id) AS AU,
FORMAT(AVG(pve_battle_count),1) AS AU人均pvp局数,
FORMAT(AVG(pve_lanch_count),1) AS AU人均发起pvp局数,
FORMAT(SUM(pve_lanch_count)/SUM(pve_battle_count),2) AS AU主动发起概率,
FORMAT(SUM(pve_win_count)/SUM(pve_battle_count),2) AS AU胜利概率
FROM tap_fun_test
WHERE avg_online_minutes >=15
4.4 APA的pve情况
SELECT count(DISTINCT user_id) AS AU,
FORMAT(AVG(pve_battle_count),1) AS AU人均pvp局数,
FORMAT(AVG(pve_lanch_count),1) AS AU人均发起pvp局数,
FORMAT(SUM(pve_lanch_count)/SUM(pve_battle_count),2) AS AU主动发起概率,
FORMAT(SUM(pve_win_count)/SUM(pve_battle_count),2) AS AU胜利概率
FROM tap_fun_test
WHERE avg_online_minutes >=15 AND pay_price>0
不同玩家pvp与pve次数对比
APA是AU的两倍左右,显然APA玩家愿意花费更多时间在游戏上
PVE中,两者发起与胜利概率基本持平,可见玩家均熟悉PVE规则,会主动打怪升级。打怪机制对于非人民币玩家也非常友好。
PVE中,APA更享受对战乐趣,也获胜几率更高。
结论
1.新增玩家分析:
- 新增玩家共828394人,付费玩家有19549人,付费人数占注册总人数2.36%
- 每日新增玩家数在3.10日有一次大高峰增长,3.13一次小高峰增长,是由于两个时间点举办了游戏活动,但是游戏活动过了以后,后续注册量没有显著提升。
- 活动需要保持力度与一定时间维度,给玩家充分的时间去了解游戏。
2.玩家活跃度分析:
- 全体玩家平均在线时长11.7分钟,付费玩家平均在线时长135.9分钟,付费玩家平均在线时长远远大于全体玩家平均值。
- 75%的玩家平均在线时长只有5分钟以内,可见玩家流失情况较严重。
- 付费玩家的在线时长下四分位数为30.6,所以可见75%以上的付费用户平均在线时长超过30分钟,说明付费用户确实更加愿意投入时间到该款游戏。
3.玩家付费情况分析:
- PUR为12%,建议开展优惠的首充活动提升付费率。加大渠道的权重,获得推荐位机会。
- ARPU为5.4元,该游戏人均付费率很低,游戏收入表现较差
- ARPPU是ARPU的六倍,说明玩家付费能力强,可以做一些付费的优化,让人民币玩家玩的开心愉快
4.玩家PVP,PVE情况分析:
- APA是AU的两倍左右,显然APA玩家愿意花费更多时间在游戏上
- PVE中,两者发起与胜利概率基本持平,可见玩家均熟悉PVE规则,会主动打怪升级。打怪机制对于非人民币玩家也非常友好。
- PVE中,APA更享受对战乐趣,也获胜几率更高。
基于游戏付费数据,对战数据分析相关推荐
- ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析.特征工程.科学预测等)的简介.流程.案例应用执行详细攻略 目录 数据科学的任务(数据分析.特征工程.科学 ...
- 数据分析与挖掘实战-基于基站定位数据的商圈分析
基于基站定位数据的商圈分析 背景 随着个人手机终端的普及,出行群体中手机拥有率和使用率已经达到相当高的比例,手机移动网络也基本上实现了城乡空间区域的全覆盖.根据手机信号在真实地理空间上的覆盖情况,将手 ...
- mysql数据生产数据分析_基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程...
基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程 课程目录 (1)SQL与数Ju分析;目录中文件数:23个 (1) 开课-课时3SQL与数Ju库的价值.flv (2) ...
- unity基于NetWork的局域网对战游戏制作
现在的游戏大体分为2种,要么就是单机游戏,要么就是联网游戏.像现在比较火的游戏,比如手机游戏王者荣耀,比如端游LOL,这些都是联网游戏.再比如求生之路系列,鬼泣系列,生化危机系列这些都是单机游戏.但是 ...
- 全国大学生大数据技能竞赛——基于Scala和Echart的大数据分析与挖掘
基于Scala和Echart的大数据分析与挖掘 题目三:大数据分析与挖掘案例 Spark基站统计分析 Scala语法基础 数据读取 1.读取文件数据 (1)按行读取 (2)按字符读取 2.写入数据 数 ...
- 往期直播:《驴妈妈,基于混合云的OTA行业数据分析、精准运营和大数据用户推荐》...
最新活动报名: 3月16日直播<空格技术架构云上实践与经验>:https://yq.aliyun.com/webinar/join/4 3月18日直播<爆款App小咖秀产品服务端架构 ...
- 航测大数据量处理_一种基于动态航测的图像大数据分析方法与流程
本发明涉及数据处理技术领域,具体为一种基于动态航测的图像大数据分析方法. 背景技术: 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的 ...
- 基于Python的海量豆瓣电影、数据获取、数据预处理、数据分析、可视化、大屏设计项目(含数据库)
目录 项目介绍 研究背景 国内外研究现状分析 研究目的 研究意义 研究总体设计 网络爬虫介绍 豆瓣电影数据的采集 数据预处理 大数据分析及可视化 豆瓣影评结构化分析 大屏可视化 文本可视化 总结 每文 ...
- 基于python的数据建模与分析案例_基于案例详解Python数据分析与机器学习
课程概述: 使用数据领域最主流语言Python及其分析与建模库作为核心武器.对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题. 课程特色: 通俗易 ...
最新文章
- 架构设计复杂度的6个来源
- python怎么画小海龟_Python 海龟 turtle 画图实战任务(一):让小海龟留下Z字形的足迹以及绘制一个小于号<...
- springmvc二: @RequestMapping
- 第二讲、Linux的系统安装
- DockerONE 干货 深入理解Docker容器和镜像
- 4K 海思 联咏 芯片_老电视也有春天,换装海美迪4K电视盒子H7 Plus
- brew卸载jenv_使用brew,cask和jenv在MacOSX上设置多个Java JRE / JDK
- 程序猿,该在一个公司呆多久?
- MySQL无中心化集群_MySQL Plus 如何做到无中心化、数据强一致性、秒级切换?
- labview 变量
- 计算机制说明书的实训报告,实训报告总结
- swift开发的小坑
- opencv自然背景下交通标志形状分类c++代码_前端革命时刻:前端代码是怎样智能生成的-图像分离篇
- python画50个图-python 实现在一张图中绘制一个小的子图方法
- eclipse启动mysql报错日志在哪儿_Eclipse启动报错,解决办法
- image加载图片 ui unity_【Unity游戏客户端框架搭建】四、资源管理之理论篇
- mysql 无法连接 native_php无法连接mysql8 mysql_native_password
- 网易新闻iOS版开发使用的第三方框架和组件列表
- UE4官方文档学习笔记材质篇——分层材质
- otool是mac自带的工具