互联网游戏-数据分析项目
理解数据
数据集共有82934条数据,109个字段,记录了一个游戏,玩家注册后一周的行为跟踪数据,主要针对以下10个字段进行相关分析。
注:数据来源于 DataFrog数据分析 https://space.bilibili.com/359939497
主要从以下四个方面进行:
- 新增玩家分析:从玩家数量、付费玩家占比、每日新增玩家数量等方面展开分析
- 玩家活跃度分析:从不同用户在线时长、分布等展开分析
- 玩家付费情况分析:从PUR、ARPPU、ARPU等指标展开
- 玩家游戏习惯分析:从玩家的pvp(人 vs 人)、pve(人 vs 机器)这两个指标情况进行分析。
数据分析
1.新增玩家分析
1.1 新增玩家数量
-- 此数据中,distinct 加不加都是一样的
select count(distinct user_id)as 新增玩家数量
from game_analyst;
#查看数据中user_id是否唯一性,即查询user_id>1是否存在
select user_id,count(1)
from game_analyst
group by user_id
having count(1)>1;
1.2 新增付费玩家数量
-- 新增付费玩家数量
select count(distinct user_id) as 新增付费玩家数量
from game_analyst
where pay_price>0;
好像数量并不高,再具体查看一下具体占比
1.3 付费玩家占比
-- 付费玩家占比
select a/b as 付费玩家占比
from
(select count(distinct user_id) as a
from game_analyst
where pay_price>0) as t1,(select count(distinct user_id)as b
from game_analyst) as t2;
通过上述查询可知,新增付费玩家数量是828934人,其中付费玩家有19549人,付费玩家人数占总注册人数的2.36%,付费人数占比略低。
1.4 每日新增玩家数量
select date(register_time) as 日期,
count(distinct user_id) as 当日新增玩家数量
from game_analyst
group by 日期;
1.5 每日新增付费玩家数量
select date(register_time) as 日期,
count(distinct user_id) as 当日新增付费玩家
from game_analyst
where pay_price>0
group by 日期;
数据可视化:
观察可知:
每日新增玩家在3月10日有一次高峰增长,在3月13日有一次小高峰增长,这是因为这两次时间点举办了游戏相关活动,但是活动过后,后续新玩家增长量并没有明显提升,因此这两次活动并没有给这款游戏带来实质性的帮助。所以活动还需要一定的推广力度以及保持一定的时间维度,时间段的话,玩家对于游戏还不够了解,应该给玩家充分了解游戏的时间,才有可能持续提高游戏的热度。
玩家活跃度分析
2.1 全部玩家平均在线时长
select avg(avg_online_minutes) as 玩家平均在线时长
from game_analyst;
2.2 付费玩家平均在线时长
select avg(avg_online_minutes) as 付费玩家平均在线时长
from game_analyst
where pay_price>0;
观察可发现,付费玩家平均在线时长远大于全部玩家平均在线时长,活跃度要高很多。
平均在线时长的分布特点
使用箱线图分析总体特征,求最大值、最小值、中位数和上下四分位数
-- 全部玩家人数的下四分位数、中位数、上四分位数
select round (count(distinct user_id)/4) as 下四分位数,
round (count(distinct user_id)/2) as 中位数,
round (count(distinct user_id)/4*3) as 上四分位数
from game_analyst;
-- 全部玩家在线时长箱线图关键值
select min(avg_online_minutes) as 最小值,
( select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 207233,1) as 下四分位数,
( select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 414466,1)as 中位数,
( select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 621700,1)as 上四分位数,max(avg_online_minutes)as 最大值from game_analyst;
-- 付费玩家人数的四分位数,中位数,上四分位数
select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2)as 中位数,
round(count(distinct user_id)/4*3)as 上四分位数
from game_analyst
where pay_price>0;
-- 付费玩家在线时长箱线图
select min(avg_online_minutes) as 最小值,
( select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 4886,1) as 下四分位数,
( select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 9774,1)as 中位数,
( select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 14661,1)as 上四分位数,max(avg_online_minutes)as 最大值from game_analystwhere pay_price >0;
全部玩家与付费玩家在线时长箱线图:
根据以上数据和图标可得出以下结论:
全部玩家的在线时长箱线图向下压缩的很厉害,全部玩家在线时长上四分位数为1,75%的玩家平均在线时长只有大约1分钟,可见玩家流失的情况还是比较严重的。
付费用户的在线时长箱线图中,下四分位数为3,中位数为85,上四分位数191,也就是说,付费用户中,75%以上的用户在线时长都超过了30分钟。
3. 玩家付费情况分析
关键指标
AU:(Active Users):活跃用户,这里定为游戏时间长达15分钟的为活跃用户
PU(Paying User):付费用户
APA(Active Payment Account):活跃付费用户数
ARPU(Average Revenue Per User):平均每个活跃用户的收入,即可通过总收入/APA计算得出
ARPPU(Average Revenue Per Paying User):平均每个活跃付费用户收入,可通过总收入/APA计算得出
PUR(Pay User Rate):付费比率,可通过APA/AU计算得出
3.1 每个活跃玩家的收入
-- ARPU=总收入/AU
select count(distinct user_id)as AU,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPU
from game_analyst
where avg_online_minutes>=15;
3.2 每个活跃付费玩家收入
-- ARPPU=总收入/APA
select count(distinct user_id)as APA,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPPU
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
3.3 付费率
-- PUR = APA/AU
select count(distinct user_id) as APA,
(select count(distinct user_id)
from game_analyst
where avg_online_minutes>=15)as AU,
count(distinct user_id)/(select count(distinct user_id)
from game_analyst
where avg_online_minutes>0)as PUR
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
对数据进行可视化:
该游戏人均付费率ARPU很低,说明游戏的收入较差,但对比ARPU,平均每个付费用户收入ARPPU很高,是ARPU的6倍多,那就说明收费玩家的付费能力很强,针对这一点,我们可以做一些付费功能调整和优化,甚至专属大R玩家,让大R玩的更开心。
付费率只有可怜的2.7%,其实只要简单的开展一个首充活动,比如:充1元可获得价值60元的大礼包,就能够很好地提高游戏的付费率了。付费率高,一样可以得到渠道青睐,获得更多推荐展示机会(行业俗称为“吸量”),间接提高游戏的热度。
注:大R,可理解为家里有矿的人,游戏的充值金额很大。每个游戏都有等级划分的制度,共有以下五种:废户、普通用户、VIP用户、SVIP用户、大R用户
4. 玩家游戏习惯分析
关键指标
PVP(Player VS Player):玩家之间的游戏对决,就是玩家与对立阵营,派别之间的玩家发生的战斗。通过完成击杀其他玩家获得荣誉,装备道具等。
PVE(Player VS Environment):玩家与电脑之间的对决,即打怪、打副本等。
4.1 AU玩家的PVP情况
select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15;
4.2 APA玩家的PVP情况
select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
4.3 AU玩家的PVE情况
select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15;
select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;
将数据可视化:
从上图可以看出,APA玩家的平均PVE和PVP次数都要高于AU玩家两倍左右,显然APA玩家更愿意花费更多的时间在这个游戏上。
在PVE活动中,APA玩家主动发起进攻的概率和胜利的概率与AU玩家基本持平,其中主动发起PVE的概率非常高,可见游戏玩家还是比较熟悉游戏规则,基本上能主动刷副本打怪获取资源或者等级的提升。另外游戏的PVE难度也不高,玩家的PVE胜率高达90%,可见游戏体验较为友好。
结论
1. 新增用户分析
- 新增玩家有828934人,其中付费玩家有19549人,付费人数占注册总人数的2.36%。
- 每日新增玩家在3月10日有一次大高峰增长,在3月13日有一次小高峰增长,推断可能是举办了游戏活动,但是活动一过,后续新用户注册量并没有显著提升,可见这两次活动并没有给游戏带来实质性帮助。
- 在这两次举办的活动期间,每日新增付费用户并没有提升,反而趋于下降,可见这两次游戏可能是为了提升游戏的热度。
- 建议加大活动力度,并保持一定的时间维度,给玩家充分了解游戏的时间,才能持续提高游戏热度。
2. 玩家游戏活跃度
- 全部玩家平均在线时长11.74分钟,付费玩家平均在线时长135.87分钟,付费玩家的平均在线时长要远远大于全体玩家的平均时长,活跃度比他们大得多。
- 75%的玩家平均在线时长不超过1分钟,可见玩家流失的情况还是比较严重的。
- 付费用户中,75%以上的用户在线时长都超过了30分钟,说明付费用户更愿意投入时间到该款游戏中。
3. 玩家付费情况分析
- 付费率PUR比较低,只有2.7%,其中只要简单的开展一个首充活动,比如充1元可获得60元的大礼包,就能很好地提高游戏的付费率了。付费率高,一样可以得到渠道青睐,获得更多推荐展示机会(行业俗称“吸量”),间接提高游戏热度。
- 怒气按较好的手游每日ARPU超过5元;一般的手游ARPU在3元-5元之间;ARPU低于3元则说明表现较差,但是平均每付费用户收入ARPPU很高,说明大R的付费能力强,针对这一点,我们可以做一些付费功能的调整和优化,甚至专属大R的克服,让付费用户玩的更开心。
4. 付费玩家习惯分析
- APA玩家的平均PVE和PVP次数都要高于AU玩家两倍,显然APA玩家更愿意花费更多的时间在这个游戏上。
- 在PVP活动中,APA玩家主动发起进攻的概率和胜利的概率要明显高于AU玩家,在享受游戏对战乐趣的过程中,往往更能够收获胜利。
- 在PVE活动中,APA 玩家主动发起进攻的概率和胜利的概率与AU玩家基本持平,其中主动发起PVE的概率非常高,可见游戏玩家还是比较熟悉游戏规则,基本能主动刷副本打怪获取装备资源或者等级的提升。
- 游戏的PVE难度也不高,玩家的PVE胜率高达90%,可见游戏体验较为友好。
互联网游戏-数据分析项目相关推荐
- 未明学院:两大互联网热门实战项目 | 掌握数据分析核心技能,互联网热门岗位不再遥远!
近年来,随着移动互联网.互联网+的兴起,互联网行业保持持续快速增长,互联网已经取代外企.金融等行业,成为应届生找工作的首选. 在教育部<2018年中国毕业生就业报告>的统计中,互联网行业的 ...
- 基于Flink+ClickHouse构建实时游戏数据分析最佳实践
简介:本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算.云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务. 直达 ...
- 亚马逊云科技依托人工智能进行游戏数据分析,解决游戏行业痛点,助力游戏增长
前言 据互联网数据显示:2014 年我国游戏行业用户规模为 517.31 百万人,直至 2020 年达 554.79 百万人:同时,2020 年,我国游戏市场实际销售收入 2786.87 亿元,比 2 ...
- 算法与实战 - (3) 常见数据分析项目类型
文章目录 1. 用户特征分析(用户分层) 2. 活跃度定义(指标定义) 3. 路径分析与漏斗分析 4. 交叉销售模型 5. 商品推荐模型 6. 信用风险模型 7. 客户预测模型 Reference 本 ...
- 《R语言游戏数据分析与挖掘》一导读
前 言 为什么要写这本书 随着大数据的概念越来越流行,越来越多的企业开始重视数据,期待从数据中寻找有价值的结论,以指导公司管理层决策,最终创造更大的价值.但是在游戏行业,数据分析的发展相对缓慢,很多游 ...
- 如何做一个优秀的数据分析项目?
上一篇我们普及了[数据分析项目,是什么?为什么我没做过?].今天我们系统讲解一下:如何做一个优秀的数据分析项目.首先大家要明白,并不是所有的项目,都需要找一个万人大会堂,拉着横幅,董事长总经理轮流上台 ...
- 如何通过网络数据的获取,做出这些数据分析项目?
作者 | AlfredWu 来源 | Alfred数据室 最近有很多人在问,我是如何收集网络的数据,如何进行数据处理.数据分析以及可视化呈现的. 也有人问的更具体,关于Python数据分析的一些问题. ...
- 1【源码】数据可视化:基于 Echarts +Java SpringBoot 实现的动态实时大屏范例-互联网企业数据分析
目录 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 需求确认 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.开发环境搭建 1.Java开发环 ...
- 《游戏数据分析的艺术》读书笔记1
第一章 1. 了解游戏数据分析 1. 1游戏数据分析的概念 今天的游戏数据分析算一个方向,还不算一个专业领域 对很多游戏设计者来说,游戏是艺术品,是艺术灵感的产出物,因此并不认同通过数据分析来挖掘用户 ...
最新文章
- 7篇必读ACM MM 2019论文:图神经网络+多媒体
- Git远程库版本回滚
- 这年头,好文案都被它承包了!
- 使用cmake安装mysql5.5.13
- java集合框架介绍_Java集合框架介绍
- Sybase identity 字段
- junit 测试 dao_JUnit测试Spring Service和DAO(带有内存数据库)
- 求大佬帮Ansys三维地质体建模
- selenium autoit java_selenium借助AutoIt识别上传文件Java篇
- vsftpd创建本地yum仓库如何放在有账户密码验证上
- Android WindowManager实现悬浮窗效果 (一)——与当前Activity绑定
- poj 1833 排列
- 解决Apex英雄下载慢、origin平台下载打开的究极3种方法
- libyuv 再次封装打包与测试
- c++聊天机器人——简单版
- 近期14个“AI产品经理”职位JD推荐(覆盖北京、上海、深圳、成都、重庆、杭州)
- 第二步:创建html模板及文件目录等
- JAVA-CPU飙高问题排查
- .py文件图标为白纸以及右键没有Edit with IDLE的解决办法
- 3.4.3 Electric Fence电网 USACO(毕克定理) USACO
热门文章
- 我的 2019 总结
- 明星项目方生死战:战局巅峰比拼的是人心
- 利用计算机教学的体会,利用多媒体教学设备心得体会
- 安科瑞智能照明控制系统在某办公楼上的应用——安科瑞潘芹
- 三级网络技术第三题总结
- 《Automated Spatial Calibration of HMD Systems with Unconstrained Eye-cameras》论文阅读
- 如果介绍自己做的项目
- HPC 网络技术 — Overview
- NX二次开发-创建图纸尺寸表达式抑制UF_DRF_add_controlling_exp
- Python 准确获取今天是星期几的代码(isoweekday和weekday)