理解数据

数据集共有82934条数据,109个字段,记录了一个游戏,玩家注册后一周的行为跟踪数据,主要针对以下10个字段进行相关分析。
注:数据来源于 DataFrog数据分析 https://space.bilibili.com/359939497

主要从以下四个方面进行:

  • 新增玩家分析:从玩家数量、付费玩家占比、每日新增玩家数量等方面展开分析
  • 玩家活跃度分析:从不同用户在线时长、分布等展开分析
  • 玩家付费情况分析:从PUR、ARPPU、ARPU等指标展开
  • 玩家游戏习惯分析:从玩家的pvp(人 vs 人)、pve(人 vs 机器)这两个指标情况进行分析。

数据分析

1.新增玩家分析

1.1 新增玩家数量

-- 此数据中,distinct 加不加都是一样的
select count(distinct user_id)as 新增玩家数量
from game_analyst;


#查看数据中user_id是否唯一性,即查询user_id>1是否存在

select user_id,count(1)
from game_analyst
group by user_id
having count(1)>1;

1.2 新增付费玩家数量

-- 新增付费玩家数量
select count(distinct user_id) as 新增付费玩家数量
from game_analyst
where pay_price>0;


好像数量并不高,再具体查看一下具体占比

1.3 付费玩家占比

-- 付费玩家占比
select a/b  as 付费玩家占比
from
(select count(distinct user_id) as a
from game_analyst
where pay_price>0) as t1,(select count(distinct user_id)as b
from game_analyst) as t2;


通过上述查询可知,新增付费玩家数量是828934人,其中付费玩家有19549人,付费玩家人数占总注册人数的2.36%,付费人数占比略低。

1.4 每日新增玩家数量

select date(register_time) as 日期,
count(distinct user_id) as 当日新增玩家数量
from game_analyst
group by 日期;

1.5 每日新增付费玩家数量

select date(register_time) as 日期,
count(distinct user_id) as 当日新增付费玩家
from game_analyst
where pay_price>0
group by 日期;


数据可视化:

观察可知:
每日新增玩家在3月10日有一次高峰增长,在3月13日有一次小高峰增长,这是因为这两次时间点举办了游戏相关活动,但是活动过后,后续新玩家增长量并没有明显提升,因此这两次活动并没有给这款游戏带来实质性的帮助。所以活动还需要一定的推广力度以及保持一定的时间维度,时间段的话,玩家对于游戏还不够了解,应该给玩家充分了解游戏的时间,才有可能持续提高游戏的热度。

玩家活跃度分析

2.1 全部玩家平均在线时长

select avg(avg_online_minutes) as 玩家平均在线时长
from game_analyst;

2.2 付费玩家平均在线时长

select avg(avg_online_minutes) as 付费玩家平均在线时长
from game_analyst
where pay_price>0;


观察可发现,付费玩家平均在线时长远大于全部玩家平均在线时长,活跃度要高很多。

平均在线时长的分布特点

使用箱线图分析总体特征,求最大值、最小值、中位数和上下四分位数

-- 全部玩家人数的下四分位数、中位数、上四分位数
select round (count(distinct user_id)/4) as 下四分位数,
round (count(distinct user_id)/2) as 中位数,
round (count(distinct user_id)/4*3) as 上四分位数
from game_analyst;

-- 全部玩家在线时长箱线图关键值
select min(avg_online_minutes) as 最小值,
(   select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 207233,1) as 下四分位数,
(   select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 414466,1)as 中位数,
(   select avg_online_minutesfrom game_analystorder by avg_online_minuteslimit 621700,1)as 上四分位数,max(avg_online_minutes)as 最大值from game_analyst;

-- 付费玩家人数的四分位数,中位数,上四分位数
select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2)as 中位数,
round(count(distinct user_id)/4*3)as 上四分位数
from game_analyst
where pay_price>0;

-- 付费玩家在线时长箱线图
select min(avg_online_minutes) as 最小值,
(   select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 4886,1) as 下四分位数,
(   select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 9774,1)as 中位数,
(   select avg_online_minutesfrom game_analystwhere pay_price>0order by avg_online_minuteslimit 14661,1)as 上四分位数,max(avg_online_minutes)as 最大值from game_analystwhere pay_price >0;


全部玩家与付费玩家在线时长箱线图:

根据以上数据和图标可得出以下结论:
全部玩家的在线时长箱线图向下压缩的很厉害,全部玩家在线时长上四分位数为1,75%的玩家平均在线时长只有大约1分钟,可见玩家流失的情况还是比较严重的。
付费用户的在线时长箱线图中,下四分位数为3,中位数为85,上四分位数191,也就是说,付费用户中,75%以上的用户在线时长都超过了30分钟。

3. 玩家付费情况分析

关键指标

AU:(Active Users):活跃用户,这里定为游戏时间长达15分钟的为活跃用户
PU(Paying User):付费用户
APA(Active Payment Account):活跃付费用户数
ARPU(Average Revenue Per User):平均每个活跃用户的收入,即可通过总收入/APA计算得出
ARPPU(Average Revenue Per Paying User):平均每个活跃付费用户收入,可通过总收入/APA计算得出
PUR(Pay User Rate):付费比率,可通过APA/AU计算得出

3.1 每个活跃玩家的收入

-- ARPU=总收入/AU
select count(distinct user_id)as AU,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPU
from game_analyst
where avg_online_minutes>=15;

3.2 每个活跃付费玩家收入

-- ARPPU=总收入/APA
select count(distinct user_id)as APA,
(select sum(pay_price) from game_analyst)as 总收入,
(select sum(pay_price) from game_analyst)/count(distinct user_id)as ARPPU
from game_analyst
where avg_online_minutes>=15
and pay_price>0;

3.3 付费率

-- PUR = APA/AU
select count(distinct user_id) as APA,
(select count(distinct user_id)
from game_analyst
where avg_online_minutes>=15)as AU,
count(distinct user_id)/(select count(distinct user_id)
from game_analyst
where avg_online_minutes>0)as PUR
from game_analyst
where avg_online_minutes>=15
and pay_price>0;


对数据进行可视化:


该游戏人均付费率ARPU很低,说明游戏的收入较差,但对比ARPU,平均每个付费用户收入ARPPU很高,是ARPU的6倍多,那就说明收费玩家的付费能力很强,针对这一点,我们可以做一些付费功能调整和优化,甚至专属大R玩家,让大R玩的更开心。
付费率只有可怜的2.7%,其实只要简单的开展一个首充活动,比如:充1元可获得价值60元的大礼包,就能够很好地提高游戏的付费率了。付费率高,一样可以得到渠道青睐,获得更多推荐展示机会(行业俗称为“吸量”),间接提高游戏的热度。

注:大R,可理解为家里有矿的人,游戏的充值金额很大。每个游戏都有等级划分的制度,共有以下五种:废户、普通用户、VIP用户、SVIP用户、大R用户

4. 玩家游戏习惯分析

关键指标

PVP(Player VS Player):玩家之间的游戏对决,就是玩家与对立阵营,派别之间的玩家发生的战斗。通过完成击杀其他玩家获得荣誉,装备道具等。
PVE(Player VS Environment):玩家与电脑之间的对决,即打怪、打副本等。

4.1 AU玩家的PVP情况

select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15;

4.2 APA玩家的PVP情况

select avg(pvp_battle_count) as 平均PVP次数,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP的概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;

4.3 AU玩家的PVE情况

select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15;

select avg(pve_battle_count) as 平均PVe次数,
sum(pve_lanch_count)/sum(pve_battle_count) as 主动发起PVE的概率,
sum(pve_win_count)/sum(pve_battle_count) as PVE胜利的概率
from game_analyst
where avg_online_minutes>=15
and pay_price>0;


将数据可视化:

从上图可以看出,APA玩家的平均PVE和PVP次数都要高于AU玩家两倍左右,显然APA玩家更愿意花费更多的时间在这个游戏上。

在PVE活动中,APA玩家主动发起进攻的概率和胜利的概率与AU玩家基本持平,其中主动发起PVE的概率非常高,可见游戏玩家还是比较熟悉游戏规则,基本上能主动刷副本打怪获取资源或者等级的提升。另外游戏的PVE难度也不高,玩家的PVE胜率高达90%,可见游戏体验较为友好。

结论

1. 新增用户分析

  • 新增玩家有828934人,其中付费玩家有19549人,付费人数占注册总人数的2.36%。
  • 每日新增玩家在3月10日有一次大高峰增长,在3月13日有一次小高峰增长,推断可能是举办了游戏活动,但是活动一过,后续新用户注册量并没有显著提升,可见这两次活动并没有给游戏带来实质性帮助。
  • 在这两次举办的活动期间,每日新增付费用户并没有提升,反而趋于下降,可见这两次游戏可能是为了提升游戏的热度。
  • 建议加大活动力度,并保持一定的时间维度,给玩家充分了解游戏的时间,才能持续提高游戏热度。

2. 玩家游戏活跃度

  • 全部玩家平均在线时长11.74分钟,付费玩家平均在线时长135.87分钟,付费玩家的平均在线时长要远远大于全体玩家的平均时长,活跃度比他们大得多。
  • 75%的玩家平均在线时长不超过1分钟,可见玩家流失的情况还是比较严重的。
  • 付费用户中,75%以上的用户在线时长都超过了30分钟,说明付费用户更愿意投入时间到该款游戏中。

3. 玩家付费情况分析

  • 付费率PUR比较低,只有2.7%,其中只要简单的开展一个首充活动,比如充1元可获得60元的大礼包,就能很好地提高游戏的付费率了。付费率高,一样可以得到渠道青睐,获得更多推荐展示机会(行业俗称“吸量”),间接提高游戏热度。
  • 怒气按较好的手游每日ARPU超过5元;一般的手游ARPU在3元-5元之间;ARPU低于3元则说明表现较差,但是平均每付费用户收入ARPPU很高,说明大R的付费能力强,针对这一点,我们可以做一些付费功能的调整和优化,甚至专属大R的克服,让付费用户玩的更开心。

4. 付费玩家习惯分析

  • APA玩家的平均PVE和PVP次数都要高于AU玩家两倍,显然APA玩家更愿意花费更多的时间在这个游戏上。
  • 在PVP活动中,APA玩家主动发起进攻的概率和胜利的概率要明显高于AU玩家,在享受游戏对战乐趣的过程中,往往更能够收获胜利。
  • 在PVE活动中,APA 玩家主动发起进攻的概率和胜利的概率与AU玩家基本持平,其中主动发起PVE的概率非常高,可见游戏玩家还是比较熟悉游戏规则,基本能主动刷副本打怪获取装备资源或者等级的提升。
  • 游戏的PVE难度也不高,玩家的PVE胜率高达90%,可见游戏体验较为友好。

互联网游戏-数据分析项目相关推荐

  1. 未明学院:两大互联网热门实战项目 | 掌握数据分析核心技能,互联网热门岗位不再遥远!

    近年来,随着移动互联网.互联网+的兴起,互联网行业保持持续快速增长,互联网已经取代外企.金融等行业,成为应届生找工作的首选. 在教育部<2018年中国毕业生就业报告>的统计中,互联网行业的 ...

  2. 基于Flink+ClickHouse构建实时游戏数据分析最佳实践

    简介:本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算.云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务. 直达 ...

  3. 亚马逊云科技依托人工智能进行游戏数据分析,解决游戏行业痛点,助力游戏增长

    前言 据互联网数据显示:2014 年我国游戏行业用户规模为 517.31 百万人,直至 2020 年达 554.79 百万人:同时,2020 年,我国游戏市场实际销售收入 2786.87 亿元,比 2 ...

  4. 算法与实战 - (3) 常见数据分析项目类型

    文章目录 1. 用户特征分析(用户分层) 2. 活跃度定义(指标定义) 3. 路径分析与漏斗分析 4. 交叉销售模型 5. 商品推荐模型 6. 信用风险模型 7. 客户预测模型 Reference 本 ...

  5. 《R语言游戏数据分析与挖掘》一导读

    前 言 为什么要写这本书 随着大数据的概念越来越流行,越来越多的企业开始重视数据,期待从数据中寻找有价值的结论,以指导公司管理层决策,最终创造更大的价值.但是在游戏行业,数据分析的发展相对缓慢,很多游 ...

  6. 如何做一个优秀的数据分析项目?

    上一篇我们普及了[数据分析项目,是什么?为什么我没做过?].今天我们系统讲解一下:如何做一个优秀的数据分析项目.首先大家要明白,并不是所有的项目,都需要找一个万人大会堂,拉着横幅,董事长总经理轮流上台 ...

  7. 如何通过网络数据的获取,做出这些数据分析项目?

    作者 | AlfredWu 来源 | Alfred数据室 最近有很多人在问,我是如何收集网络的数据,如何进行数据处理.数据分析以及可视化呈现的. 也有人问的更具体,关于Python数据分析的一些问题. ...

  8. 1【源码】数据可视化:基于 Echarts +Java SpringBoot 实现的动态实时大屏范例-互联网企业数据分析

    目录 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 需求确认 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.开发环境搭建 1.Java开发环 ...

  9. 《游戏数据分析的艺术》读书笔记1

    第一章 1. 了解游戏数据分析 1. 1游戏数据分析的概念 今天的游戏数据分析算一个方向,还不算一个专业领域 对很多游戏设计者来说,游戏是艺术品,是艺术灵感的产出物,因此并不认同通过数据分析来挖掘用户 ...

最新文章

  1. 7篇必读ACM MM 2019论文:图神经网络+多媒体
  2. Git远程库版本回滚
  3. 这年头,好文案都被它承包了!
  4. 使用cmake安装mysql5.5.13
  5. java集合框架介绍_Java集合框架介绍
  6. Sybase identity 字段
  7. junit 测试 dao_JUnit测试Spring Service和DAO(带有内存数据库)
  8. 求大佬帮Ansys三维地质体建模
  9. selenium autoit java_selenium借助AutoIt识别上传文件Java篇
  10. vsftpd创建本地yum仓库如何放在有账户密码验证上
  11. Android WindowManager实现悬浮窗效果 (一)——与当前Activity绑定
  12. poj 1833 排列
  13. 解决Apex英雄下载慢、origin平台下载打开的究极3种方法
  14. libyuv 再次封装打包与测试
  15. c++聊天机器人——简单版
  16. 近期14个“AI产品经理”职位JD推荐(覆盖北京、上海、深圳、成都、重庆、杭州)
  17. 第二步:创建html模板及文件目录等
  18. JAVA-CPU飙高问题排查
  19. .py文件图标为白纸以及右键没有Edit with IDLE的解决办法
  20. 3.4.3 Electric Fence电网 USACO(毕克定理) USACO

热门文章

  1. 我的 2019 总结
  2. 明星项目方生死战:战局巅峰比拼的是人心
  3. 利用计算机教学的体会,利用多媒体教学设备心得体会
  4. 安科瑞智能照明控制系统在某办公楼上的应用——安科瑞潘芹
  5. 三级网络技术第三题总结
  6. 《Automated Spatial Calibration of HMD Systems with Unconstrained Eye-cameras》论文阅读
  7. 如果介绍自己做的项目
  8. HPC 网络技术 — Overview
  9. NX二次开发-创建图纸尺寸表达式抑制UF_DRF_add_controlling_exp
  10. Python 准确获取今天是星期几的代码(isoweekday和weekday)