1、课程目标

目标1:熟练使用Spark解决实现生产问题
目标2:熟悉游戏领域大数据分析相关概念
目标3:掌握游戏领域大数据分析的步骤和方法

2、项目背景

2.1、概述

目前大数据已经在各个领域得到广泛应用,在游戏领域玩家的各种行为会产生大量的数据,这些数据可以帮助游戏运维者了解玩家的行为和需求,通过玩家反馈的信息可以不断地矫正游戏中出现的问题,从而让游戏健康稳定的可持续运营。

2.2、游戏利用数据分析的特点

在游戏行业,大数据分析可能不会直接带来电商网站那样真金白银的收入,但其价值同样会体现在精准营销、客户体验优化等多个层面。全面的大数据分析能够有效提升玩家的留存率和转化指标,并且为游戏产品的研发提供指引。而个性化的精准营销同样与大数据分析紧密相关,像是针对不同性别、不同年龄、不同地域人群的广告精准投放,背后都要依靠基于360度用户视图的玩家特征分析。

一、性质:利用数据挖掘将产品中现有的数据转化为知识,帮助产品做出明智改进决策。
二、价值:用准确的数据结果来支持决策。
三、定位:在数据的基础上,让数据产生价值。
四、目标:发现问题、分析问题、提供建议、预测产品(深入数据分析并运用于业务)

2.2.1项目截图

3、游戏数据分析指标

3.1、新增玩家

  1. 新增玩家 当日新增加的玩家帐户数。

  2. 新玩家地区 新增玩家帐号的地区分布情况。

  3. 新玩家渠道 新增玩家帐号的渠道分布情况,每个玩家始终归入首次设备激活时的渠道。

  4. 新玩家性别 新增玩家帐号的玩家性别情况,根据您的游戏中传入的性别确定玩家的性别。

  5. 新玩家年龄 新增玩家帐号的年龄分布情况,根据您传入的年龄确定玩家的年龄段。

  6. 玩家帐户类型 新增玩家帐号的帐户类型分布情况。

3.2、活跃玩家

  1. DAU 当日有开启过游戏的玩家数,其中当日新增玩家带来的活跃以区别的颜色显示。

  2. WAU 当日的最近一周(含当日的倒推7日)活跃玩家,将进行过游戏的玩家按照帐户进行排重。

  3. MAU 当日的最近一月(含当日的倒退30日)活跃玩家,将进行过游戏的玩家按照帐户进行排重。

  4. DAU/MAU DAU/MAU可体现玩家的总体粘度,衡量这30天内每日活跃玩家的交叉重合情况。此比例越趋近于1,代表月活跃中有更多玩家多日活跃;比例越趋近0 ,则代表大量玩家只在一日中活跃。当比例小于0.1时,游戏的自传播性将很差。DAU/MAU×30也用于大致衡量玩家平均每月活跃天数。

  5. AVG|MDAVG 指所选时期对应指标的平均值,MD则代表时期内指标的中位数。

  6. 活跃玩家游戏天数 所选时期的活跃玩家的活跃日期减新增日期的日数差(即其已进行游戏的天数)的分布情况。

  7. 活跃玩家等级 所选时期每日活跃玩家的等级分布情况,由每日数据组成的时期趋势可观测等级的总体走势。

  8. 活跃玩家地区 所选时期排重活跃玩家的地区分布情况。

  9. 活跃玩家渠道 所选时期排重活跃玩家的渠道分布情况,渠道按照其最初新增时的渠道确定。

  10. 活跃玩家性别 所选时期排重活跃玩家的性别情况。

  11. 活跃玩家年龄 所选时期排重活跃玩家的年龄分布情况。

3.3、玩家留存

  1. 次日留存率 某日新增的玩家中,在下一日中还进行了游戏的玩家的比例。

  2. 7日留存率 某日新增的玩家中,在该日后的第7日中还进行了游戏的玩家比例。

  3. 30日留存率 某日新增的玩家中,在该日后的第30日中还进行了游戏的玩家比例。

  4. 留存玩家分析 圈定时期内符合次日/7日/30日留存条件的新玩家,根据其新增日的使用行为(等级、游戏次数、是否付费等)来进行分布,可有效的分析新增日行为与留存的相关性。

3.4、玩家流失

  1. 每日流失数 到某日为止,玩家连续7/14/30天没有再玩过游戏,将被视为一个流失。

  2. 每日流失率 每日的7日(14日/30日)不登陆流失玩家数占该日7日(14日/30日)前活跃玩家数的比例。

  3. 每日回流 流失玩家在某日再次进行游戏,将视为当日的一个回流。回流玩家可用于沉默玩家唤醒活动后的效果评估。

  4. 流失用户分析圈 定时期内符合7/14/30日流失条件的玩家,按照其流失前等级、已游戏天数、付费情况等条件来进行分布,可有效分析流失群体的特征,找出原因优化游戏。

3.5、游戏习惯

3.5.1、平均游戏时长与次数

  1. 每日 当日玩家每次进行游戏的平均时长(当日总时长/游戏次数)和平均每玩家的游戏次数(游戏次数/日玩家数)。

  2. 自然周 某自然周内,玩家每次进行游戏的平均时长(周时长/周游戏次数)和平均每玩家一周内的游戏次数(游戏次数/周排重玩家数)。

  3. 自然月 某自然月内,玩家每次进行游戏的平均时长(月时长/月游戏次数)和平均每玩家一月内的游戏次数(游戏次数/月排重玩家数)。

3.5.2、游戏频次

  1. 游戏频次 指玩家在一定期间中进行游戏的频繁度,将按照频度的不同将玩家分入不同的分布区间。报表中按照您所选日期自动扩充完整自然周/月来计算周和月的频次,跨多个周/月的数据查询会先计算单个周/月的分布数据,再组合各个区间的数据后集中进行展示。

  2. 月游戏天 数玩家在一个自然月中活跃日数的分布情况。

  3. 周游戏天 数玩家在一个自然周中活跃日数的分布情况。

  4. 周游戏次 数玩家在一个自然周中游戏次数的分布情况。

  5. 日游戏次数 玩家在一日中游戏次数的分布情况。

3.5.3、游戏时长

  1. 游戏时长 指玩家在游戏内的游戏时长,按照不同时长将玩家分入不同的分布区间。对周使用时长将按照您所选日期自动扩充完整自然周来计算单用户时长,跨多周的查询会先计算单周的分布数据,再组合各个区间的数据后集中进行展示。

  2. 周游戏时长 玩家在一个自然周中玩游戏总时长的分布情况。

  3. 单日游戏时长 玩家在一日中玩游戏总时长的分布情况。

  4. 单次游戏时长 玩家在一日中每次玩游戏的时长分布情况。

  5. 游戏间隔 时期内,玩家每次玩游戏与上次游戏的时间间隔分布情况。

3.6、收入数据

  1. 收入金额 所选时期的充值总金额根据玩家充值时的等级进行分布。

  2. 充值人次 所选时期每次充值根据玩家充值时的等级进行分布。

  1. 各地区收入 所选期间,各个地区的玩家充值金额的分布情况。

  2. 各渠道收入 所选期间,各个渠道来源的玩家充值金额的分布情况。

  3. 分性别收入 不同性别玩家的充值总金额情况。

  4. 各年龄段收入 不同年龄段玩家的充值总金额情况。

4、游戏数据来源

服务器截图
目前,大部分网游引擎都是不是开源的,可以架设的网游服务器端更是寥寥无几,为达到模拟真实的业务环境,统计架设《热血传奇》游戏来模拟。
服务端:

客户端

数据样例

1、GameLog.txt

2、游戏常规日志

服务器部署简介

1.1. 服务器位置和职责

推广网站:www.17173.com 和 www.3000ok.com
官方网站:www.lfg176.com,埋点了js文件,路径/var/www/html
日志采集服务器:flow.lfg176.com,安装了nginx在/usr/local/nginx
游戏服务器:gemeserver服务器

1.2. 关于页面埋点

在www.lfg176.com埋点,收集数据到日志服务器flow.lfg176.com,在对flow.lfg176.com中nginx产生的日志进行汇总收集
    例如:京东的埋点记录log.gif(1*1的空图片),通过url解码能够看到具体信息

1.3. 游戏流程架构图

日志采集服务:
        1、日志点击流
            玩家从推广网站点击游戏链接
            跳转到我的官方网站
            官方网站请求日志服务器,下载js
            玩家在官网的任何操作都会通过这个js将数据发送到日志服务器
            日志采集服务器安装了nginx,通过lua记载日志/var/nginx_logs/track.log
            通过logstash收集日志到kafka的gameLogTopic中
            
        2、游戏日志
            玩家连接winserver玩游戏生成数据
            logstash采集winserver上的数据,将数据采集到kafka的accessLogTopic中
    
    数据处理:
        1、对kafka的日志采集到hdfs做持久存储
        2、对kafka中的日志采集到elasticsearch中进行索引分析
        3、对kafka中的日志采集到spark中做离线和实时分析

1.4. 日志采集服务器搭建

见文档

1.5. 日志收集部署

点击流日志收集:
        1、在flow.lfg176.com上安装logstash
        2、写配置文件(flow-kafka.conf),从nginx日志收集数据,创建kafka的topic,将数据写到kafka中
        3、启动logstash(logstash -f xxx.conf)
        4、访问官网,查看数据是否进入kafka(通过consumer命令消费命令,验证消息)

游戏日志收集:
        1、在gameserver上安装logstash
        2、写配置文件(gs-kafka.txt)
        3、创建kafka对应的topic
        4、启动logstash:logstash -f logstash\conf\gs-kafka.txt
        5、登录游戏,产生日志
        6、在kafka中通过consumer查看log是否生成

5、数据处理

5.1、数据采集

5.1.1、离线数据采集
通过在游戏的服务端安装Logstash将数据定时采集到Elasticsearch中(见ELK资料文档)
5.1.2、实时数据采集
通过在游戏的服务端安装Logstash将数据定时采集到Kafak中(见ELK资料文档)

游戏运营分析项目(1)相关推荐

  1. 乐元素 X Hologres:一站式高性能游戏运营分析平台

    客户介绍 乐元素创立于2009年,是一家以游戏研发运营为主营业务的游戏公司,同时业务涵盖动画作品.授权商品.音乐.演唱会.广播剧等在内的知名互动娱乐公司 .乐元素旗下拥有<开心水族箱>.& ...

  2. 游戏运营 ---没用

    游戏运营分析项目 1. 课程目标 1.1. 熟练使用Spark解决实现生产问题 1.2. 熟悉游戏领域大数据分析相关概念 1.3. 掌握游戏领域大数据分析的步骤和方法 2. 项目背景 2.1. 概述 ...

  3. 在游戏运营行业,Serverless 如何解决数据采集分析痛点?

    作者 | 计缘 来源|阿里巴巴云原生公众号 众所周知,游戏行业在当今的互联网行业中算是一棵常青树.在疫情之前的 2019 年,中国游戏市场营收规模约 2884.8 亿元,同比增长 17.1%.2020 ...

  4. Serverless在游戏运营行业进行数据采集分析的最佳实践 链接:

    简介:这个架构不光适用于游戏运营行业,其实任何大数据采集传输的场景都是适用的,目前也已经有很多客户正在基于Serverless的架构跑在生产环境,或者正走在改造Serverless 架构的路上. 作者 ...

  5. Serverless在游戏运营行业进行数据采集分析的最佳实践

    简介: 这个架构不光适用于游戏运营行业,其实任何大数据采集传输的场景都是适用的,目前也已经有很多客户正在基于Serverless的架构跑在生产环境,或者正走在改造Serverless 架构的路上. 众 ...

  6. 在游戏运营行业,函数计算如何解决数据采集分析痛点?

    众所周知,游戏行业在当今的互联网行业中算是一棵常青树.在疫情之前的 2019 年,中国游戏市场营收规模约 2884.8 亿元,同比增长 17.1%.2020 年因为疫情,游戏行业更是突飞猛进.玩游戏本 ...

  7. sql 除以_使用SQL分析游戏运营情况

    数据来源:http://www.dcjingsai.com/common/cmpt/%E6%B8%B8%E6%88%8F%E7%8E%A9%E5%AE%B6%E4%BB%98%E8%B4%B9%E9% ...

  8. 哔哩哔哩swot分析_哔哩哔哩2020校园招聘游戏运营笔试真题

    在前不久<英雄联盟>S9世界大赛总决赛上,中国FPX战队以3:0横扫欧洲G2最终夺得S9世界冠军,国内玩家万分激动. 总决赛刚结束不久,B站以8亿元价格拍得<英雄联盟>全球总决 ...

  9. 游戏运营全过程剖析,游戏开发,游戏运营,游戏推广问题分析

    产品策划:一个好的idea至关重要,结合当时的社会环境,游戏开发水平,玩家喜好,市场需求等考虑.精美的画面,流畅的游戏节奏,情节,完善的游戏系统能让你的游戏立于不败之地. 产品开发:游戏主线框架定好后 ...

最新文章

  1. ConcurrentHashMap之实现细节
  2. 验证Oracle收集统计信息参数granularity数据分析的力度
  3. django21:admin后台管理\media配置\图片防盗链\暴露后端资源\路由分发\时间分类
  4. Java 8.if语句
  5. Leetcode 347.前K个高频元素
  6. 什么是C++标准库?
  7. 《Java就业培训教程》_张孝祥_书内源码_09
  8. html图片加载慢的问题
  9. 自定义httpSession
  10. tecplot 360 2018 R1 R2安装教程及软件百度云
  11. 成功之路散文连载之笨人论
  12. python发邮件被认定为垃圾邮件_【Python】垃圾邮件识别
  13. U盘格式化后 容量变小如何解决
  14. Python之win7环境下安装python3
  15. Android仿微信朋友圈九宫格图片展示自定义控件,支持缩放动画~
  16. 【Azure 应用服务】NodeJS Express + MSAL 实现API应用Token认证(AAD OAuth2 idToken)的认证实验 -- passport.authenticate()
  17. 车载基础软件——基础软件验证平台
  18. 异构计算的两大派别 为什么需要异构计算?
  19. Python自动化:模拟人类在百度搜索页输入关键词进行搜索并打开搜索结果
  20. Flutter时间轴-首个

热门文章

  1. 基于 Hostpot 虚拟机的 Java 对象解析
  2. 微擎系统跟换服务器和域名,微擎修改服务器域名
  3. 30岁了 该如何谋划自己的未来
  4. Accessibility Verification Test--无障碍测试简介
  5. 13.56M芯片OBU方案——SI522
  6. 使用 vue 和 canvas 制作的游戏
  7. 统计文件中每个字母的个数
  8. git 初次使用的配置流程
  9. Paintbrush for mac(绘图工具)
  10. 让 Python 拥有 C/C++ 一样的速度,编译神器 Codon 发布!