电子游戏销售数据分析
数据来源:kaggle
目录
项目背景
这个数据集包含了一系列销量超过10万份的电子游戏。它是由 vgchartz 网站提供的。字段包括总销售排名、游戏名称、游戏发布的平台(即 pc,ps4等)、游戏发布的年份、游戏类型、游戏发布者、游戏在北美的销售额、欧洲销售额、日本销售额、在世界其他地区销售额、全球销售额等。
数据概览
字段名 | 字段释义 |
---|---|
Rank | Ranking of overall sales |
Name | The games name |
Platform | Platform of the games release (i.e. PC,PS4, etc.) |
Year | Year of the game’s release |
Genre | Genre of the game |
Publisher | Publisher of the game |
NA_Sales | Sales in North America (in millions) |
EU_Sales | Sales in Europe (in millions) |
JP_Sales | Sales in Japan (in millions) |
Other_Sales | Sales in the rest of the world (in millions) |
Global_Sales | Total worldwide sales. |
分析目标
1.电子游戏市场分析:受欢迎的发行人、发布平台、游戏类型;
2.可视化应用:完整清晰的展示这个销售故事。
数据清洗
根据数据整体情况来看:
1.目前有空值的是Year(要改为字符类型)、Publisher,需要填充或删除。
策略:Publisher 用众数填充,Year删除17年、20年的数据。
2.转换Year的数据类型
策略:将Year转换为字符型。
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_csv('D:/data analysis/analysis/game analysis/vgsales.csv')
print(df.head(10))
# 数据清洗
print(df.info())
# 目前有空值的是Year(要改为字符类型)、Publisher
# 转换Year的数据类型
df['Year'] = df['Year'].astype(str)
# 对数据的重复值进行检测
print(df.duplicated())
# 删除Year的空值还有17年,20年的数据、Publisher用众数填充
df['Publisher'].fillna('Electronic Arts ', inplace=True)
print(df.info())
EDA
游戏市场分析
游戏市场整体销售情况
1.1980年-2016年,电子游戏销量趋势先波动上升然后又波动下降,在2008年达到最高点,销量为678.9(百万)。其中,1980年-1995年,销量变化趋势平缓;1996-2008年,销量大幅波动上涨,2009-2016年开始大幅波动下降。需关注大幅上涨和下降的原因。
2.1980年-2016年,日本销量和世界各地区的销量波动幅度不大,北美和欧洲销量整体销售量的趋势和全球销量的趋势基本保持一致,且对整体销量的波动趋势贡献大。需特别关注欧洲和美国的销售波动情况。
3.整体来看,电子游戏销量北美最高,其次是欧洲、然后是日本和其他世界地区。需关注日本和世界其他地区销量低的原因。
受欢迎发行人
1.1980-1995年,最受欢迎的游戏发行人是Nintendo。
2.1996年-2008年,最受欢迎的游戏发行人依次是Nintendo、Electronic Arts、 Sony Computer Entertainment。
3.2009年-2016年,最受欢迎的游戏发行人依次是Electronic Arts、 Nintendo、Activision、Ubisoft、Sony Computer Entertainment。
整体来看,1980-2016年,最受欢迎的游戏发行人依次是Nintendo(日本的任天堂)、Electronic Arts(美国艺电公司)、Activision(美国动视暴雪)、 Sony Computer Entertainment(日本索尼电脑娱乐公司),Ubisoft(法国育碧娱乐软件公司)。
无论哪一阶段Nintendo都是很受欢迎的游戏发行人;,其次是Electronic Arts,在1996年-2008年开始迅猛发展,并在2009年-2016年受欢迎程度超过了Nintendo。
受欢迎的游戏平台
1.1980-1995年,最受欢迎的游戏发布平台是NES、SNES、以及GB,其次是PS和PC。
2.1996年-2008年,最受欢迎的游戏发布平台是PS,GB和PC销量较少。
3.2009年-2016年,游戏发布平台只有PC。
整体来看:1980-2016年,全球最受欢迎的游戏发布平台是PS,其遥遥领先于其它发布平台。PC、GB、NES、SNES销量相差不大。
整体来看:1980年-2016年最受欢迎的游戏发布平台是PS,然后依次是PC、GB、NES、SNES。
在销量大幅上升的1996年-2008年,PS平台对总体贡献最大,在销量大幅下降的2009年-2016年,只有PS已不再受欢迎,唯一受欢迎的是PC。
受欢迎的游戏类型
1.1980-1995年,最受欢迎的游戏类型是platform,然后依次是shooter、Action、Sports、Role-Playing。
2.1996年-2008年,最受欢迎的游戏类型是Action和Sports,然后是Role-Playing、shooter、platform。
3.2009年-2016年,最受欢迎的游戏类型依次是Action、shooter、Sports、Role-Playing、platform。
整体来看,1980-2016年,最受欢迎的游戏类型依次是Action(社交游戏)、Sports(体育游戏)、shooter(射击游戏)、Role-Playing、platform(平台动作)。
1980-1995年,最受欢迎的游戏类型是platform,在1996年开始最受欢迎的游戏类型变成了Action(社交游戏);另外在上升幅度较大的1996年-2008年,Sports也很受欢迎。
分析总结
电子游戏市场变化趋势
1.1980-1995年,Nintendo(任天堂)是最受欢迎的游戏发行人,推出的NES游戏机(超级马里奥),SNES游戏机、以及Game Boy游戏机(GB),受欢迎游戏类型主要是platform(平台类)的超级马里奥系列。
2.1996年-2008年,Nintendo(任天堂)、Electronic Arts(美国艺电公司)、Sony Computer Entertainment(日本索尼电脑娱乐公司) 是最受欢迎的游戏发行人,这个阶段最受欢迎的是PS平台(家用游戏平台,连电视),期间最受欢迎的游戏类型是Action(社交游戏)和Sports(球类游戏)。
3.2009年-2016年,Electronic Arts(美国艺电公司)、 Nintendo(任天堂)、Activision(美国动视暴雪)、Ubisoft(法国育碧娱乐软件公司)、Sony Computer Entertainment(日本索尼电脑娱乐公司)都是受欢迎的游戏人,游戏发布平台最受欢迎的发布平台是pc,最受欢迎的游戏是Action(社交游戏)、其次是sports(球类游戏)、shooter(射击游戏)、platform(平台动作)。
受欢迎的游戏发行人、发行平台、游戏类型
1.任天堂一直是最受市场欢迎的发行人,1996年后美国艺电公司、美国动视暴雪、日本索尼电脑娱乐公司等也逐渐强劲,是受电子游戏市场欢迎的发行人。
2.随着市场的发展,1996年以前NES、SNES、GB等手持游戏机比较受欢迎;1996年-2008年,与电视联机的游戏平台(PS)更受欢迎;2009年以后,pc端的游戏最受欢迎。
3.在1996年以前,平台类游戏是最受欢迎的;之后社交类游戏和球类游戏最受欢迎,其次是射击类、角色扮演类游戏,平台类游戏不再受欢迎。
推测:
1.1996-2008年,之所以北美和欧洲销量大幅上升,主要是发行人除了任天堂,美国艺电公司、美国动视暴雪、日本索尼电脑娱乐公司等逐渐强劲,发行的PS平台产品,其游戏发行市场主要在北美和欧洲,或者游戏类型比较受北美和欧洲欢迎。
2.2009年-2016年,北美和欧洲销量大幅下降,有可能是是受到手机端游戏冲击。
可视化应用
以时间为故事线,讲述全球电子游戏销售趋势、全球电子游戏销售具体情况,北美电子游戏销售情况、欧洲电子游戏销售情况、日本电子游戏销售情况。
电子游戏销售故事可视化链接
电子游戏销售数据分析相关推荐
- 电子游戏销售数据分析(基于Python+Tableau)
1 项目简介 1.1 数据描述 (1)数据来源 本次分析所采用的数据来源于kaggle上的Video Game Sales数据集 ,该数据集通过爬虫从vgchartzwangz网站上获取,主要描述了全 ...
- Python网络爬虫实战:天猫胸罩销售数据分析
本文实现一个非常有趣的项目,这个项目是关于胸罩销售数据分析的.是网络爬虫和数据分析的综合应用项目.本项目会从天猫抓取胸罩销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过S ...
- 初创公司怎么做销售数据分析_初创公司与Faang公司的数据科学
初创公司怎么做销售数据分析 介绍 (Introduction) In an increasingly technological world, data scientist and analyst r ...
- 初创公司怎么做销售数据分析_为什么您的初创企业需要数据科学来解决这一危机...
初创公司怎么做销售数据分析 The spread of coronavirus is delivering a massive blow to the global economy. The lock ...
- 解析|不懂销售数据分析,就是一笔糊涂账!
数据时代,不主张所有人是数据分析师,但是对自己手头的工作,和业务数据,能会用数据分析的思维去发现问题,还是有点用处的.最直观的体现就数据报告! 今天我们就来谈谈别的,销售数据分析报告! 销售数据分析报 ...
- 月均数据_药品销售数据分析案例
今天用python去做一个简单的药品销售数据分析案例 一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇 ...
- python药店销售数据分析_解析医院药店销售数据,看看Python数据分析结果有什么惊人的发现|python基础教程|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/ 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时 ...
- python数据分析案例简单实战项目(一)--供应链销售数据分析
项目背景 作为供应链行业领航企业,怡亚通推动供应链改变中国,不仅是以先进的供应链思维与管理推动中国主要核心城市的商业快速发展,也是以完善的供应链服务布局.开放的新流通平台助力中国1-6线城市以及乡镇的 ...
- 轻松搭建一个BI销售数据分析系统
通过最佳实践帮助您实现上述案例效果 Step1:准备工作 1.1 新建表 1.1.1 开通MaxCompute 阿里云实名认证账号访问https://www.aliyun.com/product/od ...
- 拼多多销售数据分析主要包含哪些方面的数据?
大家好,我是面兜兜,今天面兜兜给大家有关销售数据分析的相关细节问题.不用多说,相信很多从事拼多多的商家应该都知道,对于拼多多店铺来说数据分析是非常重要的,所以现在大部分的拼多多店铺都会分析拼多多数据, ...
最新文章
- 【组队学习】一月微信图文索引
- 23 种设计模式实战 pdf(很全)
- python3.X 使用schedule实现定时任务
- javascript深入理解js闭包
- CTFshow php特性 web128
- xenapp5 负载均衡配置
- Android开发五 Android应用程序架构
- fork()请问下面的程序一共输出多少个“A”?多少个-?
- 用c语言编写一个2048 游戏,求c语言编写的2048游戏代码,尽量功能完善一些
- 虚拟机安装jdk步骤及命令
- Ext Designer Preview生成代码在html上显示步骤
- Apax Partners收购ThoughtWorks幕后探秘
- 重建大师5.0成为首款支持国产麒麟操作系统的自动实景三维建模软件
- 积木导出pdf打不开文件,后台报空指针
- 常用学术文献数据库界面及导出参考文献方法
- 计算机博弈 期望搜索算法算法 期望极大极小算法
- phpMyAdmin下载
- LED设备驱动二之重要代码和调试问题分析
- iTOP-4418开发板Android7.1系统支持RFID、VGA、继电器、LOAR、CAN-RS485
- 获取小程序码所携带的参数