文章目录

  • 1. 数据集说明
  • 2. 数据处理
  • 3. 数据分析可视化
    • 3.1 新增用户
    • 3.2 用户活跃度
    • 3.3 用户消费情况
    • 3.4 用户游戏情况
  • 数据集和代码(百度网盘)

1. 数据集说明

这是一份手游《野蛮时代》的用户数据,共有训练集和测试集两个数据文件。二者之间数据无交集,合计大小 861 M,总记录数 3,116,941,包含字段 109 个。

使用的知识点:清洗 pandas + 分析 mysql + 可视化 pyecharts

数据集和代码下载:见文章底部,为了防止那些白嫖

2. 数据处理

数据处理:将两个数据文件合并,只取分析要用的字段。然后把数据写到 mysql。

只取用于分析的字段,因为字段数太多,去掉没用的字段可以极大的节省内存和提高效率

import os

【数据分析实例】 300 万条《野蛮时代》的玩家数据分析相关推荐

  1. 【总结】大规模数据(300万条)测试时,需要注意的问题。

    前言 前两天,执行了一个batch处理300万条数据 程序执行了33小时11分40秒 并且产生了10G多的log文件 事前准备(数据导入) ①数据导入所采取的方式 执行数据数据插入时,我们选择的方式最 ...

  2. Java 线程池 +生产者消费者+MySQL读取300 万条数据

    1.1需求 数据库300 万条用户数据 ,遍历获取所有用户, 各种组合关联, 获取到一个新的json ,存到redis 上. 1.2 难点 数据库比较多, 不可能单线程查询所有的数据到内存. 1.3解 ...

  3. 大数据分析了50万条拼多多商品数据, 得出了这样的结论

    一.缘起 我在杭州有位朋友,提到有家做社交的电商很火,叫拼多多,我没有在意,直到有一天,我居然在电视上看到了它的广告,广告画面活蹦乱跳,余音绕梁,我惊呆了,想知道这是何方YL,不,何方神圣,网上搜了下 ...

  4. mysql索引_效率测试(包含测试sql脚本300万条数据),可用作教学案例。

    目录 建表 无索引测试: 建表 建表与插入数据sql,运行时间越2分钟 #1. 准备表 create table test_table( id int, name varchar(20), sex i ...

  5. 【数据分析实例】6000 条倒闭企业数据分析

    文章目录 1. 数据集说明 2.各年份被淘汰的公司总数对比 3.被淘汰公司的倒闭时间集中所在的月份 4.被淘汰公司在倒闭当年的寿命 5.被淘汰公司的主要死亡原因 6.死亡公司的地区分布 7.行业排行T ...

  6. mysql 批量插入300万条测试数据

    # 1.建表 #drop table if exists test_user; create table test_user( id int auto_increment, `name` varcha ...

  7. 【数据分析实例】数据领域的兄弟们的数据分析

    文章目录 数据科学之路~ (一)数据领域的兄弟们的自身情况 (二)Python和R哪家强 (三)数据科学家都在用什么 看看性别的分布吧 看看排名人数最多的前15个国家 各国的收入情况啥样呀在调查问卷中 ...

  8. 查询分析300万笔记录_给你100万条数据的一张表,你将如何查询优化?

    1.两种查询引擎查询速度(myIsam 引擎) InnoDB 中不保存表的具体行数,也就是说,执行select count(*) from table时,InnoDB要扫描一遍整个表来计算有多少行. ...

  9. 300万知乎多标签文本分类任务经验分享(附源码)

    来源:大数据挖掘DT数据分析 本文长度为4600字,建议阅读6分钟 本文为你分享知乎看山杯冠军团队参赛经验. 后台回复回复关键词"PT"即可获取源码(PyTorch实现)githu ...

最新文章

  1. 工作10年后,再看String s = new String(xyz) 创建了几个对象?
  2. 宋琦:PHP在微博优化中的“大显身手”
  3. C语言嵌入式系统编程修炼之(六)性能优化
  4. Spring起步(一)Building a RESTful Web Service
  5. SAP 开发陷阱一箩筐(01)——创建了函数组却无法激活
  6. Docker 容器CPU设置
  7. Servlet使用适配器模式进行增删改查案例(EmpServiceImpl.java)
  8. [php入门] 3、WAMP中的集成MySQL相关基础操作
  9. 极光实时监听怎么调用_源码分析 Sentinel 实时数据采集实现原理(图文并茂)
  10. 将n划分成最大数不超过m的划分数
  11. Python Flask Web 第三课 —— 模板
  12. 在Windows下正确安装Scipy与Numpy
  13. 使用python代码调用三汇语音卡硬件拨打电话
  14. android格式化通讯录
  15. 工具使用 - office快捷键
  16. mysql使用dual进行自定义数据查询
  17. java通过qq邮箱发送_java实现发送QQ邮箱
  18. 天才小毒妃 第966章 不死不灭的痛苦
  19. mysql查询的优化
  20. 如约而至 | 云和恩墨大讲堂电子期刊第五期

热门文章

  1. Python 正则替换字符串
  2. ‘NoneType‘ object has no attribute ‘shape‘
  3. python练习 15-9
  4. 美创科技四个行业数据安全治理实践案例
  5. 淘集集企业店和个人店入驻有什么不同?
  6. android透明背景加深,Android美化之全局透明背景
  7. 东北大学计算机学院电子类专业,【识读东大】计算机科学与工程学院|电子信息类...
  8. Python基础---Set(集合)Frozenset(不可变集合)
  9. 民宿项目知识_服务器路径与文件的存储
  10. 群晖上NVMe实测兼容机型