数据分析基础流程

明确问题->理解数据->数据清洗-> 数据分析或构建模型->数据可视化

step1: 明确问题

借用阿里天池电商婴儿数据集熟悉excel数据分析,主要明确以下几个问题:

  1. 哪一个商品种类最受用户欢迎
  2. 婴儿每月度销售数量变化趋势
  3. 销量最高的商品

Baby Goods Info Data-数据集-阿里云天池​tianchi.aliyun.com

step2: 理解数据

user_id:用户身份信息

auction_id:购买行为编号

cat_id:商品种类序列号

cat:商品序列号

property:商品属性

buy_mount:购买数量

day:购买时间

step3: 数据清洗

  1. 数据重命名以及将day字段通过分列转换呈日期格式

2. 重复值和缺失值处理

全选数据集,选择数据下面的删除重复值,得知数据集无重复值;在选中各个列,根据excel下方的计算栏得出每一列的个数,得出商品属性存至缺失值,不过考虑到研究问题和商品属性关联不大,故暂不处理

step4: 数据分析或构建模型&step5数据可视化

基于不同的问题,选择不同的字段

  1. 哪一个商品种类最受用户欢迎

所需字段:商品种类序列号、用户身份信息;

使用数据透视表,将商品种类序列号拖到行,将用户身份信息拖到值,值字段选择计数项;然后在商品种类序列号选择按照用户身份信息倒序排序

由此透视表得出50013636购买用户数最多,高达2066人

2. 婴儿每月度销售数量变化趋势

所需字段:购买时间、购买数量

使用数据透视表进行聚合,将购买时间按照“月”进行组合,然后在按照购买数量排序

3. 销量最高的商品

所需字段:商品序列号、购买数量

使用数据透视表进行聚合,得出:28号商品销量最佳,销量占比37%

关于excel其他函数用户,自己还是要多加练习,继续加油!

存数据返回他的序列号id_使用excel进行数据分析相关推荐

  1. 存数据返回他的序列号id_雪花般的分布式唯一ID雪花算法

    点击上方 Java老铁,并选择 设为星标 优质文章和资料会及时送达 导读:唯一ID可以标识数据的唯一性,在分布式系统中生成唯一ID的方案有很多,常见的方式大概有以下三种 依赖数据库,使用如MySQL自 ...

  2. python 网页上显示数据_怎么用python将excel数据写入网页中,python 网页上excel表格数据分析...

    用python读取excel,怎样显示要查找的数据? 感觉还是CSV格式的好一些,EXCEL的要装插件,以CSV为例,段代码 sqlserver char 对应c# import linecache ...

  3. 位图 查找重复 排序 存数据

    参见百度百科 一.给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中 申请512M的内存 一个bit位代表一个unsigned in ...

  4. Hbase写数据,存数据,读数据的详细过程

    Client写入 -> 存入MemStore,一直到MemStore满 -> Flush成一个StoreFile,直至增长到一定阈值 -> 出发Compact合并操作 -> 多 ...

  5. innodb是如何存数据的?yyds

    前言 如果你使用过mysql数据库,对它的存储引擎:innodb,一定不会感到陌生. 众所周知,在mysql5以前,默认的存储引擎是:myslam.但mysql5之后,默认的存储引擎已经变成了:inn ...

  6. 计算机专业512g固态硬盘够吗,只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分...

    原标题:只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分 只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分 电脑是我们日常办公或者工作最常用的设备,随着固态硬盘价钱不断走低 ...

  7. 华为数据中心服务器数量,IDC 与华为联合发布《全闪存数据中心白皮书》,目前已有多个应用...

    IT之家 7 月 24 日消息根据华为中国官方消息,7 月 22 日,2021 华为金融创新数据基础设施峰会在内蒙古成功召开.本次大会上,呼伦贝尔市委常委.副市长施强在致辞中表示:金融业作为数据数字化 ...

  8. php 插入 mysql_php插入mysql数据返回id的方法

    如下所示: $dbh = mysql_connect('localhost','root','root'); mysql_select_db('pkbk'); $query = "inser ...

  9. easyui树拖拽排序java_easyui tree 拖拽功能并将数据返回后台保存至数据库

    1.需要实现tree的拖拽功能,首先在定义一个tree时候需要设置 dnd : true 2.easyui 给我们提供了一个onDrop : function(target, source, poin ...

最新文章

  1. 2D图片3秒变立体,变换视角流畅自然:Adobe实习生的智能景深算法,登上顶级期刊...
  2. strace,ltrace linux下跟踪进程调用的命令
  3. python从零开始进阶_从零开始学Python - 第020课:函数使用进阶
  4. 针对表单的事件;条件语句;定时器的简单介绍;
  5. Swaks-smtp瑞士军刀(smtp邮件)
  6. tpshop防止sql注入补丁
  7. 关于数据库的一些基本操作语句
  8. DB2添加数据时主键、唯一键冲突的解决方法
  9. java 给多人发送、抄送
  10. MYSQL 碎片查询
  11. hadoop fs.trash 详解
  12. 推荐几个JAVA 学习不错的网站
  13. 分享 MSDN 下载工具(Word/PDF)
  14. win10家庭中文版系统配置远程桌面连接
  15. 出现504怎么办?由于服务器更新导致的博客报504错误[详细记录]
  16. 1990年的图灵奖获得者-Fernando Jose Corbato
  17. 转载:欧姆社 漫画学习统计学
  18. 计算机教程文档,计算机应用基础教程-20210323002444.doc-原创力文档
  19. 6.S081参考书笔记 —— 第7章调度、进程交互
  20. 麻烦不断!盘点苹果过去的一年惹上的“幺蛾子”

热门文章

  1. 图片放大缩小旋转左移右移镜像倒影android
  2. 生成主键ID,唯一键id,分布式ID生成器雪花算法代码实现
  3. mycat-sublun数据库分片
  4. 宝元系统通讯软件recon_企业即时通讯工具需注意哪些问题
  5. aspen和python一起使用_python-将$cond语句与$project一起使用并在PyMongo中聚合
  6. html源码加密ensure-china_php源码加密方法详解
  7. 【Spring第三篇】什么是Bean?
  8. 2114. 句子中的最多单词数
  9. Angular 在项目中使用fullcalendar 日程表
  10. php挂qq,PHP在线挂QQ个人隐私泄漏