存数据返回他的序列号id_使用excel进行数据分析
数据分析基础流程
明确问题->理解数据->数据清洗-> 数据分析或构建模型->数据可视化
step1: 明确问题
借用阿里天池电商婴儿数据集熟悉excel数据分析,主要明确以下几个问题:
- 哪一个商品种类最受用户欢迎
- 婴儿每月度销售数量变化趋势
- 销量最高的商品
Baby Goods Info Data-数据集-阿里云天池tianchi.aliyun.com
step2: 理解数据
user_id:用户身份信息
auction_id:购买行为编号
cat_id:商品种类序列号
cat:商品序列号
property:商品属性
buy_mount:购买数量
day:购买时间
step3: 数据清洗
- 数据重命名以及将day字段通过分列转换呈日期格式
2. 重复值和缺失值处理
全选数据集,选择数据下面的删除重复值,得知数据集无重复值;在选中各个列,根据excel下方的计算栏得出每一列的个数,得出商品属性存至缺失值,不过考虑到研究问题和商品属性关联不大,故暂不处理
step4: 数据分析或构建模型&step5数据可视化
基于不同的问题,选择不同的字段
- 哪一个商品种类最受用户欢迎
所需字段:商品种类序列号、用户身份信息;
使用数据透视表,将商品种类序列号拖到行,将用户身份信息拖到值,值字段选择计数项;然后在商品种类序列号选择按照用户身份信息倒序排序
由此透视表得出50013636购买用户数最多,高达2066人
2. 婴儿每月度销售数量变化趋势
所需字段:购买时间、购买数量
使用数据透视表进行聚合,将购买时间按照“月”进行组合,然后在按照购买数量排序
3. 销量最高的商品
所需字段:商品序列号、购买数量
使用数据透视表进行聚合,得出:28号商品销量最佳,销量占比37%
关于excel其他函数用户,自己还是要多加练习,继续加油!
存数据返回他的序列号id_使用excel进行数据分析相关推荐
- 存数据返回他的序列号id_雪花般的分布式唯一ID雪花算法
点击上方 Java老铁,并选择 设为星标 优质文章和资料会及时送达 导读:唯一ID可以标识数据的唯一性,在分布式系统中生成唯一ID的方案有很多,常见的方式大概有以下三种 依赖数据库,使用如MySQL自 ...
- python 网页上显示数据_怎么用python将excel数据写入网页中,python 网页上excel表格数据分析...
用python读取excel,怎样显示要查找的数据? 感觉还是CSV格式的好一些,EXCEL的要装插件,以CSV为例,段代码 sqlserver char 对应c# import linecache ...
- 位图 查找重复 排序 存数据
参见百度百科 一.给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中 申请512M的内存 一个bit位代表一个unsigned in ...
- Hbase写数据,存数据,读数据的详细过程
Client写入 -> 存入MemStore,一直到MemStore满 -> Flush成一个StoreFile,直至增长到一定阈值 -> 出发Compact合并操作 -> 多 ...
- innodb是如何存数据的?yyds
前言 如果你使用过mysql数据库,对它的存储引擎:innodb,一定不会感到陌生. 众所周知,在mysql5以前,默认的存储引擎是:myslam.但mysql5之后,默认的存储引擎已经变成了:inn ...
- 计算机专业512g固态硬盘够吗,只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分...
原标题:只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分 只有一块512G固态硬盘的电脑,需不需要分区?不存数据可以不分 电脑是我们日常办公或者工作最常用的设备,随着固态硬盘价钱不断走低 ...
- 华为数据中心服务器数量,IDC 与华为联合发布《全闪存数据中心白皮书》,目前已有多个应用...
IT之家 7 月 24 日消息根据华为中国官方消息,7 月 22 日,2021 华为金融创新数据基础设施峰会在内蒙古成功召开.本次大会上,呼伦贝尔市委常委.副市长施强在致辞中表示:金融业作为数据数字化 ...
- php 插入 mysql_php插入mysql数据返回id的方法
如下所示: $dbh = mysql_connect('localhost','root','root'); mysql_select_db('pkbk'); $query = "inser ...
- easyui树拖拽排序java_easyui tree 拖拽功能并将数据返回后台保存至数据库
1.需要实现tree的拖拽功能,首先在定义一个tree时候需要设置 dnd : true 2.easyui 给我们提供了一个onDrop : function(target, source, poin ...
最新文章
- 2D图片3秒变立体,变换视角流畅自然:Adobe实习生的智能景深算法,登上顶级期刊...
- strace,ltrace linux下跟踪进程调用的命令
- python从零开始进阶_从零开始学Python - 第020课:函数使用进阶
- 针对表单的事件;条件语句;定时器的简单介绍;
- Swaks-smtp瑞士军刀(smtp邮件)
- tpshop防止sql注入补丁
- 关于数据库的一些基本操作语句
- DB2添加数据时主键、唯一键冲突的解决方法
- java 给多人发送、抄送
- MYSQL 碎片查询
- hadoop fs.trash 详解
- 推荐几个JAVA 学习不错的网站
- 分享 MSDN 下载工具(Word/PDF)
- win10家庭中文版系统配置远程桌面连接
- 出现504怎么办?由于服务器更新导致的博客报504错误[详细记录]
- 1990年的图灵奖获得者-Fernando Jose Corbato
- 转载:欧姆社 漫画学习统计学
- 计算机教程文档,计算机应用基础教程-20210323002444.doc-原创力文档
- 6.S081参考书笔记 —— 第7章调度、进程交互
- 麻烦不断!盘点苹果过去的一年惹上的“幺蛾子”
热门文章
- 图片放大缩小旋转左移右移镜像倒影android
- 生成主键ID,唯一键id,分布式ID生成器雪花算法代码实现
- mycat-sublun数据库分片
- 宝元系统通讯软件recon_企业即时通讯工具需注意哪些问题
- aspen和python一起使用_python-将$cond语句与$project一起使用并在PyMongo中聚合
- html源码加密ensure-china_php源码加密方法详解
- 【Spring第三篇】什么是Bean?
- 2114. 句子中的最多单词数
- Angular 在项目中使用fullcalendar 日程表
- php挂qq,PHP在线挂QQ个人隐私泄漏