Excel实战 第1章 数据处理
目录
- 1 数据规范
- 2. 导入数据
- 3. 数据清洗
- 3.1 重复数据处理
- 3.2 缺失数据处理
- 3.3 空格数据处理
- 4. 数据抽取
- 4.1 字段拆分
- 4.2 随机抽样
- 5. 数据合并
- 5.1 字段合并
- 5.2 字段匹配
- 6. 数据计算
- 6.2 日期计算 Datedif
- 6.3 数据标准化
- 6.4 加权求和
- 6.5 数据分组1——IF函数
- 6.6 数据分组2——Vlookup函数
1 数据规范
2. 导入数据
3. 数据清洗
3.1 重复数据处理
数据透视表法(首选)
选中A、B两列,点击【插入】–》【数据透视表】
把号码拉到【行】,这时候就给出了去重的结果,把【号码】拉到【行】标签的意思是按【号码】进行分组(即然是分组,就是去重后的结果,一个号码只有一个
再将【号码】拉入【 ∑ 值 \sum值 ∑值】(汇总区)进行计数,这就给出了每个号码出现的次数
对结果区右键,进行排序,选择降序,就可以看出 次数最多的号码,计数为 1 的代表不重复。
菜单删除法
第一步:选中数据区域
第二步:点击 【数据】-》【数据工具】–》【删除重复项】
这个方法可以给出去重的结果,但是不会给出那个【号码】重复了,不会给出重复了几次
- 条件格式标识法
第一步:选中【号码】列,单击【开始】–》【条件格式】–》【突出显示单元格规则】–》【重复值】
图中,重复的数据都被标红了
这个方法告诉你哪些数据重复了,但是,没有给你去重的结果、没告诉你重复了几次
高级筛选法
选中【号码】列,【数据】–》【筛选】边上的【高级】按钮
点击【将筛选结果复制到其他位置】,勾选【选择不重复的记录】,点击【确定】即可
给出了去重的结果,但是不会告诉你重复了几次
函数法(CountIF)
可以给出重复了几次
Range这个值,选择完之后,按F4固定,然后进行第 2 步操作
这个方法告诉你重复了几次,但是没有告诉你去重的结果
3.2 缺失数据处理
数据表中不能有合并单元格存在,将合并单元格拆分后,会出现很多空值,本节介绍空值补全
批量填充缺失的数据
取消合并单元格
定位条件:Ctrl+G或者F5,调出定位对话框,单击【定位条件】,
选择【空值】,
这时空值都被选中
然后按=,再按【向上箭头】
自动填充:Ctrl+Enter
就批量填充完毕
3.3 空格数据处理
3.3.1 Ctrl + H
3.3.2 Trim函数
4. 数据抽取
包括字段拆分(截取某一字段中的某一信息)和记录拆分(包括随机抽样、按某个分类字段进行记录分割)
4.1 字段拆分
Mid 是从字符串的中间第几位取几位字符,Left 和 Right 分别是从字符串的左边或右边取几位字符
假设【号码】的前 7 位是号段,包含特殊信息,需要提取
- 函数法
下面介绍 left 函数(right和left很类似,不做重新介绍)
Mid 函数
- 菜单法
更换为G1单元格
选择新的【目标区域】单元格,避免数据覆盖
没有多余列生成
4.2 随机抽样
本节介绍记录抽取的第2种方法,记录拆分
有 19648 个号码,从中随机抽取100个
首先,用Rand函数生成随机数
点击确定
双击小十字,完成批量计算
再用Rank函数进行排序
根据随机数进行排序,
双击小十字
完成
然后,再用填充的方式生成序列号
因为要抽取 100 个号码,就生成 1~100 的序列号,拖动小十字向下填充
直接松开的话,整列都是 1(相当于复制),松开鼠标前,点击 Ctrl ,就会变成1~100的序列
为了避免Rand函数每次点击鼠标都重新计算的问题,需要将其去公式(复制–>无公式粘贴值)。随机数和排名列都已经完成使命,所以我们将其去除公式,改为粘贴值的方式:
再用,Vlookup 函数进行匹配,进行随机抽样
0 代表精确匹配
5. 数据合并
5.1 字段合并
5.2 字段匹配
6. 数据计算
6.2 日期计算 Datedif
该函数在 EXCEL 函数库中无法查找,需要手动收入,
计算工龄,
回车后,双击 + 即可(批量完成),计算出工龄后,就可以进行工龄分布的分析,查看员工主要集中在什么分布
6.3 数据标准化
将数据按比例缩放,使之落入一个特定区间,消除不同量纲的不同
注意,F4 固定的作用在此体现,就是在点击 + 的时候(延续到整列),每行的计算都是选择这个范围。
再输入 右括号
回车
点击 + ,批量完成,最大值为 1,最小值为 0。注意,F4 固定的作用在此体现,就是在点击 + 的时候,每行的计算都是选择这个范围。
公式引用单元格,有“相对引用”与“绝对引用”
美元符号“ $ ”在excel公式中的作用是在“绝对引用”时,锁定行号或列标(单元格地址由列标+行号组成,如A1,A为列标,1为行号),“$”在哪个前边就锁定哪一个:
“A1”样式为“相对引用”,行号与列标都不锁定,横向拖动公式时,变为“B1”,竖向拖动公式时,变为“A2”;
“$ A$ 1”样式,锁定行号与列标,不管公式如何拖动,公式引用的$A$1都不会变化;
“$A1”样式,只锁定列标,公式竖向拖动时,引用变为“A$2”,横向拖动时,不变化;
“A$1”样式,只锁定行号,公式竖向拖动时,不变化,横向拖动时,引用变为“B$1”。
6.4 加权求和
某指标的权重,指该指标在整体评价体系中的相对重要程度,它表示,在其它结果不变的情况下,该指标的变化对结果的影响程度。
数据介绍
计算
6.5 数据分组1——IF函数
缺点
- IF 函数嵌套有层数限制(2007–2013为 64层,100层以上无法使用)
6.6 数据分组2——Vlookup函数
使用 Vlookup 函数时,首先要准备数据分组对应表,主要由阈值和分组标签组成,阈值需要进行升序排序(不是升序的话,结果不正确)。
模糊匹配:原理是查找区的首列,返回小于等于查找区的最大值,
下图为查找区,首列为【阈值】列,比如查找 35, 35 就是查找值,查找区的首列返回小于等于 35 的值中的最大值,下图中,小于等于 35 的有[0, 20],其中最大值为 20 ,且 20 对应的消费分组值为 [20, 40),恰好,35 就是在这个区间内。
下图分组标签为【消费分组】
Excel实战 第1章 数据处理相关推荐
- EXCEL实战 第2章 数据分析
目录 1. 对比分析 1.1 日期分组 1.2 环比计算 1.3 同比计算 2. 结构分析 3. 分布分析 3.1 VLooKup模糊匹配功能进行分组 3.2 数据透视表进行数值型数据分组 4. 交叉 ...
- SAP基底数据仓库实战项目(序章)
@数据仓库(SAP为基底,SqlServer,Oracle) SAP基底数据仓库实战项目(序章) 当你看到这篇文章得时候,想你必定是在搜寻数据仓库相关资料,或是遇到问题,兜兜转转来到这里.你们好,我是 ...
- 学习《深入浅出python量化交易交易实战》第一章(笔记)
1.学习<深入浅出python量化交易交易实战>第一章 记录学习过程中的代码和一些坑 1.1 基础(名词解释) 1.1.1 CAPM (Capital Asset Pricing Moda ...
- Xamarin iOS开发实战第1章使用C#编写第一个iOS应用程序
Xamarin iOS开发实战第1章使用C#编写第一个iOS应用程序 C#原本是用来编写Windows以及Windows Phone的应用程序.自从Xamarin问世后,C#的作用就发生了很大的变化. ...
- NGUI从入门到实战第1章开启NGUI学习之旅
NGUI从入门到实战第1章开启NGUI学习之旅 NGUI是Unity最重要的插件之一.使用NGUI可以高效地为游戏添加界面.本书将带领大家学习NGUI.作为NGUI学习之旅的第一站,本章会在整体上介绍 ...
- 原有磁盘上创建lvm_Linux 系统管理及服务配置实战-第12章 磁盘管理3(连载)
存储管理Ⅱ 1.逻辑卷LVM 1.1.LVM管理 在线扩容 online 数据迁移 online 创建LVM VG扩展/缩小 LV扩容 文件系统扩容 基本分区(MBR|GPT) ----> Fi ...
- python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)
目录 第二章(pandas) Python从零开始第三章数据处理与分析python中的dplyr(2) =============================================== ...
- [菜鸟SpringCloud实战入门]第九章:服务网关Zuul体验
前言 欢迎来到菜鸟SpringCloud实战入门系列(SpringCloudForNoob),该系列通过层层递进的实战视角,来一步步学习和理解SpringCloud. 本系列适合有一定Java以及Sp ...
- Java POI 对Excel合并单元格的数据处理
Java POI 对Excel合并单元格的数据处理 最近在项目开发过程中,有个一个导入Excel文件处理合并单元格数据的需求,就自己在网上找了一个模板,自己进行二次开发来开发需求. Excel工具类 ...
最新文章
- 计算机冒泡排序教学,绵竹职中计算机给冒泡排序教案.doc
- 手机加速度计数据可以被随意读取,iOS关不掉权限,安卓这次能限制
- ATEN—第九章OSPF多区域的配置
- nodejs接收post数据
- “西部云安全优才计划”落地西安,为云安全高质量发展夯实才智支撑
- Maven史上最全总结
- 鼠标划过图片进行缩放效果
- java中输入的程序_Java中输入的用法
- jenkins:集成sonar代码扫描+发送邮件
- 与网络计算机相比,和通信网络相比,计算机网络最本质的功能是什么
- spite用法 java_despite 和in spite of 用法
- C语言 55555图形 找车牌问题
- Delphi- repeate
- 实时数据库简介和比较
- VMware下载与安装教程(详细)
- 如何在 Unity 中制作一个道具系统
- matlab单边带调制仿真,000单边带调制MATLAB模拟仿真
- 交互设计:依据用户体验要素知识点,进行APP的分析和改良设计。
- Windows下的日志机制
- docker简单学习