目录

  • 1 数据规范
  • 2. 导入数据
  • 3. 数据清洗
    • 3.1 重复数据处理
    • 3.2 缺失数据处理
    • 3.3 空格数据处理
  • 4. 数据抽取
    • 4.1 字段拆分
    • 4.2 随机抽样
  • 5. 数据合并
    • 5.1 字段合并
    • 5.2 字段匹配
  • 6. 数据计算
    • 6.2 日期计算 Datedif
    • 6.3 数据标准化
    • 6.4 加权求和
    • 6.5 数据分组1——IF函数
    • 6.6 数据分组2——Vlookup函数

1 数据规范

2. 导入数据

3. 数据清洗

3.1 重复数据处理

  1. 数据透视表法(首选)
    选中A、B两列,点击【插入】–》【数据透视表】

    把号码拉到【行】,这时候就给出了去重的结果,把【号码】拉到【行】标签的意思是按【号码】进行分组(即然是分组,就是去重后的结果,一个号码只有一个

    再将【号码】拉入【 ∑ 值 \sum值 ∑值】(汇总区)进行计数,这就给出了每个号码出现的次数

    对结果区右键,进行排序,选择降序,就可以看出 次数最多的号码,计数为 1 的代表不重复。

  2. 菜单删除法
    第一步:选中数据区域

第二步:点击 【数据】-》【数据工具】–》【删除重复项】


这个方法可以给出去重的结果,但是不会给出那个【号码】重复了,不会给出重复了几次

  1. 条件格式标识法
    第一步:选中【号码】列,单击【开始】–》【条件格式】–》【突出显示单元格规则】–》【重复值】


    图中,重复的数据都被标红了

这个方法告诉你哪些数据重复了,但是,没有给你去重的结果、没告诉你重复了几次

  1. 高级筛选法
    选中【号码】列,【数据】–》【筛选】边上的【高级】按钮

    点击【将筛选结果复制到其他位置】,勾选【选择不重复的记录】,点击【确定】即可

    给出了去重的结果,但是不会告诉你重复了几次

  2. 函数法(CountIF)
    可以给出重复了几次

    Range这个值,选择完之后,按F4固定,然后进行第 2 步操作

    这个方法告诉你重复了几次,但是没有告诉你去重的结果

3.2 缺失数据处理

数据表中不能有合并单元格存在,将合并单元格拆分后,会出现很多空值,本节介绍空值补全

批量填充缺失的数据
取消合并单元格

定位条件:Ctrl+G或者F5,调出定位对话框,单击【定位条件】,

选择【空值】,

这时空值都被选中

然后按=,再按【向上箭头】

自动填充:Ctrl+Enter

就批量填充完毕

3.3 空格数据处理

3.3.1 Ctrl + H


3.3.2 Trim函数


4. 数据抽取

包括字段拆分(截取某一字段中的某一信息)和记录拆分(包括随机抽样、按某个分类字段进行记录分割)

4.1 字段拆分


Mid 是从字符串的中间第几位取几位字符,Left 和 Right 分别是从字符串的左边或右边取几位字符
假设【号码】的前 7 位是号段,包含特殊信息,需要提取

  1. 函数法
    下面介绍 left 函数(right和left很类似,不做重新介绍)



    Mid 函数

  2. 菜单法





更换为G1单元格

选择新的【目标区域】单元格,避免数据覆盖


没有多余列生成

4.2 随机抽样

本节介绍记录抽取的第2种方法,记录拆分

有 19648 个号码,从中随机抽取100个

首先,用Rand函数生成随机数

点击确定

双击小十字,完成批量计算

再用Rank函数进行排序

根据随机数进行排序,

双击小十字

完成

然后,再用填充的方式生成序列号
因为要抽取 100 个号码,就生成 1~100 的序列号,拖动小十字向下填充

直接松开的话,整列都是 1(相当于复制),松开鼠标前,点击 Ctrl ,就会变成1~100的序列


为了避免Rand函数每次点击鼠标都重新计算的问题,需要将其去公式(复制–>无公式粘贴值)。随机数和排名列都已经完成使命,所以我们将其去除公式,改为粘贴值的方式:

再用,Vlookup 函数进行匹配,进行随机抽样

0 代表精确匹配

5. 数据合并

5.1 字段合并

5.2 字段匹配

6. 数据计算

6.2 日期计算 Datedif

该函数在 EXCEL 函数库中无法查找,需要手动收入,

计算工龄,


回车后,双击 + 即可(批量完成),计算出工龄后,就可以进行工龄分布的分析,查看员工主要集中在什么分布

6.3 数据标准化

将数据按比例缩放,使之落入一个特定区间,消除不同量纲的不同

注意,F4 固定的作用在此体现,就是在点击 + 的时候(延续到整列),每行的计算都是选择这个范围。


再输入 右括号

回车

点击 + ,批量完成,最大值为 1,最小值为 0。注意,F4 固定的作用在此体现,就是在点击 + 的时候,每行的计算都是选择这个范围。

公式引用单元格,有“相对引用”与“绝对引用”

美元符号“ $ ”在excel公式中的作用是在“绝对引用”时,锁定行号或列标(单元格地址由列标+行号组成,如A1,A为列标,1为行号),“$”在哪个前边就锁定哪一个:

“A1”样式为“相对引用”,行号与列标都不锁定,横向拖动公式时,变为“B1”,竖向拖动公式时,变为“A2”;

“$ A$ 1”样式,锁定行号与列标,不管公式如何拖动,公式引用的$A$1都不会变化;

“$A1”样式,只锁定列标,公式竖向拖动时,引用变为“A$2”,横向拖动时,不变化;

“A$1”样式,只锁定行号,公式竖向拖动时,不变化,横向拖动时,引用变为“B$1”。

6.4 加权求和

某指标的权重,指该指标在整体评价体系中的相对重要程度,它表示,在其它结果不变的情况下,该指标的变化对结果的影响程度。

数据介绍


计算






6.5 数据分组1——IF函数

缺点

  • IF 函数嵌套有层数限制(2007–2013为 64层,100层以上无法使用)








6.6 数据分组2——Vlookup函数

使用 Vlookup 函数时,首先要准备数据分组对应表,主要由阈值和分组标签组成,阈值需要进行升序排序(不是升序的话,结果不正确)。

模糊匹配:原理是查找区的首列,返回小于等于查找区的最大值,

下图为查找区,首列为【阈值】列,比如查找 3535 就是查找值,查找区的首列返回小于等于 35 的值中的最大值,下图中,小于等于 35 的有[0, 20],其中最大值为 20 ,且 20 对应的消费分组值为 [20, 40),恰好,35 就是在这个区间内。

下图分组标签为【消费分组】




Excel实战 第1章 数据处理相关推荐

  1. EXCEL实战 第2章 数据分析

    目录 1. 对比分析 1.1 日期分组 1.2 环比计算 1.3 同比计算 2. 结构分析 3. 分布分析 3.1 VLooKup模糊匹配功能进行分组 3.2 数据透视表进行数值型数据分组 4. 交叉 ...

  2. SAP基底数据仓库实战项目(序章)

    @数据仓库(SAP为基底,SqlServer,Oracle) SAP基底数据仓库实战项目(序章) 当你看到这篇文章得时候,想你必定是在搜寻数据仓库相关资料,或是遇到问题,兜兜转转来到这里.你们好,我是 ...

  3. 学习《深入浅出python量化交易交易实战》第一章(笔记)

    1.学习<深入浅出python量化交易交易实战>第一章 记录学习过程中的代码和一些坑 1.1 基础(名词解释) 1.1.1 CAPM (Capital Asset Pricing Moda ...

  4. Xamarin iOS开发实战第1章使用C#编写第一个iOS应用程序

    Xamarin iOS开发实战第1章使用C#编写第一个iOS应用程序 C#原本是用来编写Windows以及Windows Phone的应用程序.自从Xamarin问世后,C#的作用就发生了很大的变化. ...

  5. NGUI从入门到实战第1章开启NGUI学习之旅

    NGUI从入门到实战第1章开启NGUI学习之旅 NGUI是Unity最重要的插件之一.使用NGUI可以高效地为游戏添加界面.本书将带领大家学习NGUI.作为NGUI学习之旅的第一站,本章会在整体上介绍 ...

  6. 原有磁盘上创建lvm_Linux 系统管理及服务配置实战-第12章 磁盘管理3(连载)

    存储管理Ⅱ 1.逻辑卷LVM 1.1.LVM管理 在线扩容 online 数据迁移 online 创建LVM VG扩展/缩小 LV扩容 文件系统扩容 基本分区(MBR|GPT) ----> Fi ...

  7. python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)

    目录 第二章(pandas) Python从零开始第三章数据处理与分析python中的dplyr(2) =============================================== ...

  8. [菜鸟SpringCloud实战入门]第九章:服务网关Zuul体验

    前言 欢迎来到菜鸟SpringCloud实战入门系列(SpringCloudForNoob),该系列通过层层递进的实战视角,来一步步学习和理解SpringCloud. 本系列适合有一定Java以及Sp ...

  9. Java POI 对Excel合并单元格的数据处理

    Java POI 对Excel合并单元格的数据处理 最近在项目开发过程中,有个一个导入Excel文件处理合并单元格数据的需求,就自己在网上找了一个模板,自己进行二次开发来开发需求. Excel工具类 ...

最新文章

  1. 计算机冒泡排序教学,绵竹职中计算机给冒泡排序教案.doc
  2. 手机加速度计数据可以被随意读取,iOS关不掉权限,安卓这次能限制
  3. ATEN—第九章OSPF多区域的配置
  4. nodejs接收post数据
  5. “西部云安全优才计划”落地西安,为云安全高质量发展夯实才智支撑
  6. Maven史上最全总结
  7. 鼠标划过图片进行缩放效果
  8. java中输入的程序_Java中输入的用法
  9. jenkins:集成sonar代码扫描+发送邮件
  10. 与网络计算机相比,和通信网络相比,计算机网络最本质的功能是什么
  11. spite用法 java_despite 和in spite of 用法
  12. C语言 55555图形 找车牌问题
  13. Delphi- repeate
  14. 实时数据库简介和比较
  15. VMware下载与安装教程(详细)
  16. 如何在 Unity 中制作一个道具系统
  17. matlab单边带调制仿真,000单边带调制MATLAB模拟仿真
  18. 交互设计:依据用户体验要素知识点,进行APP的分析和改良设计。
  19. Windows下的日志机制
  20. docker简单学习

热门文章

  1. FreeBSD+XP双系统
  2. 电脑重装系统后台式电脑网卡坏了怎么修复
  3. java打好基础的100道题库(勇敢牛牛不怕困难)
  4. 酒仙网都准备IPO啦,郝鸿峰开始发飙颠覆啦哈
  5. 安卓蓝牙操作+蓝牙工具类
  6. word毕设论文制作——封面(一)
  7. 山东2016年高考高校理工科录取人数统计
  8. FPGA:逻辑函数的卡诺图化简法
  9. 2017ACM暑期多校联合训练 - Team 8 1011 HDU 6143 Killer Names (容斥+排列组合,dp+整数快速幂)...
  10. python写一个简单的12306抢票