重复数据的处理

  • 识别重复数据
  • 删除重复数据

一、识别重复数据

  • 函数法
  • 高级筛选法
  • 条件格式法
  • 数据透视法
  1. 函数法

    函数:=countif(范围,条件)

    可以看出在列字段为A的范围内,“男”重复4次,“女”重复4次。
    那么,看到的重复项是第几个重复项呢?在countif函数中调节范围即可:=COUNTIF(A$2:A2,A2)----------A$2固定从A列的第二行开始,A2会变动,下拉时会变成A3,A4,A5...; ||   A$2:Ai: 范围从A的第2行到第i行。

    可以C2:男出现一次,C3:当下,男出现2次,C4:自此,男出现3次。C5:女第一次出现,C6:自此,女出现两次了。

  2. 高级筛选法

    开始--排序与筛选--筛选(高级)

    结果是:

    注:为什么会出现两个“男”呢?看我再做一个就明白啦。

    现在明白了吗,因为第一次做高级筛选时,没有表头,此时进行,会将第一个单元格的内容作为表头一起复制过去。

  3. 条件格式法

    选择区域--开始--条件格式--重复值

    选择自己需要的标识方式。我选第一种,可以看到,有重复的标红了。

  4. 数据透视法

    插入--数据透视表--创建数据透视表:选择用的区域和透视表放置区域---设置透视表:把表头拖到行和列的字段

    我选择在当前的工作表汇总汇总透视表

    透视表框架出现:

    在框架的最右边,可以设置透视表的行、列字段。
    将行字段设置为表头对应的内容,不难看出,每行的字段将为:男、女和未知。
    将列字段设置为表头的内容,列字段对应的是计数项,所以内容应为男、女和未知对应的个数。

    数据透视表创建成功:

    可以看出:“男”的重复个数为4,“女”的重复个数为14,“未知”的为1,总个数为19.

总结:

  • 函数法:根据范围选择不同,可以看到重复的个数,也可以得到这是第几个重复值。
  • 高级筛选法:将多余的去除,只留下唯一一个。
  • 条件格式法:将有重复项的标记,可以直观看出哪些有重复项。缺点是只能看到该内容是重复的,不能区分不同的内容的重复项。但可以灵活运用,如果重复项过多,将条件设为找唯一项,可以很快找唯一项也不错。
  • 数据透视法:将计算重复项这个工作直接做成表格,可以直观看到每个字段的重复个数。

二、删除重复数据

  • 通过菜单删除重复项
  • 通过排序删除重复项
  • 通过筛选删除重复项
  1. 通过菜单删除重复项

    数据--数据工具--删除重复项


    包括表头,共有20行,表头还是作为表头,内容为19个,结果是删除了16个重复值,留下了唯一值:男、女、和未知。(高级筛选法也可以有这个效果)

  2. 通过排序删除重复项(此处和书本可能有点不同,我觉得我这样做可能更方便些,所以记录我自己采用的那种)

    排序--删除
    对第一列,也就是我们想删除重复项的内容排序,将相同内容放在一起,通过countif,标记每个内容是第几个重复值,这几个重复值就是我们所需的
    第一列排序的效果是,女全在前面,男全在后面,countif的结果排序,效果是女列或者男这列,它们按属于第几个重复值排好序

    删除大于1的。

    同理删除“女”的大于1的。

  3. 通过筛选删除重复项(此处多加了点自己的想法)

    countif排序---排序--筛选--删除重复项,具体如下
    通过countif,标记每个内容是第几个重复值,这几个重复值就是我们所需的
    数据--排序和筛选:排序
    点击排序,出现下拉格

    因为靠第三列做筛选,所以点击第三列下拉框,会出现下面选项,把除了1以外的全部去掉。这里有几种方式都可以达到这个效果,我也在下面列出

    第二种方式:

    第一种结果如下:可以看出每个重复值有几个,然后复制粘贴到别处即可

    第二种方式结果:

    留下的就是唯一的了,把灰色筛选那个点一下,就变成不是灰色了,结果就出来了。

    总结

    • 通过菜单删除重复项:快捷。
    • 通过排序删除重复项:较为复杂,排序好还需人工看是否大于1,然后删除。
    • 通过筛选删除重复项:较为复杂,但比第二种好一点,可以自动先筛选大于1的,再删除。

转载于:https://www.cnblogs.com/linliyuan/p/7787611.html

《谁说菜鸟不会数据分析》数据处理 之 数据清洗--重复数据的处理相关推荐

  1. mysql重复数据处理_MySQL 处理重复数据

    MySQL 处理重复数据 有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 本章节我们将为大家介绍如何防止数据表出现重复数据及如何删 ...

  2. 谁说菜鸟不会数据分析 | 学习笔记 (全)

    一.前言 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律.在实际工作中, ...

  3. 读书笔记:《谁说菜鸟不会数据分析-入门篇》第1-4章

    读书笔记:<谁说菜鸟不会数据分析-入门篇> 第一章:数据分析是神马 数据分析分类: 1.数据分析分类: 描述性数据分析:常见方法:对比分析法.平均分析法.交叉分析法 探索性数据分析–发现数 ...

  4. 产品读书《谁说菜鸟不会数据分析(入门篇)》

    PPT查看1  PPT查看2   思维导图下载   ppt下载 什么是数据分析?怎么样才是数据分析的思维?数据分析的流程有哪些?常用的数据方法又有哪些?工具呢?可以学习的网站有哪些?我觉得<谁说 ...

  5. 超级菜鸟如何入门数据分析?

    大家好,我是宝器! 今天这篇文章是宝器在知乎上的一个问答,超级菜鸟如何入门数据分析? 我的回答全文大致如下(全文很长,建议收藏阅读): 经常看到很多朋友会问,入行数据分析之前我要不要学个java,学个 ...

  6. 《谁说菜鸟不会数据分析 入门篇》学习笔记

    前言: 最近疫情原因,在家准备把从图书馆借的书都看看,好好为将来做准备.这本书主要是EXCEL的操作,对于使用要求不高的我,感觉够用了.毕竟是入门篇,我感觉是跟数据分析的关系不太紧密,更多的是应该这么 ...

  7. 《谁说菜鸟不会数据分析》学习笔记 第一章总览 第二章数据分析思路

    网上的信息太琐碎了,根本没搞懂什么是数据分析方法什么是数据分析方法论,所以找了一本比较简单的书来系统学习一下,本来打算粗略看完,但是觉得这本书知识还是不错的,所以决定在未来一周把这本书用心学一下. 这 ...

  8. 谁说菜鸟不会数据分析-入门篇

    第一章 数据分析那些事儿  1.1 数据分析是"神马" 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据 ...

  9. 《谁说菜鸟不会数据分析》之数据分析

    什么是数据分析? 顾名思义,数据分析就是对数据进行分析. 可是,数据分析的真正定义是什么呢? 数据分析是指利用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总消化并理解,以最大化地开发数据 ...

  10. 菜鸟教程python3-Python数据分析,学习路径拆解及资源推荐

    原标题:Python数据分析,学习路径拆解及资源推荐 关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类: 一类是提供各种资源的推荐,比如书单.教程.以及学习的先后顺序: 另一类是 ...

最新文章

  1. [译] ASP.NET 生命周期 – ASP.NET 请求生命周期(四)
  2. .bash_pfofile、.bash_logout和.bashrc区别
  3. flex 会使div撑满_如何讲清楚Flex弹性盒模型(中)?
  4. java spring-webflux netty
  5. mysql5.7.23手动配置安装windows版
  6. Appium移动自动化测试之获取appPackage和appActivity
  7. 利用元数据管理数据质量
  8. SQLite_Android
  9. ORACLE查看某个表的索引状态
  10. ARM体系结构与编程模型总结
  11. 200+套HTML以及HTML5静态网页网站模板收藏
  12. Metadata 元数据信息详解
  13. 计算机网络嗅探实验,网络嗅探与欺骗实验
  14. Geode中使用PDX序列化最佳实践
  15. Java零基础P20使用IDEA开发
  16. 【3D】常见的3D模型格式介绍
  17. opencl入门介绍
  18. 【uniapp】页面下拉刷新
  19. Linux内核守护者来了
  20. Autogrid5划分网格

热门文章

  1. 几种常用的操作系统调度策略
  2. 国产操作系统有哪些,你知道吗?
  3. 小米手机安装欧洲版系统(MIUI12) 详细安装教程
  4. 入门级概述光学相干层析(OCT)原理
  5. 曾经的移动应用推广八法尚能饭否?再加一法大概就事半功倍!
  6. Intent.ACTION_VIEW
  7. 解决Linux系统不能上网问题
  8. php判断无理数,重新整理证明:无理数在数轴上不存在的逻辑证明
  9. 对于无线网络经常掉线的问题
  10. 学完了Scratch,我要开始学Python了~~~