数据处理

(一)重复数据的处理

(1)函数法:COUNTIF(range,criterial)

range:要计数的单元格范围

criterial:计算条件

eg:A列:员工编号;B列:每个员工编号出现的次数;C列:查找出现两次及其以上的重复项,以C9为例,即表示A466074从A1到A9是第3次重复出现。

(2)高级筛选法:

a.选择数据单元格区域A1::11

b.开始---筛选---高级筛选---选择“将筛选结果复制到其他位置”---在复制到文本框输入另一个存放的区域---勾选“选择不重复记录”复选框---单击确定按钮

(3)条件格式法

选择单元格区域---开始---条件格式---突出显示单元格规则---重复值---将重复值和所在单元格标为不同颜色

(4)数据透视表法

用数据透视表统计各数据出现的频次,出现两次及以上就说明该数据属于重复项,若统计结果为1这说明该数据没有重复出现。

a.单击“插入”选项卡---单击“数据透视表”按钮---在弹出的是“数据透视表”对话框“选择一个表或区域”中,选择数据源单元格范围

b.将“编号”字段拖至行标签---再将“编号”字段拖至数值汇总区域

由以上可知,高级筛选法和数据透视表最便捷。

(二)删除重复数据

(1)通过菜单操作删除重复项

a.选择A1::11区域---数据选项卡---单击删除重复项---在“列”区域下选择要删除的列---单击确定

(2)排序删除重复项

利用前面的COUNTIF系列的第二次重复标记,先排序,然后删掉大于1的行就行

(3)筛选删除重复项

数据清洗(一)-----------重复数据处理相关推荐

  1. 机器学习数据清洗之异常数据处理、标准差法、MAD法、箱图法、图像对比法、异常值处理准则

    机器学习数据清洗之异常数据处理.标准差法.MAD法.箱图法.图像对比法.异常值处理准则 目录

  2. 数据库,唯一索引,重复数据处理

    为什么80%的码农都做不了架构师?>>>    //唯一索引,重复数据处理 1.为母表建立唯一主键(主键为自增,此字段在后面删除记录时会用到),同时 建立和母表一样的临时表(此表要建 ...

  3. Python 数据分析三剑客之 Pandas(八):数据重塑、重复数据处理与数据替换

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  4. Flink 去除重复数据 重复数据处理

    Flink 去除重复数据 重复数据处理 方式一:流转表 // 计算iopvSingleOutputStreamOperator<FundIopvIndicators> streamOper ...

  5. 数据清洗:相似重复记录检测算法SNM及其Python实现

    1. 相似重复记录删除   相似重复记录是指数据库中存在这样的两条记录R1R_{1}R1​和R2R_{2}R2​,他们的内容相同或者相似,且都对应着同一个现实实体,则记录对<R1,R2>& ...

  6. python实现数据清洗(重复值+缺失值+异常值处理)

    实现功能: python实现数据清洗,对重复记录.缺失值.异常值进行检测,并对其进行处理. 实现代码: # 导入需要的库 import numpy as np import pandas as pdd ...

  7. python去重复的数据_python - 常用数据清洗方法-重复项处理

    在数据的处理过程中,一般都需要进行数据清洗工作,如数据集是否存在重复,是否存在缺失,数据是否具有完整性和一致性,数据中是否存在异常值等.发现诸如此类的问题都需要针对性地处理,下面我们一起学习常用的数据 ...

  8. Pandas 重复数据处理大全

    作者 | 东哥起飞 来源 | Python数据科学 本次来介绍重复值处理的常用方法. 重复值处理主要涉及两个部分,一个是找出重复值,第二个是删除重复值,也就是根据自己设定的条件进行删除操作. 定位重复 ...

  9. 【Python】pandas 重复数据处理大全(附代码)

    所有数据和代码可在GitHub获取: https://github.com/xiaoyusmd/PythonDataScience 本次来介绍重复值处理的常用方法. 重复值处理主要涉及两个部分,一个是 ...

最新文章

  1. ACdream OJ 1140 Counting Triangles
  2. 万向锁的简单数学解释
  3. 意想不到!WordPress安全漏洞98%来自插件
  4. mysql 语句怎样修饰约束_MySQL中的约束,添加约束,删除约束,以及一些其他修饰讲解...
  5. SpringBoot Mybatis EnumTypeHandler自定义统一处理器
  6. 悲观锁 引起死锁_悲观锁定时如何避免可怕的死锁-以及Java 8的一些用法!
  7. python scipy库函数solve用法_如何在中使用事件scipy.integrate.solve_ivp
  8. C++工作笔记-对继承的进一步认识
  9. 计算机硬件技术基础第四章ppt,管理N计算机硬件技术基础第4章.ppt
  10. foxmail占cpu 100%解决办法
  11. 荒野大镖客ol 服务器位置,荒野大镖客2ol盗贼在什么位置?盗贼具体位置分享
  12. C++ Opencv 安装配置
  13. linux虚拟化cpu的绑定,为虚拟机vCPU绑定物理CPU
  14. 海龟绘图简易教程|Turtle for Python
  15. 2019辽宁公务员考试行测常识大全:公务员常识40000问(五十九)(2)
  16. Outlook 2016 配置QQ邮箱
  17. 欢喜传媒2021年报:亏损收窄背后,影视行业静待春暖花开
  18. OpenFoam编程笔记——starccm网格转openfoam格式
  19. opencv学习笔记三十六:AKAZE特征点检测与匹配
  20. Qlikview Data Modeling---创建一个Key/Link Table

热门文章

  1. MEMS传感器的6大种类简介-传感器专题
  2. 五款开源内容管理平台对比(免费部分):bolo/fastadmin/wordpress/zblog/redmine
  3. linux shell脚本编写 | 三角形 | 梯形 | 菱形 | 九九乘法表 | 矩形 | 超详细
  4. 25.Linux系统忘记登录密码解决办法(别着急,还能抢救一下)
  5. Spring MVC过滤器-HttpPutFormContentFilter
  6. 获取全国行政区域划分数据
  7. nginx启动、关闭、重启及常用的命令
  8. 现代交通灯的设计C语言编程,交通灯设计_优秀论文.doc
  9. DSP28035控制舵机
  10. Vi编辑器的常用命令2(文件操作)