实现步骤:

1、采用drop_duplicates对数据去两次重,一次将重复数据全部去除(keep=False)记为data1,另一次将重复数据保留一个(keep='first)记为data2;
2、求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=False)

data1 = df.drop_duplicates(keep=False)  # 将重复数据全部去除
data2 = df.drop_duplicates(keep='first')  # 将重复数据只保留一个
cll = data2.append(data1).drop_duplicates(keep=False)  # 此时原来的重复数据不算重复,原来不重复的数据变成重复数据去除掉了
print(cll)

Pandas重复数据的查看和去重相关推荐

  1. Mysql数据库中查询重复数据和去重数据 , 删除重复数据的sql及分析

    数据库中有重复数据时,用到哪些sql语句? 建表: CREATE TABLE `user` (`id` bigint(255) NOT NULL AUTO_INCREMENT,`name` varch ...

  2. python对大量数据去重_Python对多属性的重复数据去重实例

    python中的pandas模块中对重复数据去重步骤: 1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显 ...

  3. pandas读取excel数据并对重复数据进行标记或者删除

    pandas通常在读取excel数据之后,如果需要进行去重,有两种方式,一种是进行标记,另一种是在pandas中直接去重 如下图所示,excel数据: (1)使用drop_duplicates(sub ...

  4. 【pandas】dataframe中重复数据比较、筛选、去除等

    当需要的是DataFrame那些重复数据,尤其是要比较重复数据的异同时,就需要将重复数据提取出来时,再关联原数据,并做排序,进行比较. 方法一.主要思路: 1. 采用drop_duplicates对数 ...

  5. pandas删除重复数据

    https://blog.csdn.net/weixin_42322206/article/details/127673480 1.pandas中重复索引问题 df = df[~df.index.du ...

  6. 【pandas】查找重复数据 df.duplicated() 、删除重复数据 df.drop_duplicates()

    数据准备 import pandas as pdtrain = pd.read_csv(r"../input/titanic/train.csv") train.head() 查看 ...

  7. execl筛选去重_EXCEL之--巧用公式+筛选去除重复数据

    平时除了vlookup(点击查看详解)外,恐怕被问起最多的就属去除重复数据了,重复数据产生的原因很多种,录入重复 .数据合并后重复等等.最后的数据形式就是有一个关键字重复或者整行数据都有重复.整行重复 ...

  8. pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)

    pandas使用duplicated函数删除dataframe中重复列名称的数据列.默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe) ...

  9. pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)

    pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...

最新文章

  1. 减肥难?别急,精准调控细菌的方法已横空出世!
  2. 数据纪实|颜强:疫情下的中国制造
  3. 计算机考研专业课资料,计算机考研专业课资料.doc
  4. 44. 源代码解读-RocketMQ-架构
  5. 【Python数据结构】——二叉查找树(查找、构建、删除、插入、打印)
  6. c struct 对齐_C中的struct大小| 填充,结构对齐
  7. 奔驰又召回了!“方便进出”功能翻车
  8. Reading Club·Beijing第1期DeepQA框架与Siri架构会场笔记(PPT下载)
  9. Openssl crl2pkcs7命令
  10. Redis学习与实战之列表
  11. c语言考研必刷题小程序,小程序推荐:大学生必备刷题小程序,内容涵盖各种证书考试题型...
  12. 教育企业邮箱购买哪个好用,还有英文邮件系统?
  13. 紫光展锐发布系统级安全的高性能5G SoC移动平台T820
  14. python 微信公众号开发[1] 后台服务器端配置与公众号开发配置
  15. 全国青少年编程等级考试python一级真题2021年3月(含题库答题软件账号)
  16. <video>标签及属性说明
  17. 浅析微信小程序生命周期之应用生命周期
  18. 行星齿轮传动电动滚筒设计【设计说明书(论文)+11张CAD图纸】
  19. 【强哥推荐】VSCode常用快捷键配置文件表、代码片段,记得收藏
  20. 我们是如何连上WiFi的?

热门文章

  1. 你还不知道怎么退出 Vim?
  2. 串口UART串行总线协议
  3. Cortex-M3工作模式与异常
  4. mysql把select结果存到变量中_mysql实例 select into保存到变量的例子
  5. http 请求默认时间_JMeter接口测试之HTTP请求默认值
  6. cython python3_30倍!使用Cython加速Python代码
  7. make 命令_make考点总结(建议中、高考学生收藏)
  8. 如何 给给软件开发 添加 代理_敏捷开发是如何被跑偏的
  9. java 2分钟_java开发中的那些事(5)--------一点经历,败给2分钟的2个小时
  10. 二、PHP框架Laravel学习笔记——路由的定义和控制器