python 数据去重_python 对数据常用的几种去重方式
一、对列表去重
1.用循环查找的方式
li = [1,2,3,3,4,2,3,4,5,6,1]
news_li = []
for i in li:
if i not in news_li:
news_li.append(i)
print (news_li)
2.用集合的特性set()
li1 = [1,4,3,3,4,2,3,4,5,6,1]
new_li1 = list(set(li1))
3.使用itertools模块的grouby方法
import itertools
li2 = [1,4,3,3,4,2,3,4,5,6,1]
li2.sort() # 排序
it = itertools.groupby(li2)
for k, g in it:
print (k)
4.运用while循环遍历的方式
def quchong(lb):
for x in lb:
while lb.count(x)>1:
del lb[lb.index(x)]
return lb
li3 = [1,4,3,3,4,2,3,4,5,6,1]
quchong(li3)
5.使用keys()方式
li4 = [1,0,3,7,7,5]
formatli = list({}.fromkeys(li4).keys())
print (formatli)
二、对数据框去重
1.用unique()对单属性列去重
import pandas as pd
data = {'id':['A','B','C','C','C','A','B','C','A'],'age':[18,20,14,10,50,14,65,14,98]}
data = pd.DataFrame(data)
data.id.unique()
# 或者
import numpy as np
np.unique(data.id)
2.用frame.drop_duplicates()对单属性列去重
data.drop_duplicates(['id'])
3.用frame.drop_duplicates()对多属性列去重
data.drop_duplicates(['id','age'])
4.用frame.duplicated()对多属性列去重
isduplicated = data.duplicated(['id','age'],keep='first')
data.loc[~isduplicated,:]
人生苦短,我用python!
python 数据去重_python 对数据常用的几种去重方式相关推荐
- Elasticsearch学习第二篇--常用的几种搜索方式
Elasticsearch学习第二篇--常用的几种搜索方式 一.Query String Search 查询全部 条件查询 二.Query DSL 查询全部 条件查询 三.Query Filter 四 ...
- spring入门之Spring 常用的三种注入方式
Spring 常用的三种注入方式 Spring 通过 DI(依赖注入)实现 IOC(控制反转),常用的注入方式主要有三种:构造方法注入,set 方法注入,基于注解的注入. 一.通过构造方法注入 先简单 ...
- pcb 理论阻值、 过孔_超实用!PCB设计中过孔常用的6种处理方式
原标题:超实用!PCB设计中过孔常用的6种处理方式 小伙伴们我们又见面啦! 上一次的" 神仙过孔 ",还没过瘾吧? <整齐的过孔固然符合审美,但是却...> 今天的小课 ...
- 【温故知新】——原生js中常用的四种循环方式
一.引言 本文主要是利用一个例子,讲一下原生js中常用的四种循环方式的使用与区别: 实现效果: 在网页中弹出框输入0 网页输出"欢迎下次光临" 在网页中弹出框输入1 网页输 ...
- Python selenium —— 一定要会用selenium的等待,三种等待方式解
转自 http://lib.csdn.net/article/48/50937?knId=1313 Python selenium -- 一定要会用selenium的等待,三种等待方式解 发现太多人 ...
- 常用的几种布局方式---Flex 布局(垂直居中展示)
常用的几种布局方式---Flex 布局(垂直居中展示) 前言 一.默认使用静态布局 二.flex布局 1.父元素container 1.1.display:flex 1.2.flex-directio ...
- vpwm的控制变频_变频器常用的几种控制方式
变频器常用的几种控制方式 变频器常用的几种控制方式 变频调速技术就是现代电力传动技术的重要发展方向 , 而作为变频调速系 统的核心-变频器的性能也越来越成为调速性能优劣的决定因素 , 除了变频器本 身 ...
- 三相llc 华为_华为电源常用的3种输入输出方式
UPS不间断电源应用领域越来越广泛,UPS不间断电源产品也不断的更新,UPS不间断电源应用领域不同,地区不同,我们的市电输入也不同,UPS不间断电源根据不同的使用领域环境,设计出应对不同领域市电输入, ...
- 分享一下目前市场上常用的八种推广方式,希望对你有帮助。
游戏推广的核心本质是什么?就是新增玩家,我来给大家分享一下目前市场上常用的八种推广方式,希望对你有帮助. 一呢,做工会,作为一个工会的老大来说呢,它是有领导效应,而且公会都有公会群,将来号召大家一起换 ...
- Map接口常用的几种遍历方式与小练习
Map接口常用的几种遍历方式与小练习 keyset:获取所有的键,我们可以通过键获取值 entryset:获取所有的键值对 values:获取所有的值:此方法只能获取到value,无法获取key pa ...
最新文章
- vim graphics
- Android Studio中ButterKnife插件的安装与使用
- 文本挖掘预处理流程总结(1)— 中文
- EntityFramework4.5使用Expression类创建动态查询及动态查询导航属性
- 科大星云诗社动态20210820
- 新型冠状病毒传染性有多强?何时达到峰值?来看一下数学和统计建模结果
- 50-20-010-kafka 配置-Listeners
- r730服务器内置SD卡位置,已解决: RE: 关于r730xd做存储服务器的疑问 - Dell Community...
- 我需要具备的知识和能力总结
- Atitit html5.1 新特性attilax总结
- 小福利,PMP考试真题刷起来,人人都当项目管理大师!
- 中国海洋科技发展迅速 海洋重器世界领先
- 路由器的路由选择协议详解
- Neo4j学习笔记(三) 导入数据
- 1788 	数量的类模板
- access_stratum_release version
- 地火明夷 (易經大意 韓長庚)
- Android如何判定一张图片是不是灰度的
- 使用Excel VBA制作成绩统计图----(嵌入模式)
- 每次压力大到爆,驾校教练总爱跑敬老院干这件事
热门文章
- linux 系统后门检测工具,Linux系统的各种后门和日志工具详细介绍[2]
- node MySQL buffer_node.js中buffer方法使用说明
- linux下wxr的权限,Day16-Linux权限知识和应用实践讲解
- Python脚本解密RSA加密密码
- kali linux切换更新源_使用Xshell链接Linux、kali更换更新源及kali安装软件
- webpack打包生成的map文件_从这十几个方面优化你的 Webpack 配置
- python字典遍历的4种方法
- python操作Excel的5种方式
- Python实现字符串反转的几种方法
- python中if not x: 和 if x is not None: 和 if not x is None的使用和区别