一、对列表去重

1.用循环查找的方式

li = [1,2,3,3,4,2,3,4,5,6,1]

news_li=[]for i inli:if i not innews_li:

news_li.append(i)print (news_li)

2.用集合的特性set()

li1 = [1,4,3,3,4,2,3,4,5,6,1]

new_li1= list(set(li1))

3.使用itertools模块的grouby方法

importitertools

li2= [1,4,3,3,4,2,3,4,5,6,1]

li2.sort()#排序

it =itertools.groupby(li2)for k, g init:print (k)

4.运用while循环遍历的方式

defquchong(lb):for x inlb:while lb.count(x)>1:dellb[lb.index(x)]returnlb

li3= [1,4,3,3,4,2,3,4,5,6,1]

quchong(li3)

5.使用keys()方式

li4 = [1,0,3,7,7,5]

formatli=list({}.fromkeys(li4).keys())print (formatli)

二、对数据框去重

1.用unique()对单属性列去重

importpandas as pd

data= {'id':['A','B','C','C','C','A','B','C','A'],'age':[18,20,14,10,50,14,65,14,98]}

data=pd.DataFrame(data)

data.id.unique()#或者

importnumpy as np

np.unique(data.id)

2.用frame.drop_duplicates()对单属性列去重

data.drop_duplicates(['id'])

3.用frame.drop_duplicates()对多属性列去重

data.drop_duplicates(['id','age'])

4.用frame.duplicated()对多属性列去重

isduplicated = data.duplicated(['id','age'],keep='first')

data.loc[~isduplicated,:]

python去重语句_python常用的去重方式相关推荐

  1. python去重语句_Python对列表去重的多种方法(四种方法)

    无聊统计了下列表去重到底有多少种方法.下面小编给大家总结一下,具体内容详情如下: 开发中对数组.列表去重是非常常见的需求,对一个list中的id进行去重,有下面几种方法,前面两种方法不能保证顺序, 后 ...

  2. python去重语句_Python Dataframe 指定多列去重、求差集的方法

    1)去重 指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数据进行去重. Attention:主要用到了drop_du ...

  3. python清空语句_python有趣语句

    python 赋值语句 python中的语句: 赋值语句 if语句,当条件成立时运行语句块.经常与else, elif(相当于else if)配合使用. for语句,遍列列表.字符串.字典.集合等迭代 ...

  4. python入门语句_Python 快速入门笔记(5):语句

    本系列随笔是本人的学习笔记,初学阶段难免会有理解不当之处,错误之处恳请指正.转载请注明出处: https://www.cnblogs.com/itwhite/p/12297769.html. 简介 p ...

  5. python pp模块_python常用模块

    1.re模块 re模块用于对python的正则表达式的操作 1.1 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物 ...

  6. python打印语句_Python 打印语句

    Python 打印语句 首先申明下,本文为笔者学习<Python学习手册>的笔记,并加入笔者自己的理解和归纳总结. 1.print语句用来打印,并在行的末尾添加一个换行.>>& ...

  7. python数组去重函数_Python常用功能函数系列总结(一)

    本节目录 常用函数一:获取指定文件夹内所有文件 常用函数二:文件合并 常用函数三:将文件按时间划分 常用函数四:数据去重 写在前面 写代码也有很长时间了,总觉得应该做点什么有价值的事情,写代码初始阶段 ...

  8. python函数几个return语句_Python常用函数--return 语句-阿里云开发者社区

    在Python教程中return 语句是函数中常用的一个语句. return 语句用于从函数中返回,也就是中断函数.我们也可以选择在中断函数时从函数中返回一个值. 案例(保存为 function_re ...

  9. python的常用语句_python常用语句

    python常用语句 一:判断语句: 所谓判断语句,就是指满足某些条件之后,才允许做的事情,而不满足条件,是不允许做的.例如在现实生活中,我们过马路时要看红绿灯,只有出现红灯的时候,我们才能过马路,否 ...

最新文章

  1. C++ 向量(vector) 的使用
  2. 【LeetCode每周算法】零钱兑换
  3. 简单配置基于桥接,RIP,NAT,PAT的网络拓扑
  4. 关于jquerymobile的预加载
  5. 【C++】Visual Studio教程(一)-概述
  6. 路由器的基本配置--荣新IT培训带给我的......(三)
  7. 【转】Win10系统创建WiFi热点的两种方法
  8. netty的零拷贝、架构设计、ByteBuf扩容机制详解
  9. python 图形化开发用什么模块_用python进行GUI开发的选择/python的GUI模块(图形界面开发库)...
  10. java堆外内存为何比java堆更适合用来进行网络IO操作
  11. jquery name选择器_jQuery学习(1)
  12. python3帮助文档-中文
  13. vray for 3dmax2022 中文版
  14. 第一篇:初识信息系统监理工程师
  15. 密码生成器(字母+数字+特殊字符)
  16. 02_如何计算叔块奖励
  17. 两个运放制作加法器_初级模拟电路:8-2 加法与减法电路
  18. 人工智能数学基础1:三角函数的定义、公式及固定角三角函数值
  19. LTE网络PCI规划
  20. dreamweaver cs4 css汉化补丁,dreamweaver cs4官方版

热门文章

  1. 解决 adobe reader 只能翻页,不能滚动的问题
  2. 动态规划01背包问题入门学习,详细笔记,推荐阅读
  3. paper reading:Part-based Graph Convolutional Network for Action Recognition
  4. basys3利用microblaze连接Pmod OLEDrgb
  5. 在同一个数据库表中添加不同的数据(笛卡尔积)
  6. [转载] Python利用pandas处理Excel数据的应用
  7. [转载] Java异常:选择Checked Exception还是Unchecked Exception?
  8. python socket 连续send,出现粘包问题
  9. Druid数据库连接池配置
  10. [NOIP2003普及组]麦森数(快速幂+高精度)