1. 迭代删除重复项:先排序列表项,然后通过新迭代(not in)去除重复项,分片打印

def sanitize(time_string):

if '-' in time_string:

splitter = '-'

elif ':' in time_string:

splitter = ':'

else:

return (time_string)

(mins, secs)=time_string.split(splitter)

return(mins + '.' + secs)

with open ('james.txt') as jas: data = jas.readline()

james=data.strip().split(',')

print('before sort and senitize, unique for james',james)

james=sorted ([sanitize(t) for t in james])

unique_james=[]

for each_t in james:

if each_t not in unique_james:

unique_james.append(each_t)

print('First 3 time for james',unique_james[0:3])

=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========

before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']

First 3 time for james ['2.01', '2.22', '2.34']

2. 集合删除重复项:先set创建集合去除重复项,然后进行排序,分片打印

def sanitize(time_string):

if '-' in time_string:

splitter = '-'

elif ':' in time_string:

splitter = ':'

else:

return (time_string)

(mins, secs)=time_string.split(splitter)

return(mins + '.' + secs)

with open ('james.txt') as jas: data = jas.readline()

james=data.strip().split(',')

print('before sort and senitize, unique for james',james)

james=sorted (set([sanitize(t) for t in james]))

print('First 3 time for james',james[0:3])

=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========

before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']

First 3 time for james ['2.01', '2.22', '2.34']

3.精简代码,创建一个小函数rmspace去除空白符,通过函数调用分片打印

def sanitize(time_string):

if '-' in time_string:

splitter = '-'

elif ':' in time_string:

splitter = ':'

else:

return (time_string)

(mins, secs)=time_string.split(splitter)

return(mins + '.' + secs)

def rmspace(file):

with open(file) as fo: data=fo.readline()

return data.strip().split(',')

james=rmspace('james.txt')

print('before sort and senitize, unique for james',james)

print('First 3 time for james',sorted(set([sanitize(t) for t in james]))[0:3])

=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========

before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']

First 3 time for james ['2.01', '2.22', '2.34']

python集合如何去除重复数据_Python 迭代删除重复项,集合删除重复项相关推荐

  1. python队列get不到数据_Python队列.get(block=true)添加项时不返回超时

    我的python应用程序中有2个线程. 线程A(好吧,基本上是"main"线程)向队列中添加项目. 线程B正在从队列中获取它.在 代码A:def addTrade(self, da ...

  2. pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)

    pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...

  3. python对csv去除重复行_Python 去重csv文件中相同的重复行

    读取CSV 读取CSV文件由两种方式: 第一种 import csvwith open('data.csv','r',encoding = 'utf8') as fp: reader = csv.re ...

  4. list可以存放python中任意类型的数据_Python中常见的数据类型小结

    Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种一一介绍: 一 序列 1.列表list 列表是一种有序的 ...

  5. python集合和字典的区别_Python中的字典和集合

    导语:本文章记录了本人在学习Python基础之数据结构篇的重点知识及个人心得,打算入门Python的朋友们可以来一起学习并交流. 本文重点: 1.掌握常见的字典创建,查询,判别方法: 2.了解字典中的 ...

  6. python中显示第三行数据_Python数据分析及可视化-小测验

    image.png 首先将5题的文件复制形成副本,如下图所示: image.png 在资源管理器的路径中输入cmd,如下图所示: image.png 在上图中输入后,按Enter键运行进入cmd窗口. ...

  7. python去重保留唯一一个值_Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)...

    摘要 在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值. 这里就简单的介绍一下对于DataFrame去重和取重复值的操作. 创建DataFrame 这里首先创建一个 ...

  8. python 基础语法处理一组数据_Python 基础语法

    注释的分类 1.单行注释 以"#"开头,#右边的所有东西当做说明,而不是真正要执行的程序,起辅助说明作用 # 我是注释,可以在里写一些功能说明之类的哦 print('hello w ...

  9. python处理pdf提取指定数据_python从PDF中提取数据的示例

    01 前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都 ...

最新文章

  1. 倒计时3天!华为畅想未来智能车大赛报名即将截止,已报名选手请提交参赛PPT!
  2. bcc校验码计算_CRC校验你会吗?计算、校验、C语言实现,三步教你轻松搞定
  3. 新鲜出炉!20款好看的英文字体下载
  4. 各种排序实现以及稳定性分析
  5. 系列(五)—MySql
  6. 洛谷P4727:图的同构计数(Polya引理)(dfs)
  7. 【Linux 命令学习第三天】
  8. (筆記) 如何為ModelSim加入永久性的library mapping? (SOC) (ModelSim)
  9. CodeMeter的功能介绍
  10. 解决安装MATLAB2018a后出现License Manager Error -8的问题
  11. Web 前端:知道这些,至少有底气去面试了
  12. Linux基本操作命令 实验
  13. 一位 中国70 后老程序员的 26 个职场感悟
  14. MATLAB打不开,只在任务栏闪一下就无反应了怎么办?
  15. H无穷控制学习笔记——H无穷/H2控制
  16. 随意发软件如何自动发帖已更新2022
  17. 我知道苏宁会玩,但没想到它能把“千人千面”玩到了极致
  18. Ubuntu18.04 无法解析域名
  19. Word 标题前添加一颜色竖线条
  20. bam文件读取_把bam文件读入R,并且转为grange对象

热门文章

  1. Moloch安装与使用
  2. 数据结构--树与二叉树
  3. 订阅号和服务号有什么区别?哪种更好?企业该如何选择?
  4. 学习计算机的英语口语,最实用的英语口语学习技巧
  5. PHP微信公众平台开发高级篇--群发接口
  6. 齐岳钹形|UFO形|花生形|碗形Janus PS聚合物微球
  7. 使用无线WIFI模块NodeMCU Lua V3物联网开发板8266-01/01S 在Arduino搭建环境到点亮一个LED灯
  8. 【数据可视化工具DataEase】如何修改内置 MySQL 容器名
  9. Android DirectBoot模式
  10. 数据人的生活智慧(1)