python集合如何去除重复数据_Python 迭代删除重复项,集合删除重复项
1. 迭代删除重复项:先排序列表项,然后通过新迭代(not in)去除重复项,分片打印
def sanitize(time_string):
if '-' in time_string:
splitter = '-'
elif ':' in time_string:
splitter = ':'
else:
return (time_string)
(mins, secs)=time_string.split(splitter)
return(mins + '.' + secs)
with open ('james.txt') as jas: data = jas.readline()
james=data.strip().split(',')
print('before sort and senitize, unique for james',james)
james=sorted ([sanitize(t) for t in james])
unique_james=[]
for each_t in james:
if each_t not in unique_james:
unique_james.append(each_t)
print('First 3 time for james',unique_james[0:3])
=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========
before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']
First 3 time for james ['2.01', '2.22', '2.34']
2. 集合删除重复项:先set创建集合去除重复项,然后进行排序,分片打印
def sanitize(time_string):
if '-' in time_string:
splitter = '-'
elif ':' in time_string:
splitter = ':'
else:
return (time_string)
(mins, secs)=time_string.split(splitter)
return(mins + '.' + secs)
with open ('james.txt') as jas: data = jas.readline()
james=data.strip().split(',')
print('before sort and senitize, unique for james',james)
james=sorted (set([sanitize(t) for t in james]))
print('First 3 time for james',james[0:3])
=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========
before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']
First 3 time for james ['2.01', '2.22', '2.34']
3.精简代码,创建一个小函数rmspace去除空白符,通过函数调用分片打印
def sanitize(time_string):
if '-' in time_string:
splitter = '-'
elif ':' in time_string:
splitter = ':'
else:
return (time_string)
(mins, secs)=time_string.split(splitter)
return(mins + '.' + secs)
def rmspace(file):
with open(file) as fo: data=fo.readline()
return data.strip().split(',')
james=rmspace('james.txt')
print('before sort and senitize, unique for james',james)
print('First 3 time for james',sorted(set([sanitize(t) for t in james]))[0:3])
=========== RESTART: C:\Users\eric\Documents\Python\kelly\kelly.py ===========
before sort and senitize, unique for james ['2-34', '3:21', '2.34', '2.45', '3.01', '2:01', '2:01', '3:10', '2-22']
First 3 time for james ['2.01', '2.22', '2.34']
python集合如何去除重复数据_Python 迭代删除重复项,集合删除重复项相关推荐
- python队列get不到数据_Python队列.get(block=true)添加项时不返回超时
我的python应用程序中有2个线程. 线程A(好吧,基本上是"main"线程)向队列中添加项目. 线程B正在从队列中获取它.在 代码A:def addTrade(self, da ...
- pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)
pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...
- python对csv去除重复行_Python 去重csv文件中相同的重复行
读取CSV 读取CSV文件由两种方式: 第一种 import csvwith open('data.csv','r',encoding = 'utf8') as fp: reader = csv.re ...
- list可以存放python中任意类型的数据_Python中常见的数据类型小结
Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种一一介绍: 一 序列 1.列表list 列表是一种有序的 ...
- python集合和字典的区别_Python中的字典和集合
导语:本文章记录了本人在学习Python基础之数据结构篇的重点知识及个人心得,打算入门Python的朋友们可以来一起学习并交流. 本文重点: 1.掌握常见的字典创建,查询,判别方法: 2.了解字典中的 ...
- python中显示第三行数据_Python数据分析及可视化-小测验
image.png 首先将5题的文件复制形成副本,如下图所示: image.png 在资源管理器的路径中输入cmd,如下图所示: image.png 在上图中输入后,按Enter键运行进入cmd窗口. ...
- python去重保留唯一一个值_Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)...
摘要 在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值. 这里就简单的介绍一下对于DataFrame去重和取重复值的操作. 创建DataFrame 这里首先创建一个 ...
- python 基础语法处理一组数据_Python 基础语法
注释的分类 1.单行注释 以"#"开头,#右边的所有东西当做说明,而不是真正要执行的程序,起辅助说明作用 # 我是注释,可以在里写一些功能说明之类的哦 print('hello w ...
- python处理pdf提取指定数据_python从PDF中提取数据的示例
01 前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都 ...
最新文章
- 倒计时3天!华为畅想未来智能车大赛报名即将截止,已报名选手请提交参赛PPT!
- bcc校验码计算_CRC校验你会吗?计算、校验、C语言实现,三步教你轻松搞定
- 新鲜出炉!20款好看的英文字体下载
- 各种排序实现以及稳定性分析
- 系列(五)—MySql
- 洛谷P4727:图的同构计数(Polya引理)(dfs)
- 【Linux 命令学习第三天】
- (筆記) 如何為ModelSim加入永久性的library mapping? (SOC) (ModelSim)
- CodeMeter的功能介绍
- 解决安装MATLAB2018a后出现License Manager Error -8的问题
- Web 前端:知道这些,至少有底气去面试了
- Linux基本操作命令 实验
- 一位 中国70 后老程序员的 26 个职场感悟
- MATLAB打不开,只在任务栏闪一下就无反应了怎么办?
- H无穷控制学习笔记——H无穷/H2控制
- 随意发软件如何自动发帖已更新2022
- 我知道苏宁会玩,但没想到它能把“千人千面”玩到了极致
- Ubuntu18.04 无法解析域名
- Word 标题前添加一颜色竖线条
- bam文件读取_把bam文件读入R,并且转为grange对象