python 文件行数_python—文件和数据(文件行数 文件字符分布)
文件行数
描述
打印输出附件文件的有效行数,注意:空行不计算为有效行数。
文件下载地址:
链接:https://pan.baidu.com/s/1xURpGrALY0aZaoIEZI1LpA
提取码:ks7m
f = open("latex.log","r")
count = 0
for i in f:
line = i.strip("\n") #以回车为分隔,代表一行
if len(line) == 0: #空行不计算
continue
else:
count = count+1
print("共{}行".format(count))
文件字符分布
描述
统计附件文件的小写字母a-z的字符分布,即出现a-z字符的数量,并输出结果。
同时请输出文件一共包含的字符数量。
注意输出格式,各元素之间用英文逗号(,)分隔。
答案可能包含a-z共26个字符的分布,如果某个字符没有出现,则不显示,输出顺序a-z顺序。
f = open("latex.log")
count = 0
d = {}
for line in f: #第一次遍历是每一行数据
for c in line: #遍历每个字母
d[c] = d.get(c, 0) + 1 #用字典get方法计算字母出现个数,当遇见空格或其它符号,返回0
count = count+1
print("共{}字符".format(count), end="") #打印总数
for i in range(26):
print(",{}:{}".format(chr(ord('a')+i), d[chr(ord('a')+i)]), end="")
#上面已经计算完了,这一步主要是排序a-z共26个字母,先遍历出26字母当做字典中的key,查找对应的值。把字母转换成ascii码才能相加,加完再转回去。
文件独特行数
描述
统计附件文件中与其他任何其他行都不同的行的数量,即独特行的数量。
f = open("latex.log","r")
ls = f.readlines()
s = set(ls)
for i in s:
ls.remove(i)
t = set(ls)
print("共{}独特行".format(len(s)-len(t)))
理解有点偏差,网上找的资料
你的理解bai有偏差,独特行代表没有重复的行,而s=set(ls)集合包括两部分,一部分是独特行,另外一部分是重复行保留的一个dao“副本”,
比如两个“abc”,还保留了一个在集合中,所以内要将这些重复行的“副本”也去掉容才行。
CSV格式列变换
描述
附件是一个CSV文件,请将每行按照列逆序排列后输出,不改变各元素格式(如周围空格布局等)。
data = open("data.csv","r")
for i in data:
ls =i.replace('\n','')
m = ls.split(',')[::-1] #列表切片-1是步长
print(','.join(m)) #最后返回是字符串
CSV格式数据清洗
描述
附件是一个CSV文件,其中每个数据前后存在空格,请对其进行清洗,要求如下:
(1)去掉每个数据前后空格,即数据之间仅用逗号(,)分割;
(2)清洗后打印输出。
数据之间本来就是逗号分隔,所以去除空格就好
data = open("data.csv").read()
print(data.replace(" ",""))
python 文件行数_python—文件和数据(文件行数 文件字符分布)相关推荐
- python数据预处理 重复行统计_Python数据分析之数据预处理(数据清洗、数据合并、数据重塑、数据转换)学习笔记...
1. 数据清洗 1.1 空值和缺失值的处理 空值一般表示数据未知.不适用或将在以后添加数据.缺失值是指数据集中某个或某些属性的值是不完整的. 一般空值使用None表示,缺失值使用NaN表示 1.1 ...
- python统计excel数据总行数_Python怎么读取Excel的行数和列数?
在把数据写入Excel的过程中遇到了问题,写入的数据是for循环进去的,所以是分多次写入(每次for循环写入一次,一次有几十条数据). 但是在第二次for循环写数据时,就会覆盖掉第一次写的数据,就是后 ...
- python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图
python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...
- python爬取沪深所有股票数据并生成Excel文件
爬取沪深所有股票数据并生成Excel文件 一.分析需求 1.对于沪深两市的各只股票,获取其:'股票代码', '股票名称', '最高', '最低', '涨停', '跌停', '换手率', '振幅', ' ...
- python将输出保存为txt_Python3将数据保存为txt文件的方法
Python3将数据保存为txt文件的方法,具体内容如下所示:f = open("data/model_Weight.txt",'a') #若文件不存在,系统自动创建.'a'表示可 ...
- python安装os模块_python的os模块(ipython,文件,目录,权限,管理)
什么是os模块 os模块提供了多数操作系统的功能接口函数.当os模块被导入后,它会自适应于不同的操作系统平台,根据不同的平台进行相应的操作,在python编程时,经常和文件.目录打交道,这时就离不了o ...
- Excel从另一个Excel文件中用户自定义区域(UsedRange)拷贝数据和行高、列宽
实现环境:Visual Studio 2010, Office 2010, VSTO 4.0, .NET Framework 4.0 using System; using System.Collec ...
- python pandas excel数据处理_Python处理Excel数据-pandas篇
Python处理Excel数据-pandas篇 非常适用于大量数据的拼接.清洗.筛选及分析 在计算机编程中,pandas是Python编程语言的用于数据操纵和分析的软件库.特别是,它提供操纵数值表格和 ...
- 如何运用python爬游戏皮肤_Python爬虫练习:20行Python代码爬取王者荣耀全英雄皮肤...
引言王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 ...
- 怎么把oracle表导成pdm文件,PD 之 连接数据库并导出数据及生成PDM文件
使用PowerDesigner工具,连接数据库并导出数据及生成PDM文件. 1.建立连接 "以管理员身份运行"打开PowerDesigner,右键"Workspace&q ...
最新文章
- 服务器无法显示大内存的处理办法
- NOIP 2012 同余方程
- android的log.d不显示结果
- 并发执行变成串行_大白话Java并发面试问题之Java 8如何优化CAS性能?
- 如何用python的i2c教程_Micropython TPYBoard I2C的用法
- 白盒测试-条件覆盖-短路陷阱
- ROS笔记(19) 摄像头仿真
- 拉取远程分支到本地分支_想买的保险本地没有分支机构怎么办?异地投保理赔难吗?...
- vue的登陆验证及返回登录前页面实现
- Spring与MyBatis整合源码分析
- 银联收单清算体系和处理流程
- 如何用EXCEL求一组数的方差…
- 程序员版孔乙己(故事小篇)
- Android - 弹幕实现原理(附Demo源码)
- LiveNVR监控流媒体Onvif/RTSP功能支持海康摄像头通过海康SDK接入支持回看倍速播放海康设备存储的设备录像
- 《ROS理论与实践》学习笔记(九)机器人自主导航
- 怎么样才能突破自我,从手工测试成为自动化测试人员
- 这几个CNAD领域对实验人员的要求,赶紧收藏
- Win7 下U盘安装Ubuntu16.04 双系统详细图文教程
- uniapp ios app离线打包 - 配置
热门文章
- IBatisNet概述[整理]
- python 列表生成式 字典生成式
- python 之图片转字符画
- FFmpeg之libyuv使用(十五)
- 实战开发经验:是什么阻碍了我们跨平台
- wordpress入门基本操作,网站安全防护及常用插件(建站必看教程)
- 遍历字典_Python编程从入门到实践-连载5(字 典)
- python定义空函数体_Python 2.2 定义函数
- tcl之quartus 脚本学习 · 1 quartus tcl packages 介绍
- python统计图像灰度直方图_python 对一幅灰度图像进行直方图均衡化