python基础教程菜鸟-Python菜鸟文本处理4种方法
https://www.xin3721.com/eschool/pythonxin3721/
自从认识了python这门语言,所有的事情好像变得容易了,作为小白,逗汁儿今天就为大家总结一下python的文本处理的一些小方法。
话不多说,代码撸起来。
python大小写字符互换
在进行大小写互换时,常用到的方法有4种,upper()、lower()、capitalize() 和title()。
str = "www.dataCASTLE.com"
print(str.upper())# 把所有字符中的小写字母转换成大写字母
print(str.lower())# 把所有字符中的大写字母转换成小写字母
print(str.capitalize())# 把第一个字母转化为大写字母,其余小写
print(str.title())# 把每个单词的第一个字母转化为大写,其余小写
WWW.DATACASTLE.COM
www.datacastle.com
Www.datacastle.com
Www.Datacastle.Com
还可以同时进行大小写互换:
s="hGdssWW678qqfdDDD777f8888sD8FJJss jjYYhVV #sh&"
def fn(x):
if x.is lower():
return x.upper()
elif x.is upper():
return x.lower()
else:
return x
result=''.join([fn(r) for r in list(s)])
print(result)
HgDSSww678QQFDddd777F8888Sd8fjjSS JJyyHvv #SH&
在s当中,不仅有大小写字母,还有数字,符号作为干扰,运用代码成功将大小写进行了互换。
行列互换
01 :insert进行A行与N行的互换
with open('D:
.txt','r') as f:
txt=f.readlines()
txt.insert(4,txt[1])#第二行插入第五行的位置
del(txt[1])#删除原来的第二行
print(txt)
1 A 一
3 C 三
4 D 四
2 B 二
5 E 五
6 F 六
02: 矩阵的行列互换
matrix = [[1, 1, 1, 1],
[2, 2, 2, 2],
[3, 3, 3, 3],]
trans = []
for i in range(4):
trans.append([row[i] for row in matrix])
print('', trans)
[[1, 2, 3],
[1, 2, 3],
[1, 2, 3],
[1, 2, 3]]
关于行列互换的情况,python有一个很好用的库pandas,其中的操作非常简便,可以到之前的文章”十分钟上手pandas"中查看。
实现快速排序
快排的思想:首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。
01:超级"简短"的python实现的快速排序,一行代码轻松实现快速排序。
def quickSort(arg):
if(arg==[]):
return []
return quickSort([i for i in arg[1:] if i<=arg[0]])+[arg[0]]+quickSort([i for i in arg[1:] if i>arg[0]])
print quickSort([11,22,8,23,7,33,13,28,66,777])
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
02:一般快排实现
def quicksort(array, left, right):
#建立递归终止条件
if left >= right:
return
low = left#low为序列左边要移动的游标
high = right#high为序列右边要移动的游标
key = array[low]#将左边的数设为基准元素
while left < right:
# 当left与right未重合,并且比基准元素要大,就将游标向左移动
while left < right and array[right] > key:
right -= 1
# 如果比基准元素小,就跳出循环,并且把其放在基准元素左边
array[left] = array[right]
# 当low与last未重合,并且比基准元素要小,就将游标向右移动
while left < right and array[left] <= key:
left += 1
# 如果比基准元素大,就跳出循环,并且把其放在基准元素右边
array[right] = array[left]
# 当low与last相等,就是基准元素的排序位置
array[right] = key
# 对排序好的元素左右两边的序列进行递归
quicksort(array, low, left - 1)
quicksort(array, left + 1, high)
array = [11,22,8,23,7,33,13,28,66,777]
print("Quick Sort: ")
quicksort(array,0,len(array)-1)
print(array)
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
03:《算法导论》中的快排程序
def quicksort(array, l, r):
if l < r:
q = partition(array, l, r)
quick_sort(array, l, q - 1)
quick_sort(array, q + 1, r)
def partition(array, l, r):
x = array[r]
i = l - 1
for j in range(l, r):
if array[j] <= x:
i += 1
array[i], array[j] = array[j], array[i]
array[i + 1], array[r] = array[r], array[i+1]
return i + 1
array = [11,22,8,23,7,33,13,28,66,777]
print("Quick Sort: ")
quicksort(array,0,len(array)-1)
print(array)
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
04:python对list有一个内置函数sorted()排序
a = [11,22,8,23,7,33,13,28,66,777]
b=sorted(a)
print(b)
print(a)
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
[11, 22, 8, 23, 7, 33, 13, 28, 66, 777]
sorted虽然是使用函数方法进行排序,但是效果非常好。使用sorted函数进行排序,不会改变a原有的排序,并且当文本中有其余字母符号等干扰时,也可以成功的将数字进行排序。
文本对齐
有些时候我们得到的文本可能是混乱的,需要进行对齐处理,关于对齐有以下几种方法:
01:format格式化对齐
# format格式化对齐
def f1():
with open("D:
.txt","r") as f:
for s in f:
l=s.rsplit ()
#左对齐,填充符号自定
t='{0:<5} {1:<7} {2}'.format(l[0],l[1],l[2])
print(str(t))
f1()
111 ABC 西瓜
22222 AABBC 水蜜桃
3333 CSDDGFF 香蕉
44 QQQSED 波罗蜜
02:just对齐
#just对齐
r=''
def f2():
f=open("D:
.txt","r")
for s in f:
l=s.rsplit() #通过指定分隔符对字符串进行切片
print(l[0].ljust(5," "),l[1].ljust(7," "),l[2])
f2()
111 ABC 西瓜
22222 AABBC 水蜜桃
3333 CSDDGFF 香蕉
44 QQQSED 波罗蜜
分行输出
01:正则表达式分行输出
#正则表达式
a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"
import re
reg=["[a-z]","[A-Z]","d","[^da-zA-Z]"]
#compile和findall一起使用,返回一个列表
for s in reg:
rega=re.compile(s)
s=re.findall(rega,a)
print("".join(s))
abcdefghi
ABCDEFGHI
123456789
一二三四五六七八九
02:string方法分行输出
#string方法
a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"
import string
ta=tb=tc=td=''
la=string.ascii_lowercase#la为小写字母
ua=string.ascii_uppercase#ua为大写字母
nb=string.digits#nb为0~9的数字
ub="一二三四五六七八九"
#分别从a中找出小写、大写字母、数字并进行分行输出
for s in a:
if s in la:
ta=ta+s
if s in ua:
tb=tb+s
if s in nb:
tc=tc+s
if s in ub:
td=td+s
print(ta)
print(tb)
print(tc)
print(td)
abcdefghi
ABCDEFGHI
123456789
一二三四五六七八九
好了,今天的分享就到这里。
python基础教程菜鸟-Python菜鸟文本处理4种方法相关推荐
- Python基础教程,Python入门教程
Python 是一门上手简单.功能强大.通用型的脚本编程语言.Python 类库极其丰富,这使得 Python 几乎无所不能,网站开发.软件开发.大数据分析.网络爬虫.机器学习等都不在话下. 这套 P ...
- python基础教程-学习python有什么好的视频教程?
干货来袭,以下均为python好的学习视频,我们先从python的入门教程开始分享起! python入门教程(600集)https://www.bilibili.com/video/BV1ex411x ...
- python基础教程电子版-Python基础教程(第2版 修订版) pdf
Python基础教程(第2版 修订版) 目录 D11章快速改造:基础知识1 1.1安装Python1 1.1.1Windows1 1.1.2Linux和UNIX3 1.1.3苹果机(Macintosh ...
- Python基础教程,Python神仙级入门教程(非常详细)
Python 是一门开源免费.通用型的脚本编程语言,它上手简单,功能强大,坚持「极简主义」. Python 类库(模块)极其丰富,这使得 Python 几乎无所不能,不管是传统的 Web 开发.PC ...
- python基础教程目录-Python基础教程(第2版 修订版) 简介,目录书摘
编辑推荐: <Python基础教程(第2版·修订版)>是经典的Python入门教程,层次鲜明,结构严谨,内容翔实,特别是最后几章,作者将前面讲述的内容应用到10个引人入胜的项目中,并以模板 ...
- python基础教程 下载-Python基础教程第3版中国PDF电子书免费下载
本书包括 Python 程序设计的方方面面:首先,从 Python 的安装开始,随后介绍了 Python 的基础知识和基本概念,包括列表.元组.字符串.字典以及各种语句:然后,循序渐进地介绍了一些相对 ...
- python基础教程书籍-Python学习必看书籍_带你高效学习
坚持就是胜利,祝你成功!!! 都说python是最好的语言. 1.<笨办法学Python 3> 入门强烈推荐 本书是一本Python入门书,适合对计算机了解不多,没有学过编程,但对编程感兴 ...
- python基础教程-《Python基础教程(第3版)》PDF高清版
<python基础教程第3版>PDF高清版 百度云资源,内涵教材源代码 百度云链接:百度云盘 提取码:7r7o 编辑推荐 久负盛名的Python入门经典,是非常优秀的基础教程,深入浅出, ...
- python基础教程视频-Python基础视频教程全集
原标题:Python基础视频教程全集 Python编程语言的定位是"优雅"."明确"."简单",所以对于Python初学者来说,学起来没有那 ...
- 全网惟一面向软件测试人员的Python基础教程-在Python中怎么干倒字符串?
全网惟一面向软件测试人员的Python基础教程 起点:<python软件测试实战宝典>介绍 第一章 为什么软件测试人员要学习Python 第二章 学Python之前要搞懂的道理 第三章 你 ...
最新文章
- latex 文章前头引用包
- 89c52单片机c语言延时程序计算 脉冲,stc89c52单片机的程序 求翻译
- kafka consumer配置拉取速度慢_Kafka分区分配策略(Partition Assignment Strategy)
- python通过DictReader实现两个csv文件的映射查找lookup之代码详解
- SAP CDS entity 中使用 @readonly 进行访问控制
- 牛客题霸 [ 	调整数组顺序使奇数位于偶数前面] C++题解/答案
- 正态分布的前世今生(3)
- 5m独享网站服务器,您真的需要独享5m云服务器吗?一文让您了解云服务器带宽计算方法,从此不再花冤枉钱...
- Centos7的iso everything与DVD以及Live的区别
- Qt PDF预览功能实现汇总
- 层次分析法、网络层次分析法、模煳层次分析法、双基点法
- CMMI-V2.0真题模拟(1)
- SpringBoot的Banner
- 权重初始化方法及适用情况
- JavaScript(js)的多次弹窗
- 《设计模式》——开闭原则
- SC系列(SC-12S)低频率小型SMD石英晶振SC-12S32.768KHZ12.5PF/20PPM
- 【中级软考】cache是什么?(高速缓冲存储器)
- javascript_实现
- 程序员接私活经验总结
热门文章
- MySQL之MVCC机制
- 深度学习-MATLAB数据增广
- syst3md 挖矿病毒处理记录
- 计算机病毒危害性分析,计算机病毒的毒性暨危害性分析系统
- 开篮球馆需要什么_开设篮球馆大概需要多大面积地板材质怎么选择
- 学习整理Fabric.js 实现文本文字加粗、下划线、斜体、竖排、字体对齐代码
- 两​个月股价上涨250% 趣头条的未来靠什么支撑?
- 刚来深圳,正在找工作中...........
- oracle数据库50题,ORACLE数据库试题
- window.location与open用法