Python字符串处理:过滤字符串中的英文与符号,保留汉字
使用Python 的re模块,re模块提供了re.sub用于替换字符串中的匹配项。
1 re.sub(pattern, repl, string, count=0)
参数说明:
pattern:正则重的模式字符串
repl:被拿来替换的字符串
string:要被用于替换的原始字符串
count:模式匹配后替换的最大次数,省略则默认为0,表示替换所有的匹配
例如
import re str = "hello,world!!%[545]你好234世界。。。" str = re.sub("[A-Za-z0-9\!\%\[\]\,\。]", "", str) print(str)输出结果:你好世界
======================================================================================================
Python正则表达式 .,[],\d,\w,\s,\S,\D,\W的用法
转自:https://blog.csdn.net/qq_34776336/article/details/81416232
下列这些都是一个代码匹配一个字符(即代码,字符一一对应才能匹配成功)
代码 功能
. 匹配任意1个字符(除了\n)
[ ] 匹配[ ]中列举的字符
\d 匹配数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即 空格,tab键
\S 匹配非空白
\w 匹配非特殊字符,即a-z、A-Z、0-9、_、汉字
\W 匹配特殊字符,即非字母、非数字、非汉字、非_
re.match是用来进行正则匹配检查的方法,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),否则返回None(注意不是空字符串"")。
匹配对象Macth Object具有group方法,用来返回字符串的匹配部分。
例子:
# 01:“.”匹配任意1个字符
result=re.match(".....","baaop")
a=result.group()
print(a)
结果:baaop
# 02:“[]”匹配[]中列举的字符
# 字符串第一个字符只要存在于[]中就能成功匹配,
# [a-zA-Z0-9_]表示可以匹配"a-z","A-Z","0-9"和"_"区间内的所有元素
result=re.match("[Aa]","Aaaaaaabbba")
a=result.group()
print(a)
结果:A
#03:"\d"匹配数字,即0-9
result=re.match("嫦娥\d号","嫦娥9号")
a=result.group()
print(a)
结果:嫦娥9号
#04:“\D”匹配非数字,即不是数字
result=re.match("嫦娥\D号","嫦娥a号")
a=result.group()
print(a)
结果:嫦娥a号
# 05:“\s”匹配空白,即 空格,tab键
result=re.match("嫦娥\s号","嫦娥 号")
a=result.group()
print(a)
结果:嫦娥 号
# 06:“\S”匹配非空白
result=re.match("嫦娥\S号","嫦娥1号")
a=result.group()
print(a)
结果:嫦娥1号
# 07:"\w"匹配单词字符,即a-z,A-Z,0-9、_
result=re.match("嫦娥\w号","嫦娥_号")
a=result.group()
print(a)
结果:嫦娥_号
# 08:"\W"匹配单词字符,即匹配非单词字符
result=re.match("嫦娥\W号","嫦娥¥号")
a=result.group()
print(a)
结果:嫦娥¥号
---------------------
作者:LiuHuaJ
来源:CSDN
原文:https://blog.csdn.net/qq_34776336/article/details/81416232
版权声明:本文为博主原创文章,转载请附上博文链接!
Python字符串处理:过滤字符串中的英文与符号,保留汉字相关推荐
- python批量翻译excel表格中的英文
python批量翻译excel表格中的英文 需求背景 主要设计 分析 具体实现 表格操作 请求百度翻译api 多线程 控制台显示进度 完整源码 需求背景 女朋友的论文需要爬取YouTube视频热评,但 ...
- java 过滤字符串_java 过滤字符串方法实现
这样过滤:"你TMD,也太缺德了吧"过滤后"你***,也太缺德了吧"把骂人的脏话过滤成*号 package test; import java.util.Has ...
- java字符串替换括号(中文和英文括号),通过正则表达式替换,如果直接替换中文可以替换,但是英文替换会报错
public static void main(String[] args) {String str = "(nihao),(henhao),(nichilema?),(chiguole)& ...
- python 正则之提取字符串中的汉字,数字,字母
python 正则之提取字符串中的汉字,数字,字母 #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字 import r ...
- python字符串筛选输出_如何在Python中过滤字符串列表
Python使用列表数据类型在顺序索引中存储多个数据.它的工作方式类似于其他编程语言的数字数组.filter()方法是Python的一种非常有用的方法.可以使用filter()方法从Python中的任 ...
- python不属于字符串的是_【python cookbook】python过滤字符串中不属于指定集合的字符...
1 #!/usr/bin/python 2 #-*- coding: utf-8 -*- 3 4 #过滤字符串中不属于指定集合的字符 5 6 importstring7 8 #生成所有字符的可复用的字 ...
- 不属于python标准库的是_《Python Cookbook(第2版)中文版》——1.10 过滤字符串中不属于指定集合的字符-阿里云开发者社区...
本节书摘来自异步社区<Python Cookbook(第2版)中文版>一书中的第1章,第1.10节,作者[美]Alex Martelli , Anna Martelli Ravenscro ...
- python过滤字符串中不属于指定集合的字符的代码
将做工程过程比较重要的一些内容备份一下,如下资料是关于python过滤字符串中不属于指定集合的字符的内容. import string 生成所有字符的可复用的字符串,它还可以作为 一个翻译表,指明&q ...
- 【Python】过滤数组中的空值(空字符串''和None)
使用场景 计算最大值或最小值时使用. 如果不进行空值过滤的话,python自带的min()函数会将空值作为最小值. 过滤数组中的空值:示例 def get_real_arr(arr):"&q ...
最新文章
- iptables总结
- 自学python可以找到好的工作吗-通过自学python能找到工作吗
- 简单题汇总,小知识点
- 返回顶部小火箭(仿电脑管家)
- 指数型组织形成的 9 大驱动因素
- 不相交集的求并算法(按集合大小求并+按高度求并)
- linux网络编程之多路I/O转接服务器poll函数
- C++ 内存管理机制
- python多线程编程_python多线程编程(1): python对多线程的支持
- sql avg和count_SQL sum(),count()和avg()函数
- 点击按钮,文本框如何不失去焦点
- python文本关联分析,详解Python文本操作相关模块
- python自动注册邮箱_python+selenium实现163邮箱自动登陆的方法
- 每日工作记录——任意小数分频研究
- 独家强大情侣头像网名个性签名多功能工具微信小程序源码下载
- 驱动精灵 v9.61 去广告最终版绿色清爽单文件
- Blender基础:融球(Metaball)
- Android 仿今日头条视频播放器实现(不使用节操哟)
- 关于PGP的简单使用
- 硬件堡垒机、软件堡垒机、云堡垒机品牌怎么选?
热门文章
- Office 2007 使用心得
- 2021年煤矿采煤机(掘进机)操作考试题及煤矿采煤机(掘进机)操作考试总结
- SQL触发器实例(下)
- 天天生鲜项目 python邮箱_python3 之 天天生鲜 项目(初学者)1
- 软考——软件测评师基础知识
- openvpen最新安卓中文版_Zedge app官方下载-Zedge最新版本2020v6.8.4 安卓中文版-腾牛安卓网...
- selenium鼠标双击操作
- 2021 ICPC 沈阳站总结
- 广和通入驻中国联通5G物联网OpenLab开放实验室,携手共赴5G扬帆新征程
- 【模型部署】TFX介绍