python正则匹配特殊字符_python 利用正则表达式提取特殊信息
1、删除字符串中的 Python注释
案例:
import re
time = "2020-01-01 # 这是一个日期"
num = re.sub(r'#.*$', "", time)#以#为分隔,去掉后面的信息
print("这个时间是:", num)
结果:
这个时间是: 2020-01-01
2、截取某符号前后的内容
案例1:
txt = '我的电话是:131-246-XXX19'
a = txt.split(':')[0]#0表示符号前
b = txt.split(':')[1]#[-1]和[1]结果一样,表示符号后面
print ("a的结果是:",a)
print ("b的结果是:",b)
结果:
a的结果是: 我的电话是 b的结果是: 131-246-XXX19
案例2:
txt = "I love python . 我热爱python"
text = re.sub(r'\..*$', "", txt)#以.为分隔,\为转义字符,与后面的.区分开
print("这个截取结果是:", text)
结果:
这个截取结果是: I love python
3、删除非数字的字符串
案例:
import re
time = "2020-01-01 # 这是一个日期"
num = re.sub(r'\D', "", time)
print("这个时间是:", num)
结果:
这个时间是: 20200101
4、只保留中文
案例:
reg = "[^\u4e00-\u9fa5]"
text = "好吧!E我aa们$$开始34学习--python吧!"
print(re.sub(reg, '', text))
结果:
好吧我们开始学习吧
5、只保留中文、大小写字母和阿拉伯数字
案例:
reg = "[^0-9A-Za-z\u4e00-\u9fa5]"
text = "好吧!E我aa们$$开始34学习--python吧!"
print(re.sub(reg, '', text))
结果:
好吧E我aa们开始34学习python吧
6、去掉大小写字母和数字
案例:
import re
txt="Ayouleyang阿~优乐-扬"
text = re.sub('[a-zA-Z0-9]','',txt)
print(text)
结果:
阿~优乐-扬 1
7、去掉某个特殊字符
案列:
import re
txt = '阿*a#优$乐. :扬 ;:youle+'
text = re.sub('[,;;youle: :.;,$*#]+', "", txt)#[]中的符号都会被替换,类似于replace()
print(text)
结果:
阿a优乐扬+ 1
8、保留英文,数字和特殊符号
案例:
reg = "[^0-9A-Za-z\u4e00-]"#只保留英文,数字和-,u4e00“-”是需要保留的符号
txt = "好吧!我的号码是131-246-XXX19!::"
text = re.sub(reg, '', txt)
print(text)
结果:
131-246-XXX19
总结
以上所述是小编给大家介绍的python 利用正则表达式提取特殊信息,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
python正则匹配特殊字符_python 利用正则表达式提取特殊信息相关推荐
- python正则匹配特殊字符_python 正则表达式特殊字符
字符描述 \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个 向后引用.或一个八进制转义符.例如,'n' 匹配字符 "n".'\n' 匹配一个换行符.序列 '\\' 匹配 ...
- python从文件中提取特定文本_python利用正则表达式提取文本中特定内容
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
- python 正则表达函数_python笔记-正则表达式常用函数
1.re.findall()函数 语法:re.findall(pattern,string,flags=0) --> list(列表) 列出字符串中模式的所有匹配项,并作为一个列表返回.如果无匹 ...
- python正则匹配空格_Python中正则匹配TAB及空格的小技巧
在正则中,使用.*可以匹配所有字符,其中.代表除\n外的任意字符,*代表0-无穷个,比如说要分别匹配某个目录下的子目录: >>> import re >>> mat ...
- python正则匹配中文_python 正则表达式匹配中文-阿里云开发者社区
python 正则表达式匹配中文 文件编码为 utf-8 设置默认编码为 utf-8 中文需要转换为 \u 形式的编码,也就是 编码, 轮换方法,cmd 下执行 python 进入 python 命 ...
- python正则匹配统计_python正则表达式统计字符串的个数
原博文 2020-02-12 17:54 − 目的:通过python将pubmed下载的摘要txt文档,统计出其中的PMID数目,是否和文献总篇数一致,一致的话,就可以利用PMID的regex pat ...
- python正则匹配数字_Python正则表达式,用于字母数字
我正在学习正则表达式,并尝试执行以下操作: 以下是一系列字母数字的格式.它以4位数字开头,后跟2个空格,然后是8位数字,然后是一个空格,然后是8位数字,然后是一个空格,然后是8位数字,然后是一个空格, ...
- python正则匹配数字连续_正则表达式实现匹配连续数字的方法
实现的要求如下: 纯数字 5-7位之间 前三位相同 从第四位开始连续 如下面的例子: 11123 #正确 22234 #正确 33345 #正确 333456 #正确 2223456 #正确 0001 ...
- python正则匹配数字_python 正则匹配字母数字中的任意数字,字母
原博文 2018-08-08 21:31 − ([1-9]\d*.\d*|0.\d*[1-9]\d*) (.*$) 字符串为:6.12 ounces... 相关推荐 2019-09-28 21:13 ...
最新文章
- 消息中间件和JMS介绍
- C#导出Excel总结
- nginx负载均衡 页面缓存
- 内推!字节、阿里、网易火热招聘中,内推优筛简历,快人一步拿offer,真香!(送内推码)...
- 删除行对MySQL序列有这么多影响?
- JDBC ResultSet 可更新的结果集
- winform 实现qq代理_「设计模式」代理模式:神奇的代理模式,节省了我80%开发时间...
- Win7下如何破解Visual Studio2008 90天试用版
- UNIAPP使用MathJax解析数学公式
- 掩码位数原理、掩码位数计算方法、VLSM详解(IP地址划分方法)、CIDR详解
- 微信小程序利用canvas绘制一个动画百分比圆圈
- 文献阅读:Improving neural networks by preventing co-adaptation of feature detectors
- 亲测好用的6个临时邮箱推荐
- 学习Struts框架系列(一):模拟Struts工作流程
- 微信qq邮箱提醒 服务器繁忙,微信设置密码失败,QQ无法绑定,邮箱服务器繁忙...
- 从王者荣耀看设计模式(十.外观模式)
- 2023 人工智能在线聊天机器人网页HTML源码
- Python 随机双色球,开奖,记录
- 谈谈Django REST Framework(DRF)中的序列化器
- python爬取百度地图数据_Python利用百度地图爬取商家信息
热门文章
- UltraISO 9.3.6.2750 序列号 注册码
- 你用QQ注册过哪些网站/应用,想不想查询一下,然后取消授权呢?
- 【游戏】GBA ROMs 目录合集
- 使用design compiler进行逻辑综合详细笔记
- urp简单入门(unity2020.3版本)
- android 表白APP(创意)
- 华为中级——字符串分割
- 【NOIP2017提高A组冲刺11.4】Pacifist
- 2021李林精讲精练880题 【数学一 解析分册】
- 水准网测量平差matlab_MATLAB在测量平差数据处理中的应用