python正则匹配ABAC型词语
python正则匹配ABAC型词语
- 前言
- 代码
前言
本人第一次写博客,欢迎指出不足。
代码
今天做python作业,发现很多文章不能很好地解决匹配ABAC型的词语,例如:
patten =r'((.).\2.)'
除了能匹配ABAC的词语外还会匹配AAAA,ABAB等词语,找了很久没找到合适的patten(菜π⋅π\pi{ \cdot }\piπ⋅π),最后用改变待匹配的文本的方式解决。
// An highlighted block
import re
text = '''行尸走肉、金蝉脱壳、百里挑一、金玉满堂、
背水一战、霸王别姬、天上人间、不吐不快、海阔天空、
情非得已、满腹经纶、兵临城下、春暖花开、插翅难逃、
黄道吉日、天下无双、偷天换日、两小无猜、卧虎藏龙、
珠光宝气、簪缨世族、花花公子、绘声绘影、国色天香、
相亲相爱、八仙过海、金玉良缘、掌上明珠、皆大欢喜、
浩浩荡荡、平平安安、秀秀气气、斯斯文文、高兴高兴'''print("ABAC形式的词语:", list(i[0] for i in re.findall(r"((.)(.)\2.)", re.sub(r"((.)(.)\2\3)", r'\3', text))))
相关的参考资料。
python正则匹配ABAC型词语相关推荐
- python正则匹配表达式(2)
上节主要讲解python正则匹配的匹配表达式,而需要调用相应的API才能解决如何匹配的问题. 在python官方文档Regular Expression HOWTO给出了python匹配函数,官方给出 ...
- 使用Python 正则匹配两个特定字符之间的字符方法
string = "<KeysViewHDF5 ['Inoisy']>" import redef cut_out(a,b,string):result = re.fi ...
- Python正则匹配 去除文本中的各类emoji表情符号
我们的文本数据中经常会带有很多表情,如何完整地清除得到高质量的文本供我们利用呢? p = re.compile(u'['u'\U0001F300-\U0001F64F' u'\U0001F680-\U ...
- python正则匹配txt特定字符串(有换行)
python正则匹配txt特定字符串(有换行) 在原txt文件中,我们需要匹配出的字符串为:休闲服务(中间参杂着换行) 直接复制到notebook里进行处理 完整代码 在原txt文件中,我们需要匹配出 ...
- python正则匹配汉字
python正则匹配汉字的规则为:[\u4e00-\u9fa5] 后面可以加一个+,匹配多个汉字. 例子如下: print(re.findall(r'[\u4e00-\u9fa5]+', '这是测试用 ...
- python正则表达式匹配数字或者逗号_python正则表达式去掉数字中的逗号(python正则匹配逗号)...
分析 数字中经常是3个数字一组,之后跟一个逗号,因此规律为:***,***,*** 正则式[a-z]+,[a-z]? import re sen = "abc,123,456,789,mnp ...
- Python 正则匹配(re)组的应用
昨天刚看完re的一小部分,今天刚好有个任务需要用到正则. 需求是:一张表的text字段存了很多内容.里面包括发给用户的邮件内容,已经用户的邮箱等等.现在需要查找出发送给哪些email以及多少封邮件.需 ...
- python正则匹配ip地址_Python正则表达式匹配和提取IP地址
Linux No.1 IPv4 下面是IPv4的IP正则匹配实例: 简单的匹配给定的字符串是否是ip地址 import re if re.match(r"^(?:[0-9]{1,3}.){3 ...
- python正则匹配表达式(1)
python也和其他语言一样也提供了丰富的正则匹配表达式,在爬虫中解析服务器的内容时也经常需要用到,python的正则匹配为re库,其官方文档链接为: Lib/re.py 在官方文档中特别说明正则匹配 ...
最新文章
- domain,DNS,冗余,DNS劫持的大致原理
- MySQL5.0安装图解
- mybatis框架中的mapper.xml文件中的头部代码
- FPGA 状态机设计
- Maven系列(一):maven基础入门
- 3D程序运行在服务器上 VirtualGL
- C++vector基础容器3.0
- 数据库语句数据库学习(3)——数据库的创建与删除
- QT修改应用程序图标
- 使用Axis导入webService报错No support for attachments
- DB2 执行SQL报错: DB2 SQL Error: SQLCODE=-1585, SQLSTATE=54048
- 计算机磁盘管理打不开,教你怎样轻松解决磁盘打不开的问题
- 在HTML页面显示时钟
- 第4篇-DSP28069外设初始化2
- 农村商业银行与中国农业银行的区别
- 大明:讲解硬盘ESP分区和MSR分区有什么用?值得收藏
- cssK中的常用单词之相对,绝对
- Matlab矩阵的定义与构建
- 下午茶界“新晋网红”:星语乐茶牛角包搭配手工茶(转载)
- 解放军军官军衔(不含士兵军衔)分为3等10级