正则表达式和re模块
世界上分两种人,一种是懂正则表达式的,一种是不懂正则表达式的。
https://darlewo.cn/getting_started_with_crawler_advanced_3.html

匹配中文标点符号: [\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配大小写英文字母和数字
[a-zA-Z0-9]
【,】中文字符匹配正则表达式为\u3010\u3011(这个可以用下面的方法进行检验)

import json
lists=[{'a':'。','b':'【','c':'】'}
]with open('c.json', 'w+', encoding='utf-8') as f:json.dump(lists, f, indent=0)

import res = "\n\r\t@#$%^&*这样一本书大卖,有点意外,据说已经印了四五十万,排行榜仅次于《希拉里自传》。大概是大众抛弃了一位表演过火的“文化大师”后,需要再找一位有格调的“文化饰品”来装点吧?书的装帧果然有品格,书皮是淡棕色的皱纹纸,书摊老板告诉我这纸是进口的。有一个加印版是绿色封皮,差很多。开始出于对热买书的反感,没有下手。虽然很喜欢作者,但近两年,买了一些早先钟爱的作家的新作,大失所望,故此这次谨慎很多。单位主编买了一本,边审节目边看,泪水涟涟(这位领导为四十出头的女性)。干脆借来一观。半天一口气读完大半,晚上睡前读完了。睡时心里像纠了一个结,很像以前特投入地读完一本武侠书,怅然若失,随着最后一页书合上,一个世界也合上了大门。杨绛的以前的书基本都读过,包括钱钟书题写书名的三卷集,写知识分子思想改造、反右干校,写她父亲的文章印象特别深刻。但从没有像这本书,整本笔墨都是在写她最亲的两个人,丈夫和女儿。以往一直觉得杨绛的笔锋有点像奥斯丁,用很干净疏朗的笔法写身边琐事,即使是大事变,捕捉的也是实实在在的细处。以前的印象是冷静,情绪流露虽只是轻轻点一下,但仍透着一股贵族气在里头。有一位知青作家就特受不了,譬如《干校六记》中的一处,写她路见一落魄小将,如狼崽子一般,心下不由生出点快意。钱钟书的夫人自然是有傲气的。但《我们仨》太不一样了,记述她女儿罹患恶疾病故的那一章(第二部分),那种痛楚简直是倾泻纸面,虽然作者故意采用梦境式的虚幻技巧(这一手法她在《将饮茶》中已经牛刀小试,这里已经成演变为独立的一章了),想造成间离(估计老太太自己也受不了直接面对这段时间),但依然能见到处处泪渍,大概很少有读者能经受得起。我也步了女主编的后尘。有位老前辈评点说,杨绛的这本新书是她最差的一本,或许指的就是这点吧。在时人看来,让人掉眼泪的书似乎品格有问题。第三部分又回到了杨绛的一贯笔法,记述和钱钟书、钱媛共度的岁月,流畅极了,很好读,一个大学者原来是那么童稚的一个人,在书中,一家三口的心性似乎永远停留在那段黄金岁月:即封面那张四十年代的合影,圆圆。七十岁的老人、五十多岁的女儿,依旧开着五十年前的玩笑,太动人了。我就像在观看神仙的游戏。最后老太太淡淡记道:现在只剩下我一个人,怀念着我们仨。我是打乱次序读,先读第一部分(序),随后是第三部分,第二部分,反而印象比较好。或许顺着读,先撕心裂肺痛了一下,效果并不佳。推荐倒着看。\n\s\r\t"
t= re.findall('[\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b\u4e00-\u9fa5]',s)
print(''.join(t))

输出:

这样一本书大卖,有点意外,据说已经印了四五十万,排行榜仅次于《希拉里自传》。大概是大众抛弃了一位表演过火的“文化大师”后,需要再找一位有格调的“文化饰品”来装点吧?书的装帧果然有品格,书皮是淡棕色的皱纹纸,书摊老板告诉我这纸是进口的。有一个加印版是绿色封皮,差很多。开始出于对热买书的反感,没有下手。虽然很喜欢作者,但近两年,买了一些早先钟爱的作家的新作,大失所望,故此这次谨慎很多。单位主编买了一本,边审节目边看,泪水涟涟(这位领导为四十出头的女性)。干脆借来一观。半天一口气读完大半,晚上睡前读完了。睡时心里像纠了一个结,很像以前特投入地读完一本武侠书,怅然若失,随着最后一页书合上,一个世界也合上了大门。杨绛的以前的书基本都读过,包括钱钟书题写书名的三卷集,写知识分子思想改造、反右干校,写她父亲的文章印象特别深刻。但从没有像这本书,整本笔墨都是在写她最亲的两个人,丈夫和女儿。以往一直觉得杨绛的笔锋有点像奥斯丁,用很干净疏朗的笔法写身边琐事,即使是大事变,捕捉的也是实实在在的细处。以前的印象是冷静,情绪流露虽只是轻轻点一下,但仍透着一股贵族气在里头。有一位知青作家就特受不了,譬如《干校六记》中的一处,写她路见一落魄小将,如狼崽子一般,心下不由生出点快意。钱钟书的夫人自然是有傲气的。但《我们仨》太不一样了,记述她女儿罹患恶疾病故的那一章(第二部分),那种痛楚简直是倾泻纸面,虽然作者故意采用梦境式的虚幻技巧(这一手法她在《将饮茶》中已经牛刀小试,这里已经成演变为独立的一章了),想造成间离(估计老太太自己也受不了直接面对这段时间),但依然能见到处处泪渍,大概很少有读者能经受得起。我也步了女主编的后尘。有位老前辈评点说,杨绛的这本新书是她最差的一本,或许指的就是这点吧。在时人看来,让人掉眼泪的书似乎品格有问题。第三部分又回到了杨绛的一贯笔法,记述和钱钟书、钱媛共度的岁月,流畅极了,很好读,一个大学者原来是那么童稚的一个人,在书中,一家三口的心性似乎永远停留在那段黄金岁月:即封面那张四十年代的合影,圆圆。七十岁的老人、五十多岁的女儿,依旧开着五十年前的玩笑,太动人了。我就像在观看神仙的游戏。最后老太太淡淡记道:现在只剩下我一个人,怀念着我们仨。我是打乱次序读,先读第一部分(序),随后是第三部分,第二部分,反而印象比较好。或许顺着读,先撕心裂肺痛了一下,效果并不佳。推荐倒着看。
————————————————
版权声明:本文为CSDN博主「Sound_of_ Silence」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44521703/article/details/100187377

Python正则表达式和re模块,完美匹配中文与中文标点符号相关推荐

  1. python正则表达式之re模块方法介绍

    python正则表达式之re模块其他方法 1:search(pattern,string,flags=0) 在一个字符串中查找匹配 2:findall(pattern,string,flags=0) ...

  2. python正则表达式 多个条件的匹配

    python正则表达式 多个条件的匹配 result = re.search(('大功率.*CIR|标准型.*CIR|小型化.*CIR',i) 通过使用 这些关键字可以实现在正则匹配时对多个字段的匹配

  3. python 正则表达式 re findall 返回能匹配的字符串

    python 正则表达式 re findall 方法能够以列表的形式返回能匹配的子串. re.findall(pattern, string[, flags]): 搜索string,以列表形式返回全部 ...

  4. python正则匹配找到所有的浮点数_Python随笔17:Python正则表达式基础(4):贪婪匹配和最小匹配...

    Python正则表达式 贪婪匹配/最小匹配 Re库默认采用贪婪匹配,即匹配最长的子字符串.在量词后面加一个"?",即可由贪婪匹配化为最小匹配. '*'用于将前面的模式匹配0次或多次 ...

  5. Python 正则表达式使用--Re 模块详解

    目录 1. 常用正则表达式符号和特殊字符 ?2.? Re 模块:核心函数和方法 2.1 re.compile() 编译函数 2.1.1?re.compile() 语法格式 2.1.2?re.compi ...

  6. python正则表达式及RE模块

    正则表达式(匹配字符串) web界面正则匹配工具: http://tool.chinaz.com/regex/ 元字符 . 匹配除换行符之外的任意字符 \w 匹配数字字母下划线 \d 匹配数字 \t ...

  7. [ python ] 正则表达式及re模块

    正则表达式 正则表达式描述: 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个'规则字符串',这个'规则字符串'用来     表达对字符串的一种过 ...

  8. Python正则表达式及re模块使用

    1. 正则表达式 元字符:具有固定含义的特殊符号: 常用元字符: . 匹配除了换行以外的任意字符 \w 匹配字母或者数字或下划线 \s 匹配任意的空白符 \d 匹配数字 \n 匹配一个换行符 \t 匹 ...

  9. python正则表达式03--字符串中匹配数字

    import re# \d+ 匹配字符串中的数字部分,返回列表 ss = 'adafasw12314egrdf5236qew' num = re.findall('\d+',ss) print(num ...

最新文章

  1. 网站推广专员浅析网站推广期间如何防止关键词出现下降情况?
  2. 【运筹学】表上作业法 ( 示例 | 使用 “ 闭回路法 “ 计算检验数判定最优解 )
  3. QSlider QLCDNumber 最常用的函数和 信号槽 (以后用到在加)
  4. 如何选择适合自己的CMS建站系统
  5. mysql 加载数据校验_mysql 导入数据后的校验程序
  6. java实现中缀表达式转后缀表达式
  7. Autofac Webapi 的依赖注入
  8. codeforce 985C Liebig's Barrels
  9. 手机远程控制电脑方法(TeamViewer vs 向日葵)
  10. 计算机材料学常用计算软件,计算机在材料科学中的应用-用MaterialsStudio计算简单材料的能带.doc...
  11. 计算机导论国内外发展,计算机导论第一章计算机发展历程.ppt
  12. 视频专辑:LAMP兄弟连李明老师2011年新版原创Linux视频教程
  13. 计算机操作常用的五大功能是,计算机操作系统的五大功能是什么
  14. java 裁剪 pdf_java使用itext按页码拆分pdf文件
  15. 设备管理 设备控制方式
  16. 【电泳仪品牌】生科必知的电泳仪品牌
  17. torchvision的使用(transforms用法介绍)
  18. Matlab画星座图
  19. 学生网页作业——大型购物商城(1页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码
  20. python 以图搜图

热门文章

  1. 6G八大关键技术(国泰君安团队)
  2. Android下的弹幕的简单实现
  3. excel 日期选择器_Excel日期选择器工具
  4. linux下C++编程学习
  5. Android Studio 实现播放本地/网络视频
  6. pyth命令_如何:在Windows上设置用于从命令行运行.py文件的Python可执行文件
  7. 应届生落户上海申请及办理流程
  8. jane street market prediction 冠军方案 奇巧淫技与topline链接整理(3/3)
  9. 《万人如海一身藏》书摘
  10. php代码输出笑脸,利用HTML5中的Canvas绘制笑脸的代码