python 剔除汉字_剔除word 中的除汉字以外字符
在替换里选更多,勾选“使用通配符”
在查找里输入[0-9a-zA-Z],替换为留空,这样可以把所有数字和英文字母删掉。
编辑--->替换,依次全部替换"任意数字,任意字母,图形".
Java代码String str = "!!@@##你好110@#$%";
str.replaceAll("[[^\u4E00-\u9FA5]&&[^a-zA-Z0-9]]", "");
用习惯java的正则表达式,今天在python里也想用相同的正则处理一些文本,结果发现python和java的差别还挺大的,网上一顿搜索之后发现内容又是千篇一律,也满足不了我的需求,于是自己摸索后,总结python区别于java的几点注意事项:
目标:替换掉 汉字、英文、数字、常用中文标点符号 以外的其他字符
java实现:
python实现:
注意:
(1)python里正则表达式的写法与java相同,但是一定要在前面加”ur“,u的意思是表明后面有Unicode字符,这里汉字的范围为”\u4e00-\u9fa5“,这个是用Unicode表示的,所以前面必须要加”u“;字符”r“的意思是表示忽略后面的转义字符,这样简化了后面正则表达式里每遇到一个转义字符还得挨个转义的麻烦
(2)python里替换是用sub(”要替换为的字符“,”原始字符串“)函数,而不是replaceAll(”正则表达式“,”要替换为的字符“)
(3)这也是我栽了个大跟头的坑......编码问题!由于我是读的utf-8文件,python也指定的utf-8编码,不管怎么替换总会发现有乱码,原因是我的正则表达式是Unicode的(因为前面加了u,而且里面汉字使用Unicode表示的),而读进来的字符串是utf-8格式的,结果就是所有英文字符可以替换成功,而汉字就开始出现乱码了,解决方法是decode(‘utf-8’)把读进来的字符串转换成Unicode就可以了。
java转写python真是各种别扭哇~~~写下来省的以后忘了~
python 剔除汉字_剔除word 中的除汉字以外字符相关推荐
- python word保存图_使用python matplotlib 画图导入到word中如何保证分辨率
在写论文时,如果是菜鸟级别,可能不会花太多时间去学latex,直接用word去写,但是这有一个问题,当我们用其他工具画完实验彩色图时,放到word中会有比较模糊,这有两个原因导致的. 原因一:图片导入 ...
- python画图模糊_使用python matplotlib 画图导入到word中如何保证分辨率
在写论文时,如果是菜鸟级别,可能不会花太多时间去学latex,直接用word去写,但是这有一个问题,当我们用其他工具画完实验彩色图时,放到word中会有比较模糊,这有两个原因导致的. 原因一:图片导入 ...
- latex公式编号_在Word中快速编写公式
在使用Word编写文章时,总会遇到书写数学公式的情况.使用Word的公式输入工具需要频繁地使用鼠标,因而编写公式会显得繁琐麻烦,那么有什么办法可以优雅地在Word中书写公式呢?其实Word早在Word ...
- 用python的win32com模块替换word中的文字搞定批量打印奖状
六一将至,学校要表彰优秀同学,于是安排我去打印奖状.按照一般的情况,打印奖状都是打印个模板批量复印,然后手工填写名字,然后我们的校长特别叮嘱我说,名字也要用打印的,这样比较正式.看到获奖名单上的100 ...
- python selenium 下拉列表_从下拉列表中选择python selenium选项
我试图使用下面的代码使用selenium(python)从网页上的下拉列表中选择一个选项.在from selenium import webdriver from selenium.webdriver ...
- excel表格数字显示不全_从word中把身份证号码复制到excel表格中完整显示身份证号码后4位...
如果直接从word中复制内容,在excel表格中进行粘贴处理,gif动画演示如下: 在word中,身份证号显示是完整的,而直接复制到excel表格会显示成E*17,这是科学计数法.双击单元格显示出 ...
- python临床数据_从临床试验中获取数据
我正在开发一个小Python函数来从clinicalTrials.gov中获取数据.从每个研究记录中,我想从中找出研究的目标条件.例如,对于this研究记录,我需要以下内容:conditions = ...
- python注入进程_向进程中注入Python代码
我想把Python代码注入到一个进程中,当它注入时,它似乎会使我的进程崩溃.我没有在我自己的程序中得到任何错误,但目标进程停止工作.被调用的非托管api没有给我任何错误,并且似乎已经正确地执行了它们的 ...
- word中套用表格样式在哪里_在Word中,关于“套用表格样式”的用法,下列说法正确的是()...
[单选题]茄子的分枝习性属于 [判断题]在Word编辑状态下,当选定若干文字后,用鼠标左键单击"常用"工具栏"显示比例"列表框中的下拉按钮并选定"75 ...
- word标尺随缩进移动_在Word中在标尺上设置缩进和制表符时如何获取详细的度量...
word标尺随缩进移动 When setting indents or tabs on the ruler in Microsoft Word, you can see approximate mea ...
最新文章
- 第3关:递归实现二叉树左右子树交换
- ArcGIS Web 应用开发框架(ADF)中的Ajax
- java进入编程界面_java – 编程到界面是什么意思?
- 如何使用LaTeX让自己不乱?
- DL之AlexNet:AlexNet算法的架构详解、损失函数、网络训练和学习之详细攻略
- 球迷必备Euro Cup Mobile 2008 !-dopod touch diamond试用之欧洲杯
- python queue队列
- Hibernate 简介
- python中空格替换_Python替换空格
- linux的目录创建时间,LINUX下文件创建时间问题
- 怎么在html插入谷歌地图,html页面插入百度or谷歌地图
- python基础代码大全-python文件及目录操作代码汇总
- 自动驾驶_高精地图与车辆协同
- 让用户输入一个月份,判断这个月是哪个季节?
- 教您在Excel中批量生成二维码
- 第十三届蓝桥杯大赛软件赛省赛真题
- Vue CLI3不兼容IE11打开空白报错SCRIPT1003: 缺少 ‘:‘
- 超实用:数字金额转成人民币大写
- 在VS2010下如何使用头文件unistd.h
- 软件外包公司的优缺点
热门文章
- 矩阵正定 matlab,MatLab的:CHOL矩阵必须是正定
- 营业增加值公式简要解析
- java 组件是什么意思_java中组件是什么意思?
- 通过添加css样式cursor属性,改变鼠标的外形,变成放大镜
- [一步一步MVC]第四回:漫谈ActionLink,有时“胡搅蛮缠”
- 关于登陆百度等网站显示‘’隐私设置错误”的问题
- python基础(二十三):面向对象编程精髓演练(选课系统)、封装
- 销售团队管理规章制度
- [原]产品经理和韦小宝
- 互联网金融常见的一些业务