在pdf转为文本的时候,经常会多出空格,影响数据观感,因此需要去掉文本中多余的空格,而文本中的英文之间的正常空格需要保留,输入输出如下:

input:我今天 赚了 10 个亿,老百姓very happy。

output:我今天赚了10个亿,老百姓very happy。

代码

def clean_space(text): """" 处理多余的空格 """ match_regex = re.compile(u'[\u4e00-\u9fa5。\.,,::《》、\(\)()]{1} +(?

python去除英文单词之间多余的空格

re.sub(" +", " ", s)

import re s = " info has been found (+/- 100 pages, and 4.5 mb of .pdf files) now i have to wait untill our team leader has processed it and learns html. "re.sub(" +", " ", s)

' '.join(s.split())

s = " info has been found (+/- 100 pages, and 4.5 mb of .pdf files) now i have to wait untill our team leader has processed it and learns html. "s = ' '.join(s.split())s

更多关于python使用正则表达式去除多余空格方法请查看下面的相关链接

以上就上有关python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解的全部内容,学步园全面介绍编程技术、操作系统、数据库、web前端技术等内容。

python正则去掉重复单词_python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解 | 学步园...相关推荐

  1. python中文字符串多余空格_python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解...

    python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解 在pdf转为文本的时候,经常会多出空格,影响数据观感,因此需要去掉文本中多余的空格,而文本中的英文之间的正常空格需要保留,输入 ...

  2. python中使用正则表达式去除中文文本多余空格,英文之间的保留

    需求 在pdf转为文本的时候,经常会多出空格,影响数据观感,因此需要去掉文本中多余的空格,而文本中的英文之间的正常空格需要保留,输入输出如下: input:我今天 赚了 10 个亿,老百姓very h ...

  3. python中search和match的区别_Python中正则表达式match()、search()函数及match()和search()的区别详解...

    match()和search()都是python中的正则匹配函数,那这两个函数有何区别呢? match()函数只检测RE是不是在string的开始位置匹配, search()会扫描整个string查找 ...

  4. python正则匹配固定汉字_Python用正则表达式匹配汉字

    原博文 2019-11-07 19:54 − #### Python用正则表达式匹配汉字 ##### 匹配多个汉字,不包括空格 ```python import re res = re.match(r ...

  5. python等比例压缩图片_python(PIL)图像处理(等比例压缩、裁剪压缩) 缩略(水印)图详解...

    #coding:utf-8 ''' python图片处理 @author:fc_lamp @blog:http://fc-lamp.blog.163.com/ ''' import Image as ...

  6. python b64encode_Python base64模块详解 | 学步园

    Python base64模块是用来作base64编码解码的. 最简单的加解密实例: import base64 str1 = 'djhui' str2 = base64.b64encode(str1 ...

  7. python字典的键可以用列表吗_python字典多键值及重复键值的使用方法(详解)

    在Python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多键值 字典的多键值形式如下: ...

  8. python列表的内置方法_Python内置方法详解

    1. 字符串内置方法详解 为何要有字符串?相对于元组.列表等,对于唯一类型的定义,字符串具有最简单的形式. 字符串往往以变量接收,变量名.可以查看所有的字符串的内置方法,如: 1> count: ...

  9. python调用adb shell命令_Python之使用adb shell命令启动应用的方法详解

    Python之使用adb shell命令启动应用的方法详解 一直有一个心愿希望可以用Python做安卓自动化功能测试,在一步步摸索中,之前是用monkeyrunner,但是发现对于控件ID的使用非常具 ...

最新文章

  1. 独家 | 数据管理在零售、医疗、制造、娱乐、建筑等行业的应用
  2. QWidget子窗口中setStyleSheet无效,解决方法
  3. C++ dlopen mini HOWTO 一篇非常好的介绍C++ dlopen linux/mac os x 编程的资料
  4. mysql binlog研究
  5. 分布式实物实现方式_这是您完成实物产品设计任务的方式
  6. 如何使用单例EJB和MBean构建和清除参考数据缓存
  7. leetcode360. 有序转化数组
  8. requestfacade 这个是什么类?_Java 的大 Class 到底是什么?
  9. java i/o 流详解_java I/O流详解
  10. php curl for win7_win7 wamp 64位 php环境开启curl服务遇到的问题及解决方法
  11. java jframe 设置背景图片_JAVA怎样设置JFrame的背景图片呢?谁能教教我怎么弄背景图片...
  12. flex 颜色值uint与16进制的转换
  13. Window Server 2008 R2 文件权限管理
  14. [android] 代码注册广播接收者利用广播调用服务的方法
  15. paip.网站扫描安全工具hp WebInspect 使用指南
  16. button类java_Swing JButton类
  17. MATLAB读取图片时报错:“错误使用 fopen 找不到文件,确保文件存在且路径” 的原因及解决方法
  18. 如何使用电骡eMule上传资源
  19. 微信小程序图片自动播放功能
  20. 数字图像-颜色表介绍

热门文章

  1. abp项目怎样发布到服务器,ABP框架的基础配置及依赖注入讲解
  2. druid监控页面授权
  3. MyBatis高频面试题
  4. IDEA 自动补充 结尾分号或自动换行
  5. 程序员怎么合理的利用自己的业余时间接单赚钱,怎么才能赚到比本职工作还多的钱呢?
  6. 哥德尔:伟大的数学家与饱受精神疾病折磨的患者
  7. 忽尔今夏,SpringSide 3.0
  8. 在unity中更改天空盒的几种方式
  9. springboot+dubbo+tomcat部署出错问题
  10. Python获取日期是星期几