我想清理我的评论数据。我的代码是:def processData(data):

data = data.lower() #casefold

data = re.sub(']*>',' ',data) #remove any html

data = re.sub(r'#([^\s]+)', r'\1', data) #Replace #word with word

remove = string.punctuation

remove = remove.replace("'", "") # don't remove '

p = r"[{}]".format(remove) #create the pattern

data = re.sub(p, "", data)

data = re.sub('[\s]+', ' ', data) #remove additional whitespaces

pp = re.compile(r"(.)\1{1,}", re.DOTALL) #pattern for remove repetitions

data = pp.sub(r"\1\1", data)

return data

这段代码几乎可以正常工作,但是仍然有一个问题。

因为这句话“她在公共服务部门工作”

我知道“她在公共服务部门工作”。在

问题是字符串标点后没有空格。在

我希望我的句子是这样的“她在公共服务部门工作”。在

你能帮我写代码吗?在

python末尾加空格,如何在后面添加空格字符串.标点符号在Python中?相关推荐

  1. Word2019中Visio对象图片插入题注时自动删除标签与编号前的空格,编号后添加空格

    问题引入 撰写论文时为了修改方便,通常以插入题注和交叉引用的方式来给图片标号,这样修改图片和图号后可以方便.自动地更新. 然而,Word在插入题注上从03到13一直没有针对中国用户优化. 插入题注的标 ...

  2. c语言printf 空格,在打印输出前面添加空格,如在C中[printf(%2i)]

    我已经用C编写了这个练习,在那里我能够在printf(%2i)和printf(%3i)的帮助下输出格式良好的表.在 在Python中,如何在数字前面添加空格以使其看起来更好?在#! python3 # ...

  3. Word插入题注优化(自动删除标签与编号前的空格,编号后添加空格)

    简介 最近在论文写作时发现,对图或者表右击进行插入题注时格式有点不正确,会在标签和编号之间多一个半角空格,而编号和题注内容之间又缺少一个空格,这也是Word目前对中文支持不太好的地方.我们常规的格式应 ...

  4. python末尾加空格_Python3基础 print(,end=) 输出内容的末尾加入空格

    ? python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 conda : 4.5.11 type setting : Markdo ...

  5. python怎么加图片_python怎么实现添加图片

    python怎么实现添加图片,文件,图片,方法,资源,前缀 python怎么实现添加图片 易采站长站,站长之家为您整理了python怎么实现添加图片的相关内容. 一.导入图片资源 方法1:直接从源图片 ...

  6. python使用input函数时、必须添加提示文字-浅谈python3中input输入的使用

    今天谈一下关于python中input的一些基本用法(写给新手入门之用,故只谈比较实用的部分). 首先,我们可以看一下官方文档给我们的解释(在python的shell中输入命令即可): 上面的英文说的 ...

  7. python动态加载模块有什么用_人生苦短我用python(02)动态加载模块

    继第一期[人生苦短我用Python系列专栏]发布后,深受广大睿普迷的一致好评,经常问小普第二期什么时候出呀?好期待~ 来来来小普这就呈上第二期[02动态加载模块] 错过了第一期的小伙伴们可以点此穿越哦 ...

  8. 去掉图题注 空格_【转载】论文排版-Word插入题注时自动删除标签与编号前的空格,编号后添加空格...

    Sub InsertCaption()'修改系统插入"题注"命令 '功能:自动删除标签与编号间的空格(英文除外),并在题注数字后添加一个空格:适用于:Word 2003 - 201 ...

  9. python pdf 加水印_python encode64用PDFlib给PDF添加水印(Python)

    以下是用PDFlib给pdf添加水印的速记,另外PDFStamp是个很好用的pdf水印工具.PDFlib功能比较多.杂:PDFStamp功能单一,更方便使用.据walker测试,PDFlib会比PDF ...

最新文章

  1. 性能压测服务器502报错,一种交易系统的性能测试方法及相关服务器
  2. 【Redis系列】深入浅出Redis主从复制之哨兵模式【实践】
  3. 清华计算机学院吴建平,吴建平
  4. gateway sentinel 熔断 不起作用_Sentinel 的一些概念与核心类介绍
  5. 一个基于ngrx的计数器例子
  6. 设计模式之 里氏替换原则
  7. 删除VS.NET起始页上项目名称的方法.
  8. 线性表—顺序表-顺序表基本运算的实现
  9. react-native 异常处理 Execution failed for task ':app:mergeDebugResources'.
  10. mysql-proxy实现读写分离
  11. Mifare Classic Tool(MCT)汉化版
  12. 【基于机器学习/深度学习的睡眠信号分类】主题必读论文推荐
  13. 贴片晶振的焊接方法和注意事项
  14. USB大容量存储类规范概述
  15. CCTV十集大型纪录片《华尔街》高速下载地址
  16. 【工具推荐】进程查看管理工具——Process Explorer
  17. 六西格玛dfss_六西格玛设计咨询
  18. Codeforces 1076 - 题集
  19. 一键获取网易互娱内推攻略,快人一步拿offer!
  20. PostgreSQL 一复合查询SQL优化例子 - (多个exists , 范围检索 , IN检索 , 模糊检索 组合)...

热门文章

  1. Java学习笔记 第八天
  2. python画魄罗代码_LOL2月5日红贴 慎嘲讽技能Bug将修复魄罗英雄新原画
  3. execute、executeUpdate、executeQuery三者的区别(及返回值)
  4. 市场驱动传播趋势,通过AIDMA、AISAS认知ISMAS
  5. 攻防世界MISC新手练习区通关教程
  6. EAS工作流审批信息查询
  7. 自私基因的生物计算机模拟
  8. 房地产行业“财报视角看地产”系列之四:房地产企业负债类科目及隐性负债深度解析-202101.PDF
  9. 《Python深度学习》第五章-5(可视化过滤器)读书笔记
  10. 如何访问嵌入式设备sd卡上的文件