检查word文档的连续重复字,例如“用户的的资料”或“需要需要用户输入”之类的情况。Word测试文档的内容由学生决定。

import re
# 导入正则的一个模板
from docx import Document
# 导入一个模板,来使用doc文件
doc =Document('testdoc.docx')
text = ''.join( (p.text for p in doc.paragraphs) )
# 把内容放到text里面
result = re.findall(r'(([\u4e00-\u9fa5、!:;,]).?\2)',text)
# 写一个正则来判断是否是重复的词
for word in result:print(word[0])

(叠词检查器)检查word文档的连续重复字,例如“用户的的资料”或“需要需要用户输入”之类的情况。Word测试文档的内容由学生决定。相关推荐

  1. 【Python】Word文档重复字检测程序

    重复字检测 要求: 1.使用外置库python-docx 2.将检测算法封装为函数并调用此函数实现功能 3.连续重复字删除到只剩一个 4.自定义指定某个字或词,输出出现次数 5.word文档来源不限, ...

  2. 【Python学习】Word文档重复字检测程序

    重复字检测 要求: 1.使用外置库python-docx 2.将检测算法封装为函数并调用此函数实现功能 3.连续重复字删除到只剩一个 4.自定义指定某个字或词,输出出现次数 5.word文档来源不限, ...

  3. Python使用正则表达式检查书稿中不应该出现的重复字

    问题描述:在编写书稿和反复修改书稿时,很容易有多字的情况,例如"用户的的资料"."需要需要用户输入",这些不小心的错误用肉眼很难完全发现.但是设定好规则之后,代 ...

  4. 去除字符串的叠词:我我....我...我.要...要要...要学....学学..学.编..编编.编.程.程.程..程

    由于StringBuffer定义字符串对象可以对字符串进行灵活操作,所以本人选用StringBuffer进行操作,String虽然也可以,但过于繁琐,总是要接收返回的字符串对象.而且请读者注意,题目要 ...

  5. 测试管理007:测试文档 - 让测试人员纠结与无奈的测试工作

    [概述] 测试文档是测试过程中输出的测试工作产品,类似于软件工作产品.然而实践中经常面临有很多的测试文档需要撰写,而使用文档的效果却是非常有限.本文阐述了测试文档深度与广度选择需要考虑的一些因素. [ ...

  6. 批量取消隐藏工作表 + 批量删除隐藏工作表(office2019)--2020-5-26更新(不写代码删除隐藏工作表,可使用文档检查器)

    1. VBA小代码,批量取消隐藏工作表 Sub 批量取消隐藏工作表()Dim sht As Worksheet'定义变量For Each sht In Worksheets'循环工作簿里的每一个工作表 ...

  7. java递归看回文,如何使用正则表达式实现递归回文检查器? [关闭]

    如果我理解正确,你想在Java中创建一个使用正则表达式的递归回文检查器 . 我对学习Java感兴趣,所以我把它作为我自己的"家庭作业问题",但它也可能是你的 . import ja ...

  8. 介绍 Java 平台的 Jazzy:一种新的拼写检查器 API

    计算机擅长执行快速搜索操作,可以根据给定的搜索词,对大量存储的信息快速进行搜索.但是,拼写检查应用程序所要求的搜索能力,不仅仅是正确的字符串匹配.在这篇文章中,我将介绍搜索算法的一些历史,包括语音匹配 ...

  9. solr创建索引_Solr:创建拼写检查器

    solr创建索引 在上一篇文章中,我谈到了Solr Spellchecker的工作原理,然后向您展示了其性能的一些测试结果. 现在,我们将看到另一种拼写检查方法. 与其他方法一样,此方法使用两步过程. ...

最新文章

  1. Alpha 冲刺 (2/10)
  2. Objective-C Reflection(Objective-C 反射机制)实用随笔笔记(持续更新)
  3. PAT_B_1006 换个格式输出整数
  4. LINUX下简单制作QCOW2镜像
  5. spring aop使用
  6. 二维分类教案_屈老师中班数学教案《有趣的笔》
  7. linux硬件驱动网站,linux怎么查看已装好硬件驱动
  8. 《Head First Servlets JSP》-11-Web应用部署
  9. 带时滞传染病模型分析【基于matlab的动力学模型学习笔记_4】
  10. VSCode 过滤.meta 文件
  11. CodeForces 140C New Year Snowmen (贪心+优先队列)
  12. 出现Only the original thread that created a view hierarchy can touch its views.的错误
  13. 大话设计模式(php版)第五章——依赖倒装原则
  14. Docker系列之三:使用Docker镜像和仓库
  15. 【Android -- SDK】高德地图的使用
  16. 【转】BCWS、BCWP、ACWP的理解
  17. 【x86架构】x86上的那些不明觉厉的功能
  18. JS之使用Echarts画出人际关系图
  19. 我也不晓得为啥要拉这个清单
  20. 基于embedded.mobileprovision描述文件查看iOS苹果证书到期时间三种方案

热门文章

  1. PyQt5的表格创建
  2. (学无止境)linux 虚拟机联网
  3. 关于找工作:2017.5 招聘网站市场行情工作(iOSAndroid)简历面试租房 + (补充篇)2019.4 济南行
  4. 动态规划——地下城游戏
  5. 纯用CSS来实现3D立方体旋转效果
  6. 哪种蓝牙耳机佩戴舒服?佩戴舒适度最高的半入耳蓝牙耳机推荐
  7. 网页中常见的移动悬浮框的制作
  8. Spring Boot 中密码加密的两种姿势!
  9. python基础教程目录-Python基础教程(第2版 修订版) 简介,目录书摘
  10. java数组循环_Java之循环结构及数组