重复字检测

  1. 要求:

1.使用外置库python-docx
2.将检测算法封装为函数并调用此函数实现功能
3.连续重复字删除到只剩一个
4.自定义指定某个字或词,输出出现次数
5.word文档来源不限,建议使用正则表达式实现算法

2.代码展示:

import docx
import reclass Solution:def my_remove(self):while 1:end_symbol = len(self)i = 0while i < len(self) - 1:if i >= 0 and self[i] == self[i + 1]:self = self[:i + 1] + self[i + 2:]i -= 2i += 1if end_symbol == len(self):return self# 连续重复字删除到只剩一个def my_find(my_str, your_find):count = 0for index, value in enumerate(my_str):if your_find == value:count += 1print(your_find, '出现的位置:', index)  # 出现的位置print(your_find, '出现的次数:', count)  # 出现的次数# 获取字符串出现位置和次数doc = docx.Document(r'F:\python.docx')
# 这里的F:\python.docx为文件路径
content = ''.join(i.text for i in doc.paragraphs)
print('原内容:{}'.format(content))
# 所有段落合并为一个字符串Solution.my_find(content, '2')
content = Solution.my_remove(content)
print('删改重复值后:{}'.format(content))
  1. 注意:
    所操作的文档必须要存在,否则报错。

【Python】Word文档重复字检测程序相关推荐

  1. 【Python学习】Word文档重复字检测程序

    重复字检测 要求: 1.使用外置库python-docx 2.将检测算法封装为函数并调用此函数实现功能 3.连续重复字删除到只剩一个 4.自定义指定某个字或词,输出出现次数 5.word文档来源不限, ...

  2. 如何让竖行文本框从下往上_word文档字体一句话排成一上一下,怎样把一个横着排列的word文档的字体改为从上到下竖着排列?...

    怎样把一个横着排列的word文档的字体改为从上到下竖着排列? 以word2007,说明如下: 选中竖排的内容,依次点击"页面布局"."文字方向"."垂 ...

  3. python word 合并单元格_在word文档选项卡中检测合并单元格

    一点背景 我有一个软件规范,我需要以表格的形式解析需求.它们的格式也不总是相同的.我继承了一个python脚本,它使用win32com解析word文档,然后openpyxl将需求导出到excel文件, ...

  4. python Word 文档

    利用 python-docx 模块, Python 可以创建和修改 Word 文档,它带有.docx 文件扩展名.运行 pip install python-docx,可以安装该模块. 注意:OSI ...

  5. 计算机操作重复的词语,怎么查找Word文档重复词语

    回答:WPS查找重复值的方法如下: 1.用WPSOffice表格打开需要查询的数据表格; 2.把需要查询的数据点住,点击鼠标左键滑动,使其被鼠标图蓝覆盖上; 3.在上方功能菜单栏中,找到数据按钮; 4 ...

  6. 挽救损坏的 Word 文档

    挽救损坏的 Word 文档            我们在日常的工作中,使用Word来作文字处理是再平常不过的了,但Word文档莫明的出些问题,也是会经常遇到的,下面我们就一起由浅入深的,从简单到复杂的 ...

  7. word文档图标变成白纸_word图标变了_word图标变成白底方框

    Word图标怎么变成docx了 请问怎么变回去啊 原因:因为设置了Word文档用了写字板程序打开. 解决方法: 1.首先在电脑中可以看到原本的Word文档变成了下图的显示样式. word文件图标都变了 ...

  8. 打开损坏的Word文档-word修复_目前只用过打开并修复

    在打开Word文档时,如果程序没有响应,那么很有可能是该Word文档已经损坏.此时,可试试以下所述方法,或许能够挽回你的全部或部分损失. 最简单的方法,下载WPS Office 2005,这个国产软件 ...

  9. 2篇word文档比较重复率_继续教育 | 你该知道的论文小技巧——重复率检测

    点击上方蓝字关注我们 一年一度的毕业季又到了,不少学生愁眉苦脸,最近看到2016级.2017级的小伙伴们都开始疯狂加油写论文,但是写毕业论文,重复率必须达标.据报道,部分学校的毕业论文"查重 ...

最新文章

  1. mysql order by 多字段排序
  2. 史上最全的SpringCloud入门学习教程
  3. AMD:“全民四核”大作战
  4. c语言两个for语句并列执行_C语言两个for语句如何并列编写?
  5. POJ - 3347 Kadj Squares(思维+几何)
  6. OAuth认证原理及HTTP下的密码安全传输
  7. 机器视觉【基础】什么是机器视觉?
  8. 关闭线程的的三种方法
  9. mipi的dsi全称_MIPI扫盲——DSI介绍(二)
  10. 一起学Android之Intent
  11. 计算机网络技术教程-董文磊-专题视频课程
  12. 计算机教室管理员应知应会,教室管理
  13. 老毛桃u盘装系统linux,老毛桃U盘装系统教程详细步骤
  14. 计算机比赛参赛口号,计算机加油运动会口号
  15. 实验吧——安全杂项之“A记录”详解
  16. JDK8 Instant类的使用和LocalDate,LocalTime 和 LocalDateTime的介绍。
  17. 码云webhook node版
  18. 高德地图API画圆形、高的地图删除圆形打点
  19. 微信小程序实现两数相加
  20. Linux USB 驱动开发(三)—— 编写USB 驱动程序

热门文章

  1. 一个超级好用的插件—EIDE,在VSCODE下快速创建ARM工程
  2. 搜索支持html5的浏览器,HTML5的浏览器支持情况
  3. Oracle入门笔记(三)——Oracle数据类型
  4. php 获取当前URL信息
  5. 从事数字化转型的你,搞清楚这些数据类基础理念了吗?数据仓库、数据集市、数据湖、数据中台
  6. 自动化测试经典面试题-定位不到元素
  7. gsoap java_试图了解gsoap
  8. robomongo(robo3T)操作MongoDB数据库常用命令
  9. 打印机 树莓派安装cpus_树莓派3-搭建网络打印机服务器(支持PC,IPhone,Android打印)...
  10. MySQL 5.7安装教程