重复字检测

要求:

1.使用外置库python-docx
2.将检测算法封装为函数并调用此函数实现功能
3.连续重复字删除到只剩一个
4.自定义指定某个字或词,输出出现次数
5.word文档来源不限,建议使用正则表达式实现算法

代码展示

import docx
import reclass Solution:def my_remove(self):while 1:end_symbol = len(self)i = 0while i < len(self) - 1:if i >= 0 and self[i] == self[i + 1]:self = self[:i + 1] + self[i + 2:]i -= 2i += 1if end_symbol == len(self):return self# 连续重复字删除到只剩一个def my_find(my_str, your_find):count = 0for index, value in enumerate(my_str):if your_find == value:count += 1print(your_find, '出现的位置:', index)  # 出现的位置print(your_find, '出现的次数:', count)  # 出现的次数# 获取字符串出现位置和次数doc = docx.Document(r'F:\python.docx')
# 这里的F:\python.docx为文件路径
content = ''.join(i.text for i in doc.paragraphs)
print('原内容:{}'.format(content))
# 所有段落合并为一个字符串Solution.my_find(content, '2')
content = Solution.my_remove(content)
print('删改重复值后:{}'.format(content))

【Python学习】Word文档重复字检测程序相关推荐

  1. 【Python】Word文档重复字检测程序

    重复字检测 要求: 1.使用外置库python-docx 2.将检测算法封装为函数并调用此函数实现功能 3.连续重复字删除到只剩一个 4.自定义指定某个字或词,输出出现次数 5.word文档来源不限, ...

  2. python关闭word文件_使用Python退出Word文档的问题

    这是我第一次使用这个,所以要友好:)基本上我的问题是我正在制作一个程序,用于打开许多Microsoft Word 2007文档并从该文档的某个表中读取并写入该信息的Excel文件有超过1000字的文档 ...

  3. python操作word文档(python-docx)

    python操作word文档(python-docx) 1. 效果图 1.1 python-docx文档标题段落(等级.加粗.斜体.居中)效果图 1.2 python-docx字体(加粗.斜体.居中. ...

  4. python 读取word_教你怎么使用 Python 对 word文档 进行操作

    使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...

  5. python读取word文档并做简单的批量文档筛选

    python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...

  6. Python实现Word文档标题格式判断

    本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 引言 在日常生活里,不管是办公.学习还是制作邀请函.请柬.简历等等,我们都会使用一个软件Microso ...

  7. python排版word文档命令方法大全_教你怎么使用Python对word文档进行操作

    使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...

  8. python怎么查找word文档_教你怎么使用Python对word文档进行操作

    使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...

  9. 一、使用Python对word文档进行操作

    使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...

最新文章

  1. 嵌入式和机械哪个好?机械转嵌入式好转吗?
  2. 使用java检测网络连接状况
  3. Silverlight 2 数据绑定演示程序(附源代码下载)
  4. mattermost
  5. pytorch自定义数据集DataLoder
  6. OpenCV安全屏障摄像机Security Barrier Camera的实例(附完整代码)
  7. Web开发学习路线图
  8. 人工智能对医疗和健康产业的冲击和革命——体外克隆
  9. 【渝粤题库】广东开放大学 岭南文化概论专科 形成性考核
  10. 五十个小技巧提高PHP执行效率
  11. 水果手绘插画素材|一眼就想吃了!
  12. CuteEditor 6.0一个很奇怪的Bug
  13. MATLAB bwlabel
  14. fspecial在matlab中什么意思,Matlab中fspecial的用法 | 学步园
  15. ]计算机专业就业方向 .
  16. 四川锦城学院计算机专业好不,四川大学锦城学院计算机专业如何?
  17. 机器学习笔记(六)-神经网络:概述
  18. 【数据可视化工具DataEase】如何修改内置 MySQL 容器名
  19. 记录一次vue项目引入GoogleMap API进行地图定位
  20. CSDN专访左程云,算法之道

热门文章

  1. 接口文档示例(详解)
  2. 【区块链论文阅读】计算机网络顶会INFOCOM(一)
  3. 对于盈帆报表设计器的介绍(报表工具)
  4. 在Wifi网络中嗅探明文密码(HTTP POST请求、POP等)
  5. 程序员买房指南——LZ的三次买房和一次卖房经历
  6. 离散实验 实验二 真值表
  7. 第八课:通道抠图1(毛绒玩具)
  8. 常规设置Apache服务器实例
  9. 如何创造被动收入 | 我的知乎Live
  10. 关于maxent报错的解决办法-have different geographic dimensions; 海拔-土壤-19个气候因子等混合使用时MaxEnt报错解决方法