【Python学习】Word文档重复字检测程序
重复字检测
要求:
1.使用外置库python-docx
2.将检测算法封装为函数并调用此函数实现功能
3.连续重复字删除到只剩一个
4.自定义指定某个字或词,输出出现次数
5.word文档来源不限,建议使用正则表达式实现算法
代码展示
import docx
import reclass Solution:def my_remove(self):while 1:end_symbol = len(self)i = 0while i < len(self) - 1:if i >= 0 and self[i] == self[i + 1]:self = self[:i + 1] + self[i + 2:]i -= 2i += 1if end_symbol == len(self):return self# 连续重复字删除到只剩一个def my_find(my_str, your_find):count = 0for index, value in enumerate(my_str):if your_find == value:count += 1print(your_find, '出现的位置:', index) # 出现的位置print(your_find, '出现的次数:', count) # 出现的次数# 获取字符串出现位置和次数doc = docx.Document(r'F:\python.docx')
# 这里的F:\python.docx为文件路径
content = ''.join(i.text for i in doc.paragraphs)
print('原内容:{}'.format(content))
# 所有段落合并为一个字符串Solution.my_find(content, '2')
content = Solution.my_remove(content)
print('删改重复值后:{}'.format(content))
【Python学习】Word文档重复字检测程序相关推荐
- 【Python】Word文档重复字检测程序
重复字检测 要求: 1.使用外置库python-docx 2.将检测算法封装为函数并调用此函数实现功能 3.连续重复字删除到只剩一个 4.自定义指定某个字或词,输出出现次数 5.word文档来源不限, ...
- python关闭word文件_使用Python退出Word文档的问题
这是我第一次使用这个,所以要友好:)基本上我的问题是我正在制作一个程序,用于打开许多Microsoft Word 2007文档并从该文档的某个表中读取并写入该信息的Excel文件有超过1000字的文档 ...
- python操作word文档(python-docx)
python操作word文档(python-docx) 1. 效果图 1.1 python-docx文档标题段落(等级.加粗.斜体.居中)效果图 1.2 python-docx字体(加粗.斜体.居中. ...
- python 读取word_教你怎么使用 Python 对 word文档 进行操作
使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...
- python读取word文档并做简单的批量文档筛选
python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...
- Python实现Word文档标题格式判断
本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 引言 在日常生活里,不管是办公.学习还是制作邀请函.请柬.简历等等,我们都会使用一个软件Microso ...
- python排版word文档命令方法大全_教你怎么使用Python对word文档进行操作
使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...
- python怎么查找word文档_教你怎么使用Python对word文档进行操作
使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...
- 一、使用Python对word文档进行操作
使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...
最新文章
- 嵌入式和机械哪个好?机械转嵌入式好转吗?
- 使用java检测网络连接状况
- Silverlight 2 数据绑定演示程序(附源代码下载)
- mattermost
- pytorch自定义数据集DataLoder
- OpenCV安全屏障摄像机Security Barrier Camera的实例(附完整代码)
- Web开发学习路线图
- 人工智能对医疗和健康产业的冲击和革命——体外克隆
- 【渝粤题库】广东开放大学 岭南文化概论专科 形成性考核
- 五十个小技巧提高PHP执行效率
- 水果手绘插画素材|一眼就想吃了!
- CuteEditor 6.0一个很奇怪的Bug
- MATLAB bwlabel
- fspecial在matlab中什么意思,Matlab中fspecial的用法 | 学步园
- ]计算机专业就业方向 .
- 四川锦城学院计算机专业好不,四川大学锦城学院计算机专业如何?
- 机器学习笔记(六)-神经网络:概述
- 【数据可视化工具DataEase】如何修改内置 MySQL 容器名
- 记录一次vue项目引入GoogleMap API进行地图定位
- CSDN专访左程云,算法之道