'''#利用python查找word文档中的关键词,支持多个文档和多个关键词
'''
# 导入所需库
import os,re
from docx import Document
global urur = "D:/test_doc" #全局变量读取输入路径
# key_word = '模糊查询' #全局变量读取关键字def get_doc_path (path) :file_list = os.listdir(path)# 正则匹配路径下所有.docx结尾的文件doc_list = [i for i in file_list if re.compile(r'\w+.docx').match(i)]#拼接ur进入doc_list,获得完整路径for i in range(len(doc_list)):doc_list[i] = ur + '/' + doc_list[i]return doc_list
#以段落为单位切片,并查找关键字
def find_text (path,word):document = Document(path)all_paragraphs = document.paragraphslist1 = []for paragraph in all_paragraphs:str1 = paragraph.textif str1.find(word) != -1 :list1.append(str1)if list1 == [] :list1.append('未找到关键字')return list1# else:print('notfind')#获取路径下txt中的关键字并返回一个list
def read_keyword (add) :with open(add+'/key_word.txt',encoding='utf=8') as f :key_word = f.readlines()for i in range(len(key_word)) :key_word[i] = key_word[i].strip()#去除换行符return key_wordkey_word = read_keyword(ur)
print(key_word)
doc_path = get_doc_path(ur)
print(doc_path)
list_word = []
document = Document()
for x in doc_path :document.add_heading(x,level=1)for i in key_word :document.add_paragraph(i , style='Intense Quote')for num in range(len(find_text(x,i))):no = num+1str(no)str1 = 'NO.' + str(no)document.add_paragraph(str1)#添加标号document.add_paragraph(find_text(x,i)[num])#写入正文
document.save(ur + '/result.docx')

利用python在word文档中查找关键字(支持多个文档和多个关键字)相关推荐

  1. python处理word或者pdf文件_利用python程序生成word和PDF文档的方法

    一.程序导出word文档的方法 将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob.Apache POI.Java2Word.iText等各种方式,以及使用fr ...

  2. Python3-word文档操作(三):利用python修改word文档的内容

    前两篇博文中,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文,以及利用python来获取word文档的内容.本篇学习利用python修改word文档的内容. 修改word ...

  3. word文档分节符如何删除_如何在Word文档中查找分节符

    word文档分节符如何删除 Section breaks in Word allow you to break up your document into sections and format ea ...

  4. linux在文档中查找内容,【Linux】用grep在文档中查找内容

    有时候,我们需要在文档中查找一些内容,常用grep.它在文档查找相关内容并输出匹配行. > 查找某关键字 在system.log中,查找包含keyword的行 grep 'keyword' sy ...

  5. 利用python制作word成绩报告

    利用python制作word成绩报告 1.导入 import openpyxl from docx import Document from docx.shared import Pt, Cm, RG ...

  6. 利用python获取word图表数据和修改图表信息

    利用python获取word图表数据和修改图表信息 起因咸鱼有个人问word怎么修改图表信息,想用docx库找不到关于图表的方法,这里用了Win32com. import time import wi ...

  7. ms office word2013教程 - 如何将A文档中的样式复制到B文档中

    将A文档中的样式复制到B文档中 选择 [文件] -> [选项],在弹出的 [Word选项] 框中选择 [加载项],然后按照图示进行操作,最后记得点击保存即可.

  8. python共享文件权限_利用Python实现在同一网络中的本地文件共享方法

    本文利用Python3启动简单的HTTP服务器,以实现在同一网络中共享本地文件. 启动HTTP服务器 打开终端,转入目标文件所在文件夹,键入以下命令: $ cd /Users/zero/Documen ...

  9. Python从Word/PPT/PDF中抽取图片

    Python从Word/PPT/PDF中抽取图片 PS 1:也是从网上各个帖子中学习的代码,因此代码的格式以及内容有粘贴网上其他大神的代码,如有侵权请告知删除 2:本次设计意在用pyinstaller ...

  10. 利用python向word文档模板中写入内容

    第一部分:先看成果 Talk is cheap show me the code!(我来翻译一哈:不bb上代码) import os os.chdir('D:\\python_major\\auto_ ...

最新文章

  1. java.lang.UnsupportedClassVersionError
  2. mysql是自动表锁定吗_MySQL数据库表怎么锁定
  3. 计算机科学在航空航天仿真模拟,2016年南京航空航天大学计算机科学与技术学院541计算机综合基础之数据结构复试笔试仿真模拟题...
  4. 税友集团java面试题
  5. Java知识积累-基础篇
  6. C++ 的变量书写规则探讨
  7. 点云3D目标检测学习(3):Complex YOLO
  8. SAP BUSINESS ONE的优势
  9. Eclipse 2017最佳20个插件
  10. c语言 stm32结构体赋值,STM32学习笔记9——结构体赋值问题
  11. shell批量修改后缀_用shell脚本批量修改文件后缀名
  12. python爬微博数据中心,网易微博爬虫(自定义关键字爬取微博数据)(附软件源码)...
  13. Django文档4.0(通俗易懂)
  14. 交通运输学计算机吗,交通运输专业所属学科门类是什么
  15. 大陆、港澳台身份证、护照、军官证、户口本的正则表达式
  16. 码医自学法V2.2(附名老中医)
  17. HDFS存储大量小文件居然有这样的问题!看我怎么搞定它!
  18. Docker - Docker Container及Container命令详解
  19. Electron中主进程和渲染进程之间的通信
  20. 九鼎Study210嵌入式开发板刷机笔记

热门文章

  1. MLDN Java学习笔记(4)
  2. Qt 简单的视频播放器
  3. 数据挖掘期末论文要求
  4. 静态网页-学校官网(附源码)
  5. 关于管理者应该拥有的的六十…
  6. [转载]SCJP 1.4 认证的初级教程
  7. UI控件Telerik UI for Silverlight发布R2 2019|附下载
  8. php编程最快明白第四讲,《PHP编程最快明白》第八讲:php启发和小结_php基
  9. 字符编码(GB 2312、GBK、UTF-8、UTF-16)
  10. CocosCreator之场景编辑器介绍