在PyCharm中运行《Word助手》即可进入如图1所示的系统主界面。在该界面中,通过顶部的工具栏可以选择所要进行的操作。


具体的操作步骤如下:
(1)实现Word转PDF。在Word助手的主窗体中,单击工具栏中的“Word转PDF”按钮,将打开“Word转PDF”子窗体,在该窗体中,首先单击“请选择Word文本所在路径”右侧的“…”浏览按钮,选择要转换源路径,这时系统将自动获取该路径下的全部Word文档文件,并显示在下方的列表中,然后单击“转换后PDF文件保存路径”文本框右侧的“…”浏览按钮,接下来,如果是想进行批量转换,那么单击“批量转换”按钮,开始转换,同时显示进度条,如图2所示,转换完成后,对应的文件路径将显示在下面的列表中。如果是合为一个PDF文件,则单击“合为一个PDF”按钮,开始转换,此时也将显示进度条,转换完成后,将显示合并后的文件路径到列表中,如图3所示。在PDF文件列表中,双击文件路径,可以使用PDF阅读软件打开该文件。


(2)实现提取Word文档页码。在Word助手的主窗体中,单击工具栏中的“统计Word文档页码”按钮,将打开“统计Word文档页码”子窗体,在该窗体中,首先单击“请选择Word文本所在路径”右侧的“…”浏览按钮,选择要统计文件的源路径,这时系统将自动获取该路径下的全部Word文档文件,并显示在下方的列表中,然后单击“开始统计”按钮,开始统计页码,同时显示进度条,如图4所示,统计完成后,每个Word文档的路径及对应的页码将显示在下面的表格中,并且在表格下方显示总页码,如图5所示。


(3)在Word助手的主窗体中,单击工具栏中的“统计提取总目录”按钮,将打开“提取总目录”子窗体,在该窗体中,首先单击“请选择Word文本所在路径”右侧的“…”浏览按钮,选择要统计文件的源路径,这时系统将自动获取该路径下的全部Word文档文件,并显示在下方的列表中,然后单击“开始提取”按钮,开始提取目录,同时显示进度条,如图6所示,统计完成后,在结果栏中将显示目录文件保存的位置,单击其右侧的“打开文件”按钮,将打开该文件,如图7所示。


部分源码如下,其余完整详见下载。
wx供重浩:创享日记
对话框发送:python文档助手
获取完整源码源文件+说明文档+可执行文件等

# -*- coding: utf-8 -*-# Form implementation generated from reading ui file 'mainWindow.ui'
# Created by: PyQt5 UI code generator 5.11.3
# WARNING! All changes made in this file will be lost!from PyQt5 import QtCore, QtGui, QtWidgets
from PyQt5.QtGui import QPixmap, QBrushclass Ui_MainWindow(object):def setupUi(self, MainWindow):MainWindow.setObjectName("MainWindow")MainWindow.resize(792, 572)self.centralwidget = QtWidgets.QWidget(MainWindow)self.centralwidget.setObjectName("centralwidget")MainWindow.setCentralWidget(self.centralwidget)self.menubar = QtWidgets.QMenuBar(MainWindow)self.menubar.setGeometry(QtCore.QRect(0, 0, 792, 18))self.menubar.setObjectName("menubar")MainWindow.setMenuBar(self.menubar)self.statusbar = QtWidgets.QStatusBar(MainWindow)self.statusbar.setObjectName("statusbar")MainWindow.setStatusBar(self.statusbar)self.toolBar = QtWidgets.QToolBar(MainWindow)self.toolBar.setObjectName("toolBar")MainWindow.addToolBar(QtCore.Qt.TopToolBarArea, self.toolBar)self.actionWord_PDF = QtWidgets.QAction(MainWindow)self.actionWord_PDF.setObjectName("actionWord_PDF")self.action_Word = QtWidgets.QAction(MainWindow)self.action_Word.setObjectName("action_Word")self.action_list = QtWidgets.QAction(MainWindow)self.action_list.setObjectName("action_list")self.toolBar.addAction(self.actionWord_PDF)self.toolBar.addSeparator()self.toolBar.addAction(self.action_Word)self.toolBar.addSeparator()self.toolBar.addAction(self.action_list)# # 设置窗体背景# palette = QtGui.QPalette()# # 设置窗体背景自适应# palette.setBrush(MainWindow.backgroundRole(),QBrush(QPixmap("./image/bg.jpg").scaled(MainWindow.size(),QtCore.Qt.IgnoreAspectRatio,QtCore.Qt.SmoothTransformation)))# MainWindow.setPalette(palette)# MainWindow.setAutoFillBackground(True) # 设置自动填充背景# # 禁止显示最大化按钮及调整窗体大小# MainWindow.setFixedSize(792, 572);self.retranslateUi(MainWindow)QtCore.QMetaObject.connectSlotsByName(MainWindow)def retranslateUi(self, MainWindow):_translate = QtCore.QCoreApplication.translateMainWindow.setWindowTitle(_translate("MainWindow", "MainWindow"))self.toolBar.setWindowTitle(_translate("MainWindow", "toolBar"))self.actionWord_PDF.setText(_translate("MainWindow", "Word转PDF"))self.actionWord_PDF.setToolTip(_translate("MainWindow", "<html><head/><body><p>Word转PDF</p></body></html>"))self.action_Word.setText(_translate("MainWindow", "统计Word文档页码"))self.action_Word.setToolTip(_translate("MainWindow", "<html><head/><body><p>统计Word文档的总页码</p></body></html>"))self.action_list.setText(_translate("MainWindow", "提取总目录"))self.action_list.setToolTip(_translate("MainWindow", "<html><head/><body><p>提取Wrod文档总目录</p></body></html>"))

Microsoft Word在当前使用中是占有巨大优势的文字处理器,这使得Word专用的档案格式Word 文件(.doc)成为事实上最通用的标准。Word文件格式的详细资料并不对外公开。Word文件格式不只一种,因为随Word软件本身的更新,文件格式也会或多或少的改版,新版的格式不一定能被旧版的程序读取(大致上是因为旧版并未内建支援新版格式的能力)。微软已经详细公布Word 97的DOC格式,但是较新的版本资料仍未公开,只有公司内部、政府与研究机构能够获知。业界传闻说某些Word文件格式的特性甚至连微软自己都不清楚。其他与Word竞争的办公室作业软件,都必须支援事实上最通用的Word专用的档案格式。因为Word文件格式的详细资料并不对外公开,通常这种兼容性是藉由逆向工程来达成。许多文字处理器都有汇出、汇入Word档案专用的转换工具,譬如AbiWord或OpenOffice。(参照文本编辑器当中关于其他竞争软件的说明。)Apache Jakarta POI是一个开放原始码的Java数据库,其主要目标是存取Word的二进制文件格式。不久前,微软自己也提供了检视器,能够不用Word程序就检视Word文件。例:Word Viewer 2003。Microsoft office Word 97到Microsoft office Word 2003之前的Word文件格式都是二进制文件格式。不久以前,微软声明他们接下来将以XML为基础的档案格式作为他们办公室套装软件的格式。Word 2003提供WordprocessingML的选项。这是一种公开的XML档案格式,由丹麦政府等机构背书支持。Word 2003的专业版能够直接处理非微软的档案规格。

python文档Word助手转换pdf目录页码获取统计等源码相关推荐

  1. Java——EasyPoi导出word文档,itextpdf转换pdf

    EasyPoi导出word文档,itextpdf转换pdf 文章目录 EasyPoi导出word文档,itextpdf转换pdf 前言 一.依赖 二.工具类 1.WordUtil 2.PDF工具类 3 ...

  2. word文档点击打印,目录页码却全是2的原因分析及解决办法

    最近也是临近毕业,在忙着毕业设计定稿,在这个过程,同学w遇见了一个很奇怪的问题,就是每次点击文件目录下的打印功能时,自己论文的目录,全部都变为了2.有时候重新打开,又自动好了,有时候,又不是2,是10 ...

  3. python和易语言抓包_抓包能获取到网页源码,用易语言却获取不到,如何解决?...

    [Asm] 纯文本查看 复制代码.版本 2 .支持库 spec .程序集 窗口程序集_启动窗口 .子程序 _按钮1_被单击 .局部变量 a, 文本型 .局部变量 网址, 文本型 .局部变量 b, 文本 ...

  4. Java版Word开发工具Aspose.Words基础转换指南:将Word文档和图像转换为PDF

    Aspose.Words for Java是功能丰富的文字处理API,开发人员可以在自己的Java应用程序中嵌入生成,修改,转换,呈现和打印Microsoft Word支持的所有格式的功能.它不依赖于 ...

  5. html document怎么转换成word,Doxillion Document Converter – 将 DOC、DOCX、PDF、WPS、Word、HTML文档格式互相转换...

    在办公领域经常会遇到各种各样的文件格式,因此常常有DOC.DOCX.PDF.WPS.Word.HTML 等各种不同格式的文档互相转换的需求.虽然网上有很多在线转换网站或 文档格式转换软件,不过今天推荐 ...

  6. 苹果手机怎么编辑word文档_永久免费PDF转word软件,PDF转换王,图片转Word文档,手机照片转可编辑文字...

    PDF转换王是一款 OCR 图片文字识别软件,可以快速.方便地将扫描纸质文件.PDF 格式及数字或移动电话图像转换成可编辑格式. OCR 光学字符识别是这款软件的核心,通过该技术可以将图片上的文字识别 ...

  7. 用Python批处理将WORD文件转换成PDF格式(工具:win32com模块)

    用Python批处理将WORD文件转换成PDF格式 一.问题分析 key words:批处理.WORD转换PDF.办公自动化 二.材料准备 三.代码实现 ☆其他问题:日常遇到问题,整理笔记不易,欢迎交 ...

  8. Java操作word文档将docx转换为pdf格式

    Java操作word文档将docx转换为pdf格式 一.整体说明 在上传 Office 课件时,格式有:doc,docx,xls,xlsx,ppt,pptx,程序需要将其 转换成 pdf 格式, 才能 ...

  9. wps的ppt怎么存html,如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档

    导读:小编根据大家的需要整理了一份关于<如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档>的内容,具体内容: 看到图文并茂的网页,想把它全部或部分转换为WPS或者WO ...

最新文章

  1. Plant J:细菌挥发性物质和光合信号激活低铁响应途径
  2. ubuntu16配置ZooKeeper集群(这里用的是Zookeeper3.4.10)
  3. 【C++】 二叉树的基本知识及其遍历
  4. vue中的组件导航守卫,个人理解
  5. python range从大到小排列_python 十大经典排序算法
  6. IOS上的 Audio Memos SE 如何分享和传输录音到电脑?
  7. Codeforces Round #726 (Div. 2) D. Deleting Divisors 博弈
  8. Josephus问题的Java解决方法
  9. VC6.0设置注释快捷键
  10. 云小课|3种常用Git工作流推荐
  11. SVM多分类器的实现
  12. 【IOS账号分享】《魔女之泉4》
  13. 酉矩阵(unitary matrix)
  14. Xcode真机设备无线调试
  15. 逆向破解思路和获取app的代码,脱壳操作(一)
  16. linux报错Loading mirror speeds from cached hostfile There are no enabled repos.
  17. PMP证书备考攻略+PMP知识点汇总
  18. nachos操作系统(一)
  19. 【荐读】Hello, World! 发明者布莱恩·W.克尼汉的传奇人生
  20. 电容传感器FDC2214单通道应用寄存器计算

热门文章

  1. 光影精灵5完全拆解全程图解_散热组件增强 惠普光影精灵5游戏本拆机解析
  2. iphone当前系统时间与服务器不一致,mac双系统时间不对怎么办 mac双系统时间不一致解决办法...
  3. 校盈家学校财务收费管理软件,最适合学校财务收费的管理工具!
  4. 腾讯QQ2011Beta4插件管理器(去校…
  5. Mysql 哈希分区表
  6. 北大青鸟java初级培训_java初级编程
  7. 新概念英语,音频文档
  8. [响应式布局]响应式布局技巧
  9. jq ajax请求php原声,原生JS与jQuery对AJAX的实现
  10. C++程序设计语言——一个桌面计算器示例