1.docx 不能解析.doc文档,只能解析.docx文档

2.如何将doc转换为docx (window 里有打开后另存为)

3.docx文档有没有page的概念?如何使用分页符?如何取得第一页和最后一页


1.如何使doc文档,将其转换为docx文档

def dosaveas(self,path):
        word = wc.Dispatch('word.application')
        #doc 目标路径下的文件
        doc = word.Documents.Open(path)
        #换换为docx后的目标文件
        doc.SaveAs(self.file_path, 12, False, "", True, "", False, False, False, False)
        doc.Close()
        word.Quit()

2.解析docx文档的首、尾页,返回字符串内容

def parsedocin(self,path):
        result = []
        if path.endswith(".doc"):  #doc文件需要转为docx文件
            self.dosaveas(path)
            #获取文档对象
            file = docx.Document(self.file_path)
        else:
            file = docx.Document(path)

#获取文档段落数
        paragraphs_len = len(file.paragraphs)
        #输出每一段的内容
        #for para in file.paragraphs: 
        #    print(para.text)
        paragraphs_list=[]
        if paragraphs_len > parseDoc.PAGE_LINES:
            for i in range(0,parseDoc.PAGE_LINES):
                paragraphs_list.append(file.paragraphs[i])
            for j in range((paragraphs_len - parseDoc.PAGE_LINES),paragraphs_len):
                paragraphs_list.append(file.paragraphs[j])
        else:
            for i in range(0,parseDoc.PAGE_LINES):
                paragraphs_list.append(file.paragraphs[i])

#每一次循环显示一行文本内容
        for para in paragraphs_list:
            #print(para.text)
            result.append(para.text)

return result

python解析word文档首、尾页相关推荐

  1. python 一个word文档的某页内容复制到另一个word文档的第二页

    首先,需要使用 python-docx 库来读取和操作 word 文档.具体实现方法如下: 安装 python-docx 库:在终端中运行 pip install python-docx 安装. 导入 ...

  2. Python读取Word文档段落或者表格

    Python解析word文档 1 .安装并导依赖包 2.word的doc格式转docx格式 3.解析word_doc文档段落.表格内容 4.word读取表格存列表封装优化,节省读取时间 1 .安装并导 ...

  3. python获取word页数_使用Python的word文档的页数(Number of pages of a word document with Python)...

    使用Python的word文档的页数(Number of pages of a word document with Python) 有没有办法用Python有效地获得word文档(.doc,.doc ...

  4. python读取word文档并做简单的批量文档筛选

    python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...

  5. python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较

    演示如下. 两个简单的word文档, 各有一个表格: 读取文档中的表格到列表(为演示只对单列表格操作): import docx def 取表格(文件名): 文件 = docx.Document(文件 ...

  6. python操作word文档(python-docx)

    python操作word文档(python-docx) 1. 效果图 1.1 python-docx文档标题段落(等级.加粗.斜体.居中)效果图 1.2 python-docx字体(加粗.斜体.居中. ...

  7. 如何用Python将Word文档转换为Excel表格

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 作者:小小明 来源:菜J学Python Python爬虫.数据分析.网站开发等案例教程视频免费在线 ...

  8. Python进行office操作 - 用Python读写Word文档入门

    目录 0.场景 1.安装python-docx模块 2.读取Word文档 3.写入Word文档 (1)全局样式介绍 (2)调整word样式 (3)创建并写入word (4)设置多段落 (5)设置标题 ...

  9. 利用python操作word文档

    总目录:Python数据分析整理 本文代码参考自官方文档: python-docx 使用的库下载方式为:pip install python-docx 注意!! 不是:pip install docx ...

  10. Word处理控件Aspose.Words功能演示:在 Python 中将 Word 文档转换为 PNG、JPEG 或 BMP

    MS Word 文件到图像格式的转换让您可以将文档的页面嵌入到您的 Web 或桌面应用程序中.为了在 Python 应用程序中执行此转换,本文介绍了如何使用 Python 将 Word DOCX或DO ...

最新文章

  1. 简化PHP开发的10个工具
  2. quartzjob传递传输_Quartz教程三:Job与JobDetail介绍
  3. python打包成二进制文件_pyinstall python文件打包成二进制exe文件
  4. 小胖说事30------iOS 强制转成横屏的方式
  5. sqlserver2000与sqlserver2005驱动与url的区别
  6. 弹性屋顶涂料行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
  7. springboot 注册服务注册中心(zk)的两种方式
  8. python3写360图库爬虫
  9. Delphi TStringList的用法
  10. 计算机网络分层协议及各层功能
  11. CodeForces 愚人节题目
  12. java阴阳师抽卡概率_《阴阳师》手游随机抽取类玩法概率公示
  13. jcp jsr_JCP执行委员会未能支持社交媒体API
  14. wps导航栏在哪设置?
  15. 全球首款机场专用自动驾驶纯电动大巴在东京实地测试
  16. 2022年广西医院三基考试中医学综合训练题及答案
  17. Day 2: On Your Choices
  18. gif透明背景动画_BMP、GIF、TIFF、PNG、JPG和SVG格式图像的特点
  19. jquery竖向走马灯_jquery实现页面百叶窗走马灯式翻滚显示效果的方法_jquery
  20. 小学计算机教师试讲ppt,小学信息技术教师资格证面试真题:让幻灯片动起来

热门文章

  1. 〖Python〗-- 面向对象编程、继承、组合、接口和抽象类
  2. matlab无法打开wps的xls文件,WPS无法打开XLS文件怎么办 XLS文件出现异常无法打开怎么处理...
  3. 如何提高研发部门工作效率的探讨
  4. Alphago进化史 漫画告诉你Zero为什么这么牛
  5. [实用代码] 基于CH554电容触摸屏IIC转USB转IIC方案代码分享
  6. 【LTspice】【LTspice添加第三方***.lib文件】
  7. VIVADO生成并导入网表文件
  8. 操作系统 设备基本概念和分类
  9. seafile私有云盘搭建全过程记录
  10. Django 千锋培训读书笔记