python解析word文档首、尾页
1.docx 不能解析.doc文档,只能解析.docx文档
2.如何将doc转换为docx (window 里有打开后另存为)
3.docx文档有没有page的概念?如何使用分页符?如何取得第一页和最后一页
1.如何使doc文档,将其转换为docx文档
def dosaveas(self,path):
word = wc.Dispatch('word.application')
#doc 目标路径下的文件
doc = word.Documents.Open(path)
#换换为docx后的目标文件
doc.SaveAs(self.file_path, 12, False, "", True, "", False, False, False, False)
doc.Close()
word.Quit()
2.解析docx文档的首、尾页,返回字符串内容
def parsedocin(self,path):
result = []
if path.endswith(".doc"): #doc文件需要转为docx文件
self.dosaveas(path)
#获取文档对象
file = docx.Document(self.file_path)
else:
file = docx.Document(path)#获取文档段落数
paragraphs_len = len(file.paragraphs)
#输出每一段的内容
#for para in file.paragraphs:
# print(para.text)
paragraphs_list=[]
if paragraphs_len > parseDoc.PAGE_LINES:
for i in range(0,parseDoc.PAGE_LINES):
paragraphs_list.append(file.paragraphs[i])
for j in range((paragraphs_len - parseDoc.PAGE_LINES),paragraphs_len):
paragraphs_list.append(file.paragraphs[j])
else:
for i in range(0,parseDoc.PAGE_LINES):
paragraphs_list.append(file.paragraphs[i])#每一次循环显示一行文本内容
for para in paragraphs_list:
#print(para.text)
result.append(para.text)return result
python解析word文档首、尾页相关推荐
- python 一个word文档的某页内容复制到另一个word文档的第二页
首先,需要使用 python-docx 库来读取和操作 word 文档.具体实现方法如下: 安装 python-docx 库:在终端中运行 pip install python-docx 安装. 导入 ...
- Python读取Word文档段落或者表格
Python解析word文档 1 .安装并导依赖包 2.word的doc格式转docx格式 3.解析word_doc文档段落.表格内容 4.word读取表格存列表封装优化,节省读取时间 1 .安装并导 ...
- python获取word页数_使用Python的word文档的页数(Number of pages of a word document with Python)...
使用Python的word文档的页数(Number of pages of a word document with Python) 有没有办法用Python有效地获得word文档(.doc,.doc ...
- python读取word文档并做简单的批量文档筛选
python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...
- python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较
演示如下. 两个简单的word文档, 各有一个表格: 读取文档中的表格到列表(为演示只对单列表格操作): import docx def 取表格(文件名): 文件 = docx.Document(文件 ...
- python操作word文档(python-docx)
python操作word文档(python-docx) 1. 效果图 1.1 python-docx文档标题段落(等级.加粗.斜体.居中)效果图 1.2 python-docx字体(加粗.斜体.居中. ...
- 如何用Python将Word文档转换为Excel表格
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 作者:小小明 来源:菜J学Python Python爬虫.数据分析.网站开发等案例教程视频免费在线 ...
- Python进行office操作 - 用Python读写Word文档入门
目录 0.场景 1.安装python-docx模块 2.读取Word文档 3.写入Word文档 (1)全局样式介绍 (2)调整word样式 (3)创建并写入word (4)设置多段落 (5)设置标题 ...
- 利用python操作word文档
总目录:Python数据分析整理 本文代码参考自官方文档: python-docx 使用的库下载方式为:pip install python-docx 注意!! 不是:pip install docx ...
- Word处理控件Aspose.Words功能演示:在 Python 中将 Word 文档转换为 PNG、JPEG 或 BMP
MS Word 文件到图像格式的转换让您可以将文档的页面嵌入到您的 Web 或桌面应用程序中.为了在 Python 应用程序中执行此转换,本文介绍了如何使用 Python 将 Word DOCX或DO ...
最新文章
- 简化PHP开发的10个工具
- quartzjob传递传输_Quartz教程三:Job与JobDetail介绍
- python打包成二进制文件_pyinstall python文件打包成二进制exe文件
- 小胖说事30------iOS 强制转成横屏的方式
- sqlserver2000与sqlserver2005驱动与url的区别
- 弹性屋顶涂料行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
- springboot 注册服务注册中心(zk)的两种方式
- python3写360图库爬虫
- Delphi TStringList的用法
- 计算机网络分层协议及各层功能
- CodeForces 愚人节题目
- java阴阳师抽卡概率_《阴阳师》手游随机抽取类玩法概率公示
- jcp jsr_JCP执行委员会未能支持社交媒体API
- wps导航栏在哪设置?
- 全球首款机场专用自动驾驶纯电动大巴在东京实地测试
- 2022年广西医院三基考试中医学综合训练题及答案
- Day 2: On Your Choices
- gif透明背景动画_BMP、GIF、TIFF、PNG、JPG和SVG格式图像的特点
- jquery竖向走马灯_jquery实现页面百叶窗走马灯式翻滚显示效果的方法_jquery
- 小学计算机教师试讲ppt,小学信息技术教师资格证面试真题:让幻灯片动起来
热门文章
- 〖Python〗-- 面向对象编程、继承、组合、接口和抽象类
- matlab无法打开wps的xls文件,WPS无法打开XLS文件怎么办 XLS文件出现异常无法打开怎么处理...
- 如何提高研发部门工作效率的探讨
- Alphago进化史 漫画告诉你Zero为什么这么牛
- [实用代码] 基于CH554电容触摸屏IIC转USB转IIC方案代码分享
- 【LTspice】【LTspice添加第三方***.lib文件】
- VIVADO生成并导入网表文件
- 操作系统 设备基本概念和分类
- seafile私有云盘搭建全过程记录
- Django 千锋培训读书笔记