使用python脚本将word文档转txt
方法1
import sys
import osfrom win32com import client as wcprint(sys.version)openfile = os.getcwd()+'\\'+sys.argv[1]
print(openfile) word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(openfile)savefile = os.getcwd()+'\\'+sys.argv[1].split('.')[0]+'.txt'
print(savefile)doc.SaveAs(savefile, 4)doc.Close()word.Quit()
方法2
# a script that converts word file to txt files
# requires word application on Windows machine
# requirement:
# 1. Windows platform
# 2. python 2.7
# 3. pywin32, download from http://sourceforge.net/projects/pywin32/
# 4. word application installed on running machine
from win32com.client import constants, Dispatch
import pythoncom
import glob
import os
from zipfile import ZipFile# convert the word file to a text file.
# @arg wordapp: The word IDispatch object
# @arg wordfile: The word file name
# @returns: The txt file name
def convert_to_text(wordapp, wordfile):name, ext = os.path.splitext(wordfile)if ext != '.doc' and ext != '.docx':return Nonetxtfile = name + '.txt'print txtfilewordapp.Documents.Open(os.path.abspath(wordfile))wdFormatTextLineBreaks = 3wordapp.ActiveDocument.SaveAs(os.path.abspath(txtfile), FileFormat=wdFormatTextLineBreaks)wordapp.ActiveDocument.Close()return txtfile# a generator that iterates all doc files in the current work dir
def next_doc():for d in glob.glob('*.doc'):yield dfor d in glob.glob('*.docx'):yield d# convert all doc/docx files and zip all output txt files as the zipfilename
def convert_and_zip(zipfilename):word = Dispatch("Word.Application")with ZipFile(zipfilename, 'w') as fzip:for doc in next_doc():print 'converting ', doc, '...'txtfile = convert_to_text(word, doc)if txtfile:fzip.write(txtfile)word.Quit()
使用python脚本将word文档转txt相关推荐
- python批量提取word指定内容_使用python批量读取word文档并整理关键信息到excel表格的实例...
目标 最近实验室里成立了一个计算机兴趣小组 倡议大家多把自己解决问题的经验记录并分享 就像在CSDN写博客一样 虽然刚刚起步 但考虑到后面此类经验记录的资料会越来越多 所以一开始就要做好模板设计(如下 ...
- python新建word文档_使用Python 自动生成 Word 文档的教程
当然要用第三方库啦 :) 使用以下命令安装: pip install python-docx 使用该库的基本步骤为: 1.建立一个文档对象(可自动使用默认模板建立,也可以使用已有文件). 2.设置文档 ...
- python自动生成和读取word_使用Python自动生成Word文档的教程
当然要用第三方库啦 :) 使用以下命令安装: pip install python-docx 使用该库的基本步骤为: 1.建立一个文档对象(可自动使用默认模板建立,也可以使用已有文件). 2.设置文档 ...
- python实现生成word文档并转为pdf
python实现生成word文档,格式转为pdf 使用的是python-docx模块,在生成word文档后转为pdf格式是使用的是docx2pdf中的convert(使用convert转换时,要先创建 ...
- Python动态修改Word文档内容,保留格式样式,并批量生成PDF
Python动态修改Word文档内容,保留格式样式,并批量生成PDF 前言 一.需要安装的库 二.核心逻辑-替换 前言 假如你有一个Word模版文档,要在里面填写人员信息,但人员有成百上千个,手动填起 ...
- python如何向word文档插入目录
要在Python中向Word文档插入目录,可以使用python-docx库.首先安装这个库,然后使用如下代码来打开一个Word文档,并在文档中插入目录: from docx import Docume ...
- python html转word文档_Python实现将HTML转换成doc格式文件的方法示例
本文实例讲述了Python实现将HTML转换成doc格式文件的方法.分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用css来进行描述. ...
- python分解word文档为多个_用python批量处理word文档
应我家领导要求,开发一个word文档批处理脚本,涉及word文档.excel表格.文件存取.排序与索引.简单GUI等内容,前期针对各分项功能实现写了几篇小文章,现在将总体思路记录一下,作为这个系列的完 ...
- [PYTHON]批量合并WORD文档,DOCX格式
应用场景 某些时候按照不同的要求需要导出单个的word文档,也有可能导出整个word文档.该脚本作为[PYTHON]使用python将Oracle数据库结构导出为定制的word文档的补充,可以直接合并 ...
最新文章
- PCIe知识学习 (转载)
- 菜鸟教程python3-Python数据分析,学习路径拆解及资源推荐
- 文巾解题 面试题 01.04. 回文排列
- 为什么我们不应该使用过多的线程
- 李宏毅老师ML_HW1——PM2.5预测
- TDX指标的理解与改造(价格到达指标线提醒)
- E-BERT: 电商领域语言模型优化实践
- 统计学名词解释 —— 3. 「简单随机样本」、「联合分布」与「联合密度」
- SQL注入了解认识及注入方式
- 使用外置无线网卡来切换mac地址
- 一鸣心所向:数字营销中的智商、逆商和情商
- 路由器与无线网如何连接到服务器,两个路由器无线连接怎么设置_如何将两个路由器无线连接-192路由网...
- piaget读法_这些手表品牌原来是这么念的!
- Airbnb Embeding学习笔记
- ubuntu20浏览器不能上网的问题
- Django程序的发布
- PHP网页毕业答辩常见问题,电子毕业设计(论文)答辩常见问题解答
- P3392 涂国旗——暴力枚举
- 【数据库】查询所有同学的学号、姓名、选课数、总成绩(左外连表查询)
- 摄影几何基础知识(1)
热门文章
- 怎么更改计算机用户为管理员账户,Win10如何更改为管理员账户,教您如何更改
- 科斯定理-载罗纳德·科斯
- adb命令获取设备IMEI
- Qt5.12 QML——TextMetrics字体长度的测量指标
- Unity3D RectTransform中文图文详细-anchors用法pivot分析
- Internet Download Manager2023稳定版下载器
- Windows 10安装WSA(WindowsSubsystemForAndroid)
- 封装CopyFileEx函数,实现文件复制中的暂停,控速,获取进度
- linux打开文件脚本,linux脚本文件实现的功能有哪些剧本用工具打开
- 你以为 Snapchat 做的是社交,但它却说自己是一家相机公司