方法1

import sys
import osfrom win32com import client as wcprint(sys.version)openfile = os.getcwd()+'\\'+sys.argv[1]
print(openfile) word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(openfile)savefile = os.getcwd()+'\\'+sys.argv[1].split('.')[0]+'.txt'
print(savefile)doc.SaveAs(savefile, 4)doc.Close()word.Quit()

方法2

# a script that converts word file to txt files
# requires word application on Windows machine
# requirement:
#    1. Windows platform
#    2. python 2.7
#    3. pywin32, download from http://sourceforge.net/projects/pywin32/
#    4. word application installed on running machine
from win32com.client import constants, Dispatch
import pythoncom
import glob
import os
from zipfile import ZipFile# convert the word file to a text file.
# @arg wordapp: The word IDispatch object
# @arg wordfile: The word file name
# @returns: The txt file name
def convert_to_text(wordapp, wordfile):name, ext = os.path.splitext(wordfile)if ext != '.doc' and ext != '.docx':return Nonetxtfile = name + '.txt'print txtfilewordapp.Documents.Open(os.path.abspath(wordfile))wdFormatTextLineBreaks = 3wordapp.ActiveDocument.SaveAs(os.path.abspath(txtfile), FileFormat=wdFormatTextLineBreaks)wordapp.ActiveDocument.Close()return txtfile# a generator that iterates all doc files in the current work dir
def next_doc():for d in glob.glob('*.doc'):yield dfor d in glob.glob('*.docx'):yield d# convert all doc/docx files and zip all output txt files as the zipfilename
def convert_and_zip(zipfilename):word = Dispatch("Word.Application")with ZipFile(zipfilename, 'w') as fzip:for doc in next_doc():print 'converting ', doc, '...'txtfile = convert_to_text(word, doc)if txtfile:fzip.write(txtfile)word.Quit()

使用python脚本将word文档转txt相关推荐

  1. python批量提取word指定内容_使用python批量读取word文档并整理关键信息到excel表格的实例...

    目标 最近实验室里成立了一个计算机兴趣小组 倡议大家多把自己解决问题的经验记录并分享 就像在CSDN写博客一样 虽然刚刚起步 但考虑到后面此类经验记录的资料会越来越多 所以一开始就要做好模板设计(如下 ...

  2. python新建word文档_使用Python 自动生成 Word 文档的教程

    当然要用第三方库啦 :) 使用以下命令安装: pip install python-docx 使用该库的基本步骤为: 1.建立一个文档对象(可自动使用默认模板建立,也可以使用已有文件). 2.设置文档 ...

  3. python自动生成和读取word_使用Python自动生成Word文档的教程

    当然要用第三方库啦 :) 使用以下命令安装: pip install python-docx 使用该库的基本步骤为: 1.建立一个文档对象(可自动使用默认模板建立,也可以使用已有文件). 2.设置文档 ...

  4. python实现生成word文档并转为pdf

    python实现生成word文档,格式转为pdf 使用的是python-docx模块,在生成word文档后转为pdf格式是使用的是docx2pdf中的convert(使用convert转换时,要先创建 ...

  5. Python动态修改Word文档内容,保留格式样式,并批量生成PDF

    Python动态修改Word文档内容,保留格式样式,并批量生成PDF 前言 一.需要安装的库 二.核心逻辑-替换 前言 假如你有一个Word模版文档,要在里面填写人员信息,但人员有成百上千个,手动填起 ...

  6. python如何向word文档插入目录

    要在Python中向Word文档插入目录,可以使用python-docx库.首先安装这个库,然后使用如下代码来打开一个Word文档,并在文档中插入目录: from docx import Docume ...

  7. python html转word文档_Python实现将HTML转换成doc格式文件的方法示例

    本文实例讲述了Python实现将HTML转换成doc格式文件的方法.分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用css来进行描述. ...

  8. python分解word文档为多个_用python批量处理word文档

    应我家领导要求,开发一个word文档批处理脚本,涉及word文档.excel表格.文件存取.排序与索引.简单GUI等内容,前期针对各分项功能实现写了几篇小文章,现在将总体思路记录一下,作为这个系列的完 ...

  9. [PYTHON]批量合并WORD文档,DOCX格式

    应用场景 某些时候按照不同的要求需要导出单个的word文档,也有可能导出整个word文档.该脚本作为[PYTHON]使用python将Oracle数据库结构导出为定制的word文档的补充,可以直接合并 ...

最新文章

  1. PCIe知识学习 (转载)
  2. 菜鸟教程python3-Python数据分析,学习路径拆解及资源推荐
  3. 文巾解题 面试题 01.04. 回文排列
  4. 为什么我们不应该使用过多的线程
  5. 李宏毅老师ML_HW1——PM2.5预测
  6. TDX指标的理解与改造(价格到达指标线提醒)
  7. E-BERT: 电商领域语言模型优化实践
  8. 统计学名词解释 —— 3. 「简单随机样本」、「联合分布」与「联合密度」
  9. SQL注入了解认识及注入方式
  10. 使用外置无线网卡来切换mac地址
  11. 一鸣心所向:数字营销中的智商、逆商和情商
  12. 路由器与无线网如何连接到服务器,两个路由器无线连接怎么设置_如何将两个路由器无线连接-192路由网...
  13. piaget读法_这些手表品牌原来是这么念的!
  14. Airbnb Embeding学习笔记
  15. ubuntu20浏览器不能上网的问题
  16. Django程序的发布
  17. PHP网页毕业答辩常见问题,电子毕业设计(论文)答辩常见问题解答
  18. P3392 涂国旗——暴力枚举
  19. 【数据库】查询所有同学的学号、姓名、选课数、总成绩(左外连表查询)
  20. 摄影几何基础知识(1)

热门文章

  1. 怎么更改计算机用户为管理员账户,Win10如何更改为管理员账户,教您如何更改
  2. 科斯定理-载罗纳德·科斯
  3. adb命令获取设备IMEI
  4. Qt5.12 QML——TextMetrics字体长度的测量指标
  5. Unity3D RectTransform中文图文详细-anchors用法pivot分析
  6. Internet Download Manager2023稳定版下载器
  7. Windows 10安装WSA(WindowsSubsystemForAndroid)
  8. 封装CopyFileEx函数,实现文件复制中的暂停,控速,获取进度
  9. linux打开文件脚本,linux脚本文件实现的功能有哪些剧本用工具打开
  10. 你以为 Snapchat 做的是社交,但它却说自己是一家相机公司