备注:

doc是微软的专有的文件格式,docx是Microsoft Office2007之后版本使用,其基于Office Open XML标准的压缩文件格式,比

doc文件所占用空间更小。docx格式的文件本质上是一个ZIP文件,所以其实也可以把.docx文件直接改成.zip,解压后,里面的

word/document.xml包含了Word文档的大部分内容,图片文件则保存在word/media里面。

python-docx不支持.doc文件,间接解决方法是在代码里面先把.doc转为.docx。

一、安装包

pip3 install python-docx

二、创建word文档

下面是在官文示例基础上对个别地方稍微修改,并加上函数的使用说明

from docx importDocumentfrom docx.shared importInches

document=Document()#添加标题,并设置级别,范围:0 至 9,默认为1

document.add_heading('Document Title', 0)#添加段落,文本可以包含制表符( )、换行符( )或回车符( )等

p = document.add_paragraph('A plain paragraph having some')#在段落后面追加文本,并可设置样式

p.add_run('bold').bold =True

p.add_run('and some')

p.add_run('italic.').italic =True

document.add_heading('Heading, level 1', level=1)

document.add_paragraph('Intense quote', style='Intense Quote')#添加项目列表(前面一个小圆点)

document.add_paragraph('first item in unordered list', style='List Bullet')

document.add_paragraph('second item in unordered list', style='List Bullet')#添加项目列表(前面数字)

document.add_paragraph('first item in ordered list', style='List Number')

document.add_paragraph('second item in ordered list', style='List Number')#添加图片

document.add_picture('monty-truth.png', width=Inches(1.25))

records=(

(3, '101', 'Spam'),

(7, '422', 'Eggs'),

(4, '631', 'Spam, spam, eggs, and spam')

)#添加表格:一行三列#表格样式参数可选:#Normal Table#Table Grid#Light Shading、 Light Shading Accent 1 至 Light Shading Accent 6#Light List、Light List Accent 1 至 Light List Accent 6#Light Grid、Light Grid Accent 1 至 Light Grid Accent 6#太多了其它省略...

table = document.add_table(rows=1, cols=3, style='Light Shading Accent 2')#获取第一行的单元格列表

hdr_cells =table.rows[0].cells#下面三行设置上面第一行的三个单元格的文本值

hdr_cells[0].text = 'Qty'hdr_cells[1].text = 'Id'hdr_cells[2].text = 'Desc'

for qty, id, desc inrecords:#表格添加行,并返回行所在的单元格列表

row_cells =table.add_row().cells

row_cells[0].text=str(qty)

row_cells[1].text =id

row_cells[2].text =desc

document.add_page_break()#保存.docx文档

document.save('demo.docx')

创建的demo.docx内容如下:

三、读取word文档

from docx importDocument

doc= Document('demo.docx')#每一段的内容

for para indoc.paragraphs:print(para.text)#每一段的编号、内容

for i inrange(len(doc.paragraphs)):print(str(i), doc.paragraphs[i].text)#表格

tbs =doc.tablesfor tb intbs:#行

for row intb.rows:#列

for cell inrow.cells:print(cell.text)#也可以用下面方法

'''text = ''

for p in cell.paragraphs:

text += p.text

print(text)'''

运行结果:

Document Title

A plain paragraph having some bold and some italic.

Heading, level 1

Intense quote

first item in unordered list

second item in unordered list

first item in ordered list

second item in ordered list

0 Document Title

1 A plain paragraph having some bold and some italic.

2 Heading, level 1

3 Intense quote

4 first item in unordered list

5 second item in unordered list

6 first item in ordered list

7 second item in ordered list

8

9

Qty

Id

Desc

3

101

Spam

7

422

Eggs

4

631

Spam, spam, eggs, and spam

[Finished in 0.2s]

python 打开word文件_python下载word文件-Python用python-docx读写word文档相关推荐

  1. python api调用 验证码_Python语言调用创蓝253短信验证码API文档

    本文主要向大家介绍了Python语言调用创蓝253短信验证码API文档,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助. #!/usr/local/bin/python #-*- c ...

  2. Word在试图打开文件时遇到错误,请尝试下列方法:检查文档或驱动器的文件权限 确保有足够的内存和磁盘空间 用文本恢器打开文件

    Word在试图打开文件时遇到错误,请尝试下列方法:检查文档或驱动器的文件权限 确保有足够的内存和磁盘空间 用文本恢器打开文件  . 经常在浏览器上直接下载的文档打开就报这个错,也不知道是什么原因,最后 ...

  3. “Word在试图打开文件时遇到错误。请尝试下列方法:* 检查文档或驱动器的文件权限。* 确保有足够的内存和磁盘空间。* 用文件恢复转换器打开文件。”问题!...

    Word在试图打开文件时遇到错误. 请尝试下列方法: * 检查文档或驱动器的文件权限. * 确保有足够的内存和磁盘空间. * 用文件恢复转换器打开文件. 如下图: 让同事在他们自己电脑上,都是可以打开 ...

  4. jacob.jar 操作word文件 添加水印、图片(附查阅Microsoft Office VBA参考文档方式)

    jacob.jar 操作word文件 添加水印.图片 1.准备jacob.jar包和dll文件 将jacob.jar引入到工程, 64位: 将jacob-1.17-M2-x64.dll 放在C:\Wi ...

  5. 报表XML导出rtf格式,结果在浏览器中打开XML文件。下载rtf文件打开后出现Authentication failed 问题

    报表XML导出rtf格式,结果在浏览器中打开XML文件.下载rtf文件打开后出现Authentication failed 问题 直接上问题图: 问题描述:在Oracle EBS中执行"资源 ...

  6. 文件流下载ppt文件无法打开或文件已损坏

    在项目中遇到"文件流下载ppt文件无法打开或文件已损坏"这种情况,我也是查阅资料来一个排查问题的汇总 1.要设置responseType,在接口传参的时候传参过去 2.注意接口返回 ...

  7. python用模块读取xml文件_python读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

  8. Linux命令行下载大文件,下载Onedrive文件

    Linux命令行下载大文件,下载Onedrive文件 做深度学习实验时,经常会遇到下载数据集,下载到本地又上传到Linux服务器上,这时用rz上传会很慢,在网上找到一些方法,用curl下载One-dr ...

  9. word服务器草稿位置有必要更改么,如何改变WIN10常用文档的默认位置?真的有必要更改吗?...

    我们都知道,安装完Window系统后,系统会默认生成一些常用文件夹,方便你分门别类存储文件.例如"我的文档"文件夹,当你用美图秀秀美化完自拍照时,系统会自动建议你将图片保存在图片文 ...

  10. python自学教程变量_Python学习入门基础教程(learning Python)--2.2.1 Python下的变量解析...

    前文提及过变量代表内存里的某个数据,这个说法有根据么? 这里我们介绍一个python内建(built-in)函数id.我们先看看id函数的帮助文档吧.在python查某个函数的帮助文档很简单,只用he ...

最新文章

  1. Spark菜鸟学习营Day5 分布式程序开发
  2. 商汤科技开源DAVIS2017视频目标分割冠军代码
  3. java的应用程序开发_开发一个Java应用程序(1)
  4. 计算机操作系统寻址,计算机操作系统-寻址和字节顺序
  5. coursera无法观看视频解决方法
  6. 【转】测试人员的思想理念和工作方法
  7. c语言中的运算符及其含义_按位运算符及其在C语言中与Example一起使用
  8. Sphinx——自动生成Python文档
  9. Linux下的NFS网络文件系统
  10. CentOS6.5 环境安装配置
  11. python time用法
  12. 04. 替换空格(C++版本)
  13. CONSUL install 和启动
  14. matlab熊,小熊解答win10系统安装matlab10.1的办法
  15. Calendar 设置周一为每周第一天
  16. 龙芯电脑安装debian 10 buster
  17. 【MySQL】报错:ERROR 2002 (HY000): Can‘t connect to local MySQL server through socket ‘/var/lib/mysql/mys
  18. win10安装mysql8.0,一台电脑上安装多个mysql
  19. yunos6 是android几,成功脱离安卓?阿里首款国产操作系统YunOS6或将发布!
  20. 专业表操作鉴权(增、删、改、id查、全查、名字模糊查)

热门文章

  1. 局域网监控软件可行性分析报告
  2. 教你如何使用免费的域名来访问电脑搭建的服务器
  3. 现在连连支付使用的人多吗???安全吗??
  4. unity steamvr中手柄模型的替换
  5. sys/videoio.h not found
  6. 用word2016/2019写论文或修改论文时出现文件发生错误解决办法
  7. 人脸识别之人脸对齐(八)--LBF算法
  8. iSpy免费的开源视频监控平台
  9. html5 计算步行数,高德地图API之步行路线
  10. 16进制的文件头信息搜集