Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档

#coding:utf-8

import docx

#新建文档

doc_new = docx.Document()

#读取文档

doc = docx.Document(ur'C:\1.docx')

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

doc.save(path_or_stream)

3、对象集合。python-docx包含了word文档的相关对象集合。

doc.paragraphs #段落集合

doc.tables #表格集合

doc.sections #节 集合

doc.styles #样式集合

doc.inline_shapes #内置图形 等等...

4、插入段落。段落是word最基本的对象之一。

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”

#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式

doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式

print [s.name for s in doc.styles if s.type==1]

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。

#coding:utf-8

from docx import Document

from docx.shared import RGBColor #这个是docx的颜色类

#新建文档

doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)

style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)

style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。

#插入一个空白段落

p = doc.add_paragraph('')

p.add_run('123', style="Heading 1 Char")

p.add_run('456')

p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式

print p.text #输出结果是u'123456789' 也还是连续的

7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。

p = doc.add_paragraph('')

r = p.add_run('123')

r.font.bold = True #加粗

r.font.italic = True #倾斜 等等...

8、表格操作。表格也是经常用到的一种对象类型。

#新建一个2x3的表格,style可以不写

table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数

print len(table.rows)

print len(table.columns)

#遍历表格

for row in table.rows:

row.cells[0].text = '1'

#print row.cells[0].text

#新增行或列

table.add_row()

table.add_column()

Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。

python读取docx文件_Python读写docx文件相关推荐

  1. python不同数据的读入_python读写不同编码txt文件_python读写txt文件

    python读写不同编码txt文件_python读写txt文件 以后整理规范 [python] view plaincopy import os import codecs filenames=os. ...

  2. python读取docx文件_Python读写docx文件的方法

    Python读写word文档有现成的库可以处理.我这里采用 python-docx.可以用pip install python-docx安装一下. 这里说一句,ppt和excel也有类似的库哦,而且是 ...

  3. python读docx文件_Python读写docx文件的方法

    Python读写word文档有现成的库可以处理.我这里采用 python-docx.可以用pip install python-docx安装一下. 这里说一句,ppt和excel也有类似的库哦,而且是 ...

  4. python读取python源代码文件_python 读写excel文件操作示例【附源码下载】

    本文实例讲述了python 读写excel文件操作.分享给大家供大家参考,具体如下: 对excel文件的操作,python有第三方的工具包支持,xlutils,在这个工具包中包含了xlrd,xlwt等 ...

  5. python本地读csv文件_python读写csv文件方法详细总结

    python提供了大量的库,可以非常方便的进行各种操作,现在把python中实现读写csv文件的方法使用程序的方式呈现出来. 在编写python程序的时候需要csv模块或者pandas模块,其中csv ...

  6. python json文件_python读写json文件的简单实现

    JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族 ...

  7. python读取xlsm文件_Python读写EXCEL文件常用方法大全

    前言 python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式. 数据准备 为了方便演示,我这里新建了一个data.xls和data.xlsx文件,第一个 ...

  8. python读写xlsx文件_python读写Excel文件--使用xlrd模块读取,xlwt模块写入

    一.安装xlrd模块和xlwt模块 1. 下载xlrd模块和xlwt模块 到python官网http://pypi.python.org/pypi/xlrd下载模块.下载的文件例如:xlrd-0.9. ...

  9. python readcsv读取gbk编码文件_python读写csv文件

    今天闲来无事,写了会CSV,简单总结下csv具体操作 什么是csv 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本 ...

最新文章

  1. Python3多线程threading介绍(转载)
  2. 对阿里云服务器(数据盘已分区并格式化)的数据盘进行扩容
  3. oracle 删除字段中空格
  4. linux 系统监控脚本
  5. 如何与深度学习服务器优雅的交互?(长期更新)
  6. DataTable相关
  7. 求平均值 Avg.java
  8. jsf用于页面判断的标签_JSF –在JSF视图页面中添加标签,图像,按钮和文本字段
  9. 吾很努力了,吾不是关键因素
  10. Linux驱动-内核uart串口驱动分析
  11. Report Machine应用总结
  12. springAop切面失效的问题解决
  13. Web前端面试指导(四):面试前准备-有备而去百战百胜
  14. 苹果刷机有好处和坏处_观察 | iTools推越狱助手 欲扩张苹果市场版图
  15. 2、Docker部署的Onlyoffice中文字体修改
  16. 三菱FX系列PLC以太网连接力控ForceControl
  17. win11任务栏无响应/卡死
  18. 分享一个好用的CSS布局
  19. 记录第一个eti任务的暂时终止
  20. android源码 谷歌拼音输入法已停止运行

热门文章

  1. 游戏赚钱可以说自由职业者吗_您准备参加自由职业比赛了吗?
  2. 解读 vue-cli 脚手架(一):npm run dev的背后
  3. JAVA+access综合测评系统的设计与实现
  4. IE下或360兼容模式只有打开F12,js才能执行,关闭则执行失败
  5. C++(一)——HelloWorld
  6. React兄弟组件通信
  7. TCP四次挥手 2MSL TIME_WAIT详解
  8. Oracle 11c在win10操作系统的安装步骤
  9. .net core 跨域总结
  10. 【天光学术】演讲稿:校园讲文明树新风