这篇文章主要介绍了关于Python读写docx文件的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下

Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档

#coding:utf-8

import docx

#新建文档

doc_new = docx.Document()

#读取文档

doc = docx.Document(ur'C:\1.docx')

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

doc.save(path_or_stream)

3、对象集合。python-docx包含了word文档的相关对象集合。

doc.paragraphs #段落集合

doc.tables #表格集合

doc.sections #节 集合

doc.styles #样式集合

doc.inline_shapes #内置图形 等等...

4、插入段落。段落是word最基本的对象之一。

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”

#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式

doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式

print [s.name for s in doc.styles if s.type==1]

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。

#coding:utf-8

from docx import Document

from docx.shared import RGBColor #这个是docx的颜色类

#新建文档

doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)

style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)

style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。

#插入一个空白段落

p = doc.add_paragraph('')

p.add_run('123', style="Heading 1 Char")

p.add_run('456')

p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式

print p.text #输出结果是u'123456789' 也还是连续的

7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。

p = doc.add_paragraph('')

r = p.add_run('123')

r.font.bold = True #加粗

r.font.italic = True #倾斜 等等...

8、表格操作。表格也是经常用到的一种对象类型。

#新建一个2x3的表格,style可以不写

table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数

print len(table.rows)

print len(table.columns)

#遍历表格

for row in table.rows:

row.cells[0].text = '1'

#print row.cells[0].text

#新增行或列

table.add_row()

table.add_column()

Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。

相关推荐:

Python读写/追加excel文件Demo

用Python读写Excel文档

python读取docx文件出错_Python读写docx文件的方法相关推荐

  1. python调用文件对象所提供的读取数据的函数_python读写数据文件

    1. read.readline.readlines (1)open函数 如果你想用python读取文件(如txt.csv等),第一步要用open函数打开文件. open()是python的内置函数, ...

  2. python读压缩文件内容_Python读写压缩文件的方法

    问题 你想读写一个gzip或bz2格式的压缩文件. 解决方案 gzip 和bz2模块可以很容易的处理这些文件. 两个模块都为 open()函数提供了另外的实现来解决这个问题. 比如,为了以文本形式读取 ...

  3. python读txt很大_Python读写txt文件

    python读写txt文件 准备原始txt数据 3.14159265358979323846264338327950288419716939937510582097494459230781640628 ...

  4. python 读取csv带表头_python读csv文件时指定行为表头或无表头的方法

    pd.read_csv()方法中header参数,默认为0,标签为0(即第1行)的行为表头.若设置为-1,则无表头.示例如下: (1)不设置header参数(默认)时: df1 = pd.read_c ...

  5. python读取oracle数据库数据库_Python读写Oracle数据库

    最近项目中需要用到Python调用Oracle实现读写操作,踩过很多坑,历尽艰辛终于实现了.性能怎样先不说,有方法后面再调优嘛.现在把代码和注意点记录一下. 1. 所需Python工具库 cx_Ora ...

  6. python能打开的txt文件编码_Python读写txt文件时的编码问题

    这个问题来自于一个小伙伴,他在处理中文数据时需要先把里面的文本过滤然后分词,因为里面有许多符号,不仅是中文标点符号,还有✳,emoji等奇怪的符号. 正常情况下,中文的str经过encode('utf ...

  7. python不同数据的读入_python读写不同编码txt文件_python读写txt文件

    python读写不同编码txt文件_python读写txt文件 以后整理规范 [python] view plaincopy import os import codecs filenames=os. ...

  8. python读取word详解【from docx import Document】

    python读取word详解[from docx import Document] 目录 python读取word详解[from docx import Document] 前言 环境 示例字符串 下 ...

  9. python打开一个文件夹下所有txt文件-python读取一个目录下所有txt里面的内容方法...

    实例如下所示: import os allFileNum = 0 def printPath(level, path): global allFileNum ''''' 打印一个目录下的所有文件夹和文 ...

最新文章

  1. linux下oracle启动关闭
  2. 程序猿的双十一最佳攻略
  3. 自定义实现moveable button
  4. 【deep learning学习笔记】注释yusugomori的LR代码 --- LogisticRegression.cpp
  5. pyinstaller安装失败_用 Pyinstaller 打包文件为应用程序
  6. 倦怠和枯燥_我如何艰难地学习倦怠
  7. Python3 高级编程技巧(部分)
  8. php debugdumpparams,PHP PDOStatement::debugDumpParams讲解
  9. 泰戈尔专集:飞鸟集·新月集·园丁集(美冠纯美阅读书系·外国卷) 读后感
  10. TensorFlow Serving Architecture
  11. Python 【趣头条】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
  12. 联合学习 | 纵向LR原理综述
  13. JVM内存结构和垃圾回收机制
  14. 使用ethers.js执行读函数与写函数
  15. 测试REST Web服务
  16. 卡尔曼滤波算法的五大核心公式含义
  17. Shell编程之sed工具
  18. Navicat Premium(数据库管理) 15.0.18 pojie版
  19. 外卖菜谱小程序源码-带流量主功能
  20. 通过手机App控制RGB调节灯带的亮度

热门文章

  1. Win10在右键菜单中添加管理员身份运行命令的方法
  2. 并发、并行傻傻分不清楚?线程的一生都经历些什么?
  3. 从苏宁电器到卡巴斯基第38篇:我与卡巴斯基的邂逅(下)(大结局)
  4. 网件公司M4100-D12G三层交换机,部分配置说明(4)
  5. 一文彻底搞懂事务底层原理
  6. uni-app【数据缓存API】
  7. 矩阵迹的性质_从微分几何看矩阵的迹
  8. java的 0x7f_Java基础知识
  9. 关于Tomcat的理解
  10. MacOS AssetCache 占用网速原因以及解决办法