直接使用word文档已经难不倒大家了,有没有想过用python构建一个word文档写点文章呢?当然这个文章的框架需要我们用代码一点点的建立,在过程上有一点繁琐,一下子看不懂的小伙伴可以把它拆分成几个部分来看。下面就在python3处理word文档的代码给大家带来讲解,还会有一些设置文章格式的技巧。

一个Word文档,主要由下面这些内容元素构成,每个元素都有对应的方法处理:

  • 标题:add_heading()

  • 段落:add_paragraph()

  • 文本:add_run(),其返回对象支持设置文本属性

  • 图片:add_picture()

  • 表格:add_table()add_row()add_col()

import pathlibfrom docx import Document
from docx.shared import Inches, Pt
from docx.oxml.ns import qnpath = list(pathlib.Path.cwd().parents)[1].joinpath('data/automate/003word')
out_path = path.joinpath('003word_create.docx')
img_path = path.joinpath('dance.jpg')
document = Document()
document.add_heading('Python1024_自动生成标题', 0)
document.add_heading('基本:文本', level=1)
p = document.add_paragraph('测试文本\n测试内容\n')
p.add_run('粗体部分内容\n').bold = True
p.add_run('斜体部分\n').italic = True
p.add_run('下划线部分\n').underline = True
p.add_run('字体设置\n').font.size = Pt(24)
# 测试第三方字体
x = p.add_run('三方字体测试\n')
x.font.name = 'Source Han Sans CN' # 思源字体
x.element.rPr.rFonts.set(qn('w:eastAsia'), 'Source Han Sans CN')
# 段落和引用
document.add_heading('标题一:段落', level=1)
document.add_paragraph('引用块', style='Intense Quote')
document.add_heading('标题1.1、无序列表', level=2)
opts = ['选项1','选项2', '选项3']
# 无需列表
for opt in opts:document.add_paragraph(opt, style='List Bullet')
document.add_heading('标题1.2、有序列表', level=2)
# 有序列表document.add_paragraph(opt, style='List Number')
document.add_heading('标题二:图片', level=1)
document.add_picture(str(img_path), width=Inches(5))
document.add_page_break()
document.add_heading('标题三:表格', level=1)
records = ((1, '电风扇', '无叶风扇'),(2, '吹风机', '离子风机'),(3, 'Macbook pro', 'Apple macbook pro 15寸')
)
# 表格
table = document.add_table(rows=1, cols=3)
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = '数量'
hdr_cells[1].text = 'ID'
hdr_cells[2].text = '描述信息'
# 表格数据
for qty, cid, desc in records:row_cells = table.add_row().cellsrow_cells[0].text = str(qty)row_cells[1].text = cidrow_cells[2].text = desc
# 保存文档
document.save(out_path)

设置段落样式

如下:

document.add_paragraph('这是一个样式为 ListBullet 的段落', style='ListBullet')

#Python学习交流QQ群:531509025paragraph = document.add_paragraph('这是一个样式为 ListBullet 的段落')
paragraph.style = 'List Bullet'

设置段落间距

分为 段前 和 段后 ,设置值用 Pt 单位是 磅 ,如下:

paragraph_format.space_before = Pt(18)
paragraph_format.space_after = Pt(12)

设置段落行距

当行距为 最小值 和 固定值 时,设置值单位为 磅 ,需要用 Pt ;当行距为 多倍行距 时,设置值为数值,如下:

from docx.shared import Length
#SINGLE     => 单倍行距(默认)
#ONE_POINT_FIVE => 1.5倍行距
#DOUBLE2    => 倍行距
#AT_LEAST    => 最小值
#EXACTLY    => 固定值
#MULTIPLE    => 多倍行距
paragraph.line_spacing_rule = WD_LINE_SPACING.EXACTLY #固定值
paragraph_format.line_spacing = Pt(18) # 固定值18磅
paragraph.line_spacing_rule = WD_LINE_SPACING.MULTIPLE #多倍行距
paragraph_format.line_spacing = 1.75 # 1.75倍行间距

用python来构建一个word文档-写文章相关推荐

  1. 【Python】批量导出word文档中的图片、嵌入式文件

    Python 批量导出word文档中的图片.嵌入式文件 需求 学生试卷中的题目有要提交截图的,也有要提交文件的,为了方便学生考试,允许单独交或者嵌入Word中提交,那么事后如何整理学生的答案?单独提交 ...

  2. python怎么读取word文件_使用python编辑和读取word文档

    python调用word接口主要用到的模板为python-docx,基本操作官方文档有说明. 使用python新建一个word文档,操作就像文档里介绍的那样: 1 from docx importDo ...

  3. 2021-01-26 Python自动化办公-处理word文档

    Python自动化办公-处理word文档 年底项目投标,需要整理大量的内容,标书的很多内容是其实是之前的标书重复的,可以把对应的各个部分内容合并,然后再处理格式等.如果采用常规操作每次操作需要打开子目 ...

  4. docx文档怎么排列图片_“胶水语言”办公自动化Word篇——使用Python编辑和读取Word文档

    python调用word接口主要用到的模板为python-docx,基本操作官方文档有说明. 使用python新建一个word文档,操作就像文档里介绍的那样: from docx import Doc ...

  5. 用python编辑word_使用PYTHON编辑和读取WORD文档

    python调用word接口主要用到的模板为python-docx,基本操作官方文档有说明. 使用python新建一个word文档,操作就像文档里介绍的那样: 1 from docx import D ...

  6. python处理word_python处理word文档

    来源 https://zhuanlan.zhihu.com/p/21643475 本系列文章将介绍如何使用Python读写主要Microsoft Office文档(Word,Excel和PowerPo ...

  7. python 自动生成word文档,python实现的生成word文档功能示例

    python实现的生成word文档功能示例 发布时间:2020-09-23 11:37:44 来源:脚本之家 阅读:108 作者:zhizunyu2009 本文实例讲述了python实现的生成word ...

  8. python获取pdf和word文档页数

    python获取word文档和pdf文档页数的方法 1.获取pdf页码数 这里要使用到 pdfplumber 这个库,首先导入 没有安装的同学还需要先安装 pip install pdfplumber ...

  9. python处理word_python-docx处理word文档

    前言 更多内容,请访问我的 个人博客. 前言 全网找了一番,用python创建和更新word(.docx)文档,还是 python-docx 包比较好用. 依赖Python 2.6, 2.7, 3.3 ...

最新文章

  1. Airflow安装部署
  2. eShopOnContainers 知多少[2]:Run起来
  3. Liunx安装JDK,tomcat,mysql的依赖包命令
  4. 2018-2019-2 20165330《网络对抗技术》Exp9 Web安全基础
  5. 第四范式推出业界首个基于持久内存、支持毫秒级恢复的万亿维线上预估系统...
  6. python 同时发多个请求_PythonWebServer如何同时处理多个请求
  7. linux 服务器鼠标右键失灵_【华鹏客服维修部】系统重置后,键盘失灵怎么办?...
  8. 缓存与IO(很经典)
  9. 拓端tecdat|HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频波动率
  10. xx学院学员评优评奖管理系统
  11. 在路上——黄山、宏村
  12. 条件随机场(Conditional random field,CRF)
  13. Linux--系统管理
  14. 【已解决】WPS/OFFICE中word文件可以打印,excel打印后无响应
  15. 对象在内存中是如何存储的(内存五大区域和类加载)
  16. minio分布式解决方案
  17. IE浏览器和360无法预览pdf的问题
  18. echarts 柱状图,单独一根柱子根据条件改变颜色
  19. 世嘉公司遭****** LulzSec称愿为世嘉×××
  20. 【达内课程】Enum(枚举)的使用

热门文章

  1. 内存溢出之Tomcat内存配置
  2. symantec、officescan控制台忘记密码如何处理
  3. 使用Varnish加速Web
  4. centos6上虚拟主机的实现
  5. 《Spark核心技术与高级应用》——1.2节Spark的重要扩展
  6. Python学习(七) 流程控制if语句
  7. 执行计划--为查询指定查询计划
  8. 如何成为强大的程序员?(转)
  9. 【分布计算环境学习笔记】9 Web Service
  10. mysql not in语句_MySQL命令