Python读取docx文档的内容

下载好解析docx文档的包,Python-docx是专门针对于word文档的一个模块。

doc.paragraphs 段落集合
doc.tables 表格集合
doc.sections 节 集合
doc.styles 样式集合
doc.inline_shapes 内置图形 等等

1、读取文档内容

from docx import Document
doc=Document("C:\\Users\\Administrator\\Desktop\\wuyou.docx")  #实例化一个文档对象
for value in doc.paragraphs:  #遍历文档的每一段print(value.text)  #输出每一段的内容

2、插入段落

doc.add_paragraph("i name is wuyou")  #插入段落
doc.save("C:\\Users\\吴悠\\Desktop\\wuyou.docx")  #一定要保存,否则之前的操作无效

3、添加标题

doc.add_heading('Document Title',0)  # 这里是给文档添加一个标题,0表示 样式为title,1则为忽略,其他则是Heading{level}
doc.add_heading('Heading, level 1', level=1)  # 这里是添加标题1

4、添加图片

from docx.shared import Inches
doc.add_picture('monty-truth.png', width=Inches(1.25))  # 添加图片

5、添加列表

table = doc.add_table(rows=1, cols=3)  # 添加一个表格,每行三列
hdr_cells = table.rows[0].cells  # 表格第一行的所含有的所有列数
hdr_cells[0].text = 'Qty'  # 第一行的第一列,给这行里面添加文字
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'

Python读取docx文档的内容相关推荐

  1. python——读取docx文档wordcloud生成词云并进行词频统计

    文章目录 环境准备 导入库 读取docx并进行分词 词频 词云 设置背景图片(可选) 生成词云 保存词云并显示 环境准备 # 不是docx,是python-docx!!!!!!! pip instal ...

  2. python获取docx文档的内容(文本)

    首先下载第三方库python-docx: pip install python-docx(在py文件里面导入的时候是import docx) 简单的说,docx里面的每一个段落都是一个paragrap ...

  3. 数据导入与预处理-第4章-数据获取python读取pdf文档

    数据导入与预处理-第4章-数据获取Python读取PDF文档 1 PDF简介 1.1 pdf是什么 2 Python操作PDF 2.1 pdfplumber库 2.2 pdfplumber基本操作 2 ...

  4. Ubuntu下使用python读取doc和docx文档的内容

    读取docx文档 使用的包是python-docx 1. 安装python-docx包 sudo pip install python-docx 2. 使用python-docx包读取数据 #enco ...

  5. Python读取.txt文档内容/读取text文件内容

    Python读取.txt文档内容/读取text文件内容; 读取txt后缀文件的内容的两种方式,简约易懂,复制粘贴即可食用,节约你宝贵的时间 文档全部数据一次性读取 # -*- coding: UTF- ...

  6. python读取doc文件_Linux 下Python 读取Word文档内容的方法

    如果你是在Windows下, 直接使用win32com就可以进行读取word.doc文档和写入文档了. 但是在Linux下还真是麻烦, 一种方法是用OpenOffice的一个库来进行操作,那么意味这你 ...

  7. python读取word文档并做简单的批量文档筛选

    python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...

  8. Python获取docx文档里的批注

    注意:该作者博客已迁移至https://buxianshan.xyz 使用Python-docx库可以很方便的处理docx文件(官方文档) 但是有些隐含的信息Python-docx库好像无法读取,比如 ...

  9. python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较

    演示如下. 两个简单的word文档, 各有一个表格: 读取文档中的表格到列表(为演示只对单列表格操作): import docx def 取表格(文件名): 文件 = docx.Document(文件 ...

最新文章

  1. LeetCode 443 String Compression(双指针)
  2. 【Matlab 控制】构建系统,绘制零极点
  3. [转]oracle查看数据文件, 控制文件, 及日志文件命令
  4. 我的博客今天0岁346天了,我领取了…
  5. 如何quot;优雅quot;地终止一个线程?
  6. python-pycharm控制台输出带颜色
  7. 关于ECMAScript6 的学习01-ES6 的六种变量声明方式===关于常量const
  8. 设计模式在项目中的应用案例_项目化学习案例(五):菊花种植的秘密——项目化学习在菊种植课程中的应用设计案例...
  9. tesseract 配置文件
  10. 我的世界服务器雪球菜单无限雪球,命令方块实现雪球菜单玩家互传功能
  11. 重启路由器可以换IP吗
  12. CRM给B2B企业带来的影响
  13. 第12期 《博观而约取,厚积而薄发》6月刊
  14. 【教程】使用腾讯云轻量应用服务器搭建Jitsi Meet视频会议系统,轻松召开私域视频会议!
  15. 使用proc编译器遇到的几个问题及解决办法
  16. Excel PivotTable 使用心得手顺分享(二)
  17. IT架构师_隽语集(Design Thinking _0201)
  18. 王阳明: <一> 破山中之贼易,破心中之贼难
  19. 光谱共焦传感器测量的特点
  20. 为什么说手游代理是目前比较具有优势的创业方式呢?

热门文章

  1. LVGL8学习之slider
  2. .sh文件怎么运行_监控Linux文件或目录的变化工具之watchman
  3. 1、S32K1XX 系列 keil下新建工程
  4. 牛客网刷题-合并两个有序数组
  5. java实现中文汉字转拼音 Pinyin4j的基本用法
  6. Ruby on Rails (3)
  7. linux 添加spi 驱动,Linux下SPI和IIC驱动免在设备树上添加设备信息的编写方法
  8. Python制作微信自动回复机器人,打游戏时自动回复女友消息
  9. 放俩算法上来吧 (difficulty:easy)
  10. springboot在线竞拍平台java网上拍卖系统源码