Python读取docx文档的内容
Python读取docx文档的内容
下载好解析docx文档的包,Python-docx是专门针对于word文档的一个模块。
doc.paragraphs 段落集合
doc.tables 表格集合
doc.sections 节 集合
doc.styles 样式集合
doc.inline_shapes 内置图形 等等
1、读取文档内容
from docx import Document
doc=Document("C:\\Users\\Administrator\\Desktop\\wuyou.docx") #实例化一个文档对象
for value in doc.paragraphs: #遍历文档的每一段print(value.text) #输出每一段的内容
2、插入段落
doc.add_paragraph("i name is wuyou") #插入段落
doc.save("C:\\Users\\吴悠\\Desktop\\wuyou.docx") #一定要保存,否则之前的操作无效
3、添加标题
doc.add_heading('Document Title',0) # 这里是给文档添加一个标题,0表示 样式为title,1则为忽略,其他则是Heading{level}
doc.add_heading('Heading, level 1', level=1) # 这里是添加标题1
4、添加图片
from docx.shared import Inches
doc.add_picture('monty-truth.png', width=Inches(1.25)) # 添加图片
5、添加列表
table = doc.add_table(rows=1, cols=3) # 添加一个表格,每行三列
hdr_cells = table.rows[0].cells # 表格第一行的所含有的所有列数
hdr_cells[0].text = 'Qty' # 第一行的第一列,给这行里面添加文字
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
Python读取docx文档的内容相关推荐
- python——读取docx文档wordcloud生成词云并进行词频统计
文章目录 环境准备 导入库 读取docx并进行分词 词频 词云 设置背景图片(可选) 生成词云 保存词云并显示 环境准备 # 不是docx,是python-docx!!!!!!! pip instal ...
- python获取docx文档的内容(文本)
首先下载第三方库python-docx: pip install python-docx(在py文件里面导入的时候是import docx) 简单的说,docx里面的每一个段落都是一个paragrap ...
- 数据导入与预处理-第4章-数据获取python读取pdf文档
数据导入与预处理-第4章-数据获取Python读取PDF文档 1 PDF简介 1.1 pdf是什么 2 Python操作PDF 2.1 pdfplumber库 2.2 pdfplumber基本操作 2 ...
- Ubuntu下使用python读取doc和docx文档的内容
读取docx文档 使用的包是python-docx 1. 安装python-docx包 sudo pip install python-docx 2. 使用python-docx包读取数据 #enco ...
- Python读取.txt文档内容/读取text文件内容
Python读取.txt文档内容/读取text文件内容; 读取txt后缀文件的内容的两种方式,简约易懂,复制粘贴即可食用,节约你宝贵的时间 文档全部数据一次性读取 # -*- coding: UTF- ...
- python读取doc文件_Linux 下Python 读取Word文档内容的方法
如果你是在Windows下, 直接使用win32com就可以进行读取word.doc文档和写入文档了. 但是在Linux下还真是麻烦, 一种方法是用OpenOffice的一个库来进行操作,那么意味这你 ...
- python读取word文档并做简单的批量文档筛选
python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...
- Python获取docx文档里的批注
注意:该作者博客已迁移至https://buxianshan.xyz 使用Python-docx库可以很方便的处理docx文件(官方文档) 但是有些隐含的信息Python-docx库好像无法读取,比如 ...
- python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较
演示如下. 两个简单的word文档, 各有一个表格: 读取文档中的表格到列表(为演示只对单列表格操作): import docx def 取表格(文件名): 文件 = docx.Document(文件 ...
最新文章
- LeetCode 443 String Compression(双指针)
- 【Matlab 控制】构建系统,绘制零极点
- [转]oracle查看数据文件, 控制文件, 及日志文件命令
- 我的博客今天0岁346天了,我领取了…
- 如何quot;优雅quot;地终止一个线程?
- python-pycharm控制台输出带颜色
- 关于ECMAScript6 的学习01-ES6 的六种变量声明方式===关于常量const
- 设计模式在项目中的应用案例_项目化学习案例(五):菊花种植的秘密——项目化学习在菊种植课程中的应用设计案例...
- tesseract 配置文件
- 我的世界服务器雪球菜单无限雪球,命令方块实现雪球菜单玩家互传功能
- 重启路由器可以换IP吗
- CRM给B2B企业带来的影响
- 第12期 《博观而约取,厚积而薄发》6月刊
- 【教程】使用腾讯云轻量应用服务器搭建Jitsi Meet视频会议系统,轻松召开私域视频会议!
- 使用proc编译器遇到的几个问题及解决办法
- Excel PivotTable 使用心得手顺分享(二)
- IT架构师_隽语集(Design Thinking _0201)
- 王阳明: <一> 破山中之贼易,破心中之贼难
- 光谱共焦传感器测量的特点
- 为什么说手游代理是目前比较具有优势的创业方式呢?
热门文章
- LVGL8学习之slider
- .sh文件怎么运行_监控Linux文件或目录的变化工具之watchman
- 1、S32K1XX 系列 keil下新建工程
- 牛客网刷题-合并两个有序数组
- java实现中文汉字转拼音 Pinyin4j的基本用法
- Ruby on Rails (3)
- linux 添加spi 驱动,Linux下SPI和IIC驱动免在设备树上添加设备信息的编写方法
- Python制作微信自动回复机器人,打游戏时自动回复女友消息
- 放俩算法上来吧 (difficulty:easy)
- springboot在线竞拍平台java网上拍卖系统源码