python 读取文件_python读取docx文件,就是如此简单
扫码加入千人跳槽求职QQ群或微信圈子,每日都有全国招聘信息哦
中文编码问题总是让人头疼(尤其是mac本),想要用Python读取word中的内容。用open()经常报错,通过百度搜索+问身边小伙伴发现了Python有专门读取.docx的模块python_docx。本篇文章主要来解决一个读取docx文件的基本操作。希望感兴趣的小伙伴可以坚持看下去同时欢迎提出宝贵的意见让我们一起进步!
01:问题抛出与引入
import docxpath = "C:\\Users\\qin\\Desktop\\1.docx"file_object=open(path,'rb')print(file_object.read())#输出结果如下所示:b'PK\x03\x04\x14\x00\x06\x00\x08\x00\x00\x00!\x00J\xbc\x02qm\x01\x00\x00(\x06\x00\x00\x13\x00\x08\x02[Content_Types].xml \xa2\x04\x02(\xa0\.....
一个很简单的docx文件,打印出来的结果却不是我们想要的。对此引入一个十分好用的docx模块,下面就详细介绍该模块的一些基本操作。
02:安装docx模块
pip install python_docx
03:新建文档对象
import docxfrom docx import Document# 新建文档,并将其保存名为“test.docx”的文件document = Document()document.save('test.docx')
04:添加文档内容
import docxfrom docx import Documentfrom docx.shared import Inchesdocument = Document('C:\\Users\\qin\\Desktop\\1.docx')document.add_heading('I like python', 0)#插入标题:0表示样式为title标题document.add_heading('一级标题', level=1)#插入1级标题p = document.add_paragraph('Python是一种计算机程序设计语言 ')#插入段落document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加图片并指定宽度table = document.add_table(rows=1, cols=3) #添加一个表格,每行三列hdr_cells = table.rows[0].cells #获取第一行的单元格列表对象hdr_cells[0].text = 'ID' #为每一个单元格赋值hdr_cells[1].text = 'Name'hdr_cells[2].text = 'Age'new_cells = table.add_row().cells #为表格添加一行new_cells[0].text = '1'new_cells[1].text = 'Tom'new_cells[2].text = '15'document.add_page_break() #添加分页符
05:保存文档内容
名字相同则将修改的文件内容保存;名字不同则将修改的文件内容另存为。
import docxfrom docx import Documentdocument.save('C:\\Users\\qin\\Desktop\\1.docx')#保存document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存为
06:读取文本内容
import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path)for paragraph in document.paragraphs: print(paragraph.text)
07:读取表格内容
import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path) # 读入文件tables = document.tables # 获取文件中的表格集table = tables[0] # 获取文件中的第一个表格for i in range(0, len(table.rows)): # 从表格第一行开始循环读取表格数据 result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}' # cell(i,0)表示第(i+1)行第1列数据,以此类推 print(result)
想要知道docx模块更多资料参考:https://python-docx.readthedocs.io/en/latest/
转发到朋友圈是最高的赞赏
因为不是天生丽质,所以必须天生励志!
python 读取文件_python读取docx文件,就是如此简单相关推荐
- python读取docx文件_Python 实现docx文件的读写操作
我们在做一些数据统计或分析的时候,有时会接触到Execl 格式或者Word 格式的文件.Execl格式的数据提取和解析,我们在之前的文章分享过一些非常好用的Python第三方库,本文中主要介绍如何使用 ...
- python读取docx文件_Python读写docx文件的方法
Python读写word文档有现成的库可以处理.我这里采用 python-docx.可以用pip install python-docx安装一下. 这里说一句,ppt和excel也有类似的库哦,而且是 ...
- python读取docx文件_Python读写docx文件
Python读写word文档有现成的库可以处理.我这里采用 python-docx.可以用pip install python-docx安装一下. 这里说一句,ppt和excel也有类似的库哦,而且是 ...
- python读docx文件_Python读写docx文件的方法
Python读写word文档有现成的库可以处理.我这里采用 python-docx.可以用pip install python-docx安装一下. 这里说一句,ppt和excel也有类似的库哦,而且是 ...
- python不同数据的读入_python读写不同编码txt文件_python读写txt文件
python读写不同编码txt文件_python读写txt文件 以后整理规范 [python] view plaincopy import os import codecs filenames=os. ...
- 【Python项目实战】提取.docx文件中的图片并保存到指定的文件夹
文章目录 一.需求分析 二.系统设计 2.1系统业务流程 2.2系统预览 三.系统开发必备 3.1 系统开发环境 3.2文件组织结构 四.主函数设计 1.创建窗口 2.创建按钮 3.创建输入框 五.函 ...
- python自动化办公:利用python将签名自动插入docx文件
一.利用python将签名自动插入docx文件 一张无背景的个性签名 将图片自动识别到docx.pdf中的右下角并插入! 首先这是本人在某微信小程序自动生成的个性签名 一.安装python-docx包 ...
- python读取docx文件出错_Python读写docx文件的方法
这篇文章主要介绍了关于Python读写docx文件的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 Python读写word文档有现成的库可以处理.我这里采用 python-doc ...
- python生成表格文件_python 读取excel文件生成sql文件实例详解
python 读取excel文件生成sql文件实例详解 学了python这么久,总算是在工作中用到一次.这次是为了从excel文件中读取数据然后写入到数据库中.这个逻辑用java来写的话就太重了,所以 ...
最新文章
- web性能优化——关键渲染路径(上)
- QQ采用什么传输协议?
- python @的用法
- 1.14 sort()数组排序(升序和降序)
- java NIO 资料总结
- MYSQL中group_concat有长度限制!默认1024
- JsonUtils 工具类
- python pandas csv 追加 空行,python – Pandas:read_csv在空行后忽略行
- C#LeetCode刷题之#876-链表的中间结点(Middle of the Linked List)
- 数字图像处理(三)——频域滤波
- linux 测试网络端口通不通_【干货】网络中的各种互通与不通
- redis 命令行 操作
- ubuntu18.04安装微信、QQ、百度网盘
- ftp服务器要什么配置文件,ftp服务器要求什么电脑配置
- android 高德地图poi搜索周边
- 论文阅读 “Adaptive Tool Path Planning Strategy for Freeform Surface Machining using Point Cloud Article”
- 自动控制原理7.7---离散系统的数字校正
- 计算机存储容量1tb等于多少,1tb等于多少mb(1tb等于多少gb)
- 学习Nginx看这篇就够了
- Oracle11g卸载完服务还有,Oracle11g服务器与客户端卸载、安装
热门文章
- HTML property 和 attribute 的区别
- Rxjs of() 和 of({}) 的区别
- SAP Spartacus 事件服务 Event Service 使用介绍
- SAP Odata filter的语法
- Hybris产品主数据的价格维护
- Jerry开发的SAP note工具
- scn exercise view.setModel will trigger binding creation in Fiori
- d3 line example debug 2015-05-31
- Fiori Error message Exception raised without specific error
- S/4HANA的生产订单,哪个字段可以用来做生产完成的标志位