Python读取word文档(结尾是docx)中的表格
最近在处理一个需求时:要求读取word文档中表格,然后再把表格写入Excel中
需求非常简单,步骤也很明确,好了,不废话,直接上代码
成功写入:
所需用到的库:
pip install python-docx
用来读取word文档(docx结尾)
pip install openpyxl
用来创建Excel,将读取到的表格写入Excel
目录结构
数据源:放你的word文档,docx结尾
excel结果:保存excel
完整代码
'''
读取word的表格内的数据,并按行打印。
'''
import os
import openpyxl
from docx import Documentwb = openpyxl.Workbook() # 创建excel
ws = wb.activeword = Document("./数据源/" + os.listdir("./数据源/")[0]) # 读入文件
tables = word.tables
for i in range(len(tables)):tb = tables[i]# 获取表格的行tb_rows = tb.rows# 读取每一行内容for i in range(len(tb_rows)):row_data = []row_cells = tb_rows[i].cells# 读取每一行单元格内容for cell in row_cells:row_data.append(cell.text) # 单元格内容print(row_data) # 打印整行数据ws.append(row_data) # 写入excel
wb.save("./excel结果/结果.xlsx")
在这里感谢原帖:【Python】python读取doc、docx文件里的表格内容并存入excel中 点我查看
原帖也有介绍doc转docx,再读取
我也写了一篇:点我
希望对大家有帮助
致力于办公自动化的小小程序员一枚
致力于写出清楚的博客
都看到这了,关注+点赞+收藏=不迷路!!
Python读取word文档(结尾是docx)中的表格相关推荐
- python读取word文档并做简单的批量文档筛选
python读取word文档并做简单的批量文档筛选 最近参与了一项解析大量的word文档(试验报告形式)的工作,因为其中包含着一些对项目无意义的报告,所以要进行初步地筛选,通过查阅资料发现了pytho ...
- python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较
演示如下. 两个简单的word文档, 各有一个表格: 读取文档中的表格到列表(为演示只对单列表格操作): import docx def 取表格(文件名): 文件 = docx.Document(文件 ...
- Python读取word文档(python-docx包)
最近想统计word文档中的一些信息,人工统计的话...三天三夜吧 python 不愧是万能语言,发现有一个包叫做 docx,非常好用,具体查看官方文档:https://python-docx.read ...
- Python读取Word文档段落或者表格
Python解析word文档 1 .安装并导依赖包 2.word的doc格式转docx格式 3.解析word_doc文档段落.表格内容 4.word读取表格存列表封装优化,节省读取时间 1 .安装并导 ...
- python读取doc文件_Linux 下Python 读取Word文档内容的方法
如果你是在Windows下, 直接使用win32com就可以进行读取word.doc文档和写入文档了. 但是在Linux下还真是麻烦, 一种方法是用OpenOffice的一个库来进行操作,那么意味这你 ...
- Python读取word文档识别字段颜色,解析字段!
python版本3.7.3,读取的文档格式为.docx 文中带有简单注释 看不懂的百度网盘下载直接查看,更改运行里面的py文件 网盘下载 Python学习交流群:1004391443 提取码:nngw ...
- python读取word文档
周末需要做一个统计word文档字数的问题,刚开始以为很简单,因为之前做过excel表格相关的任务,所以认为利用扩展模块应该比较简单. 通过搜索,确实搜到了一个python操作word的模块,pytho ...
- 用Python读取Word文档并写入Excel(一)
工作中经常要处理大量的word文档,大部分内容都很简单,比如说做一个汇总表,从发来的word文档里提取名字.联系方式.地址等信息,提取完之后还需要用Excel做汇总,对于十几份的文档尚好,但对于成百份 ...
- python读取word文档中的图片_【Python 3 获取Word所有图片】
上次讲到如何手动快速提取Word文档中的所有图片.这次我们用Python-3基于图片提取原理,写代码实现自动获取. Python 3实现代码import os,zipfile,shutil #引入os ...
最新文章
- jQuery插件开发--(转)
- 高级Android开发面试汇总
- AgileEAS.NET平台开发指南-实现插件
- IIS7中的站点、应用程序和虚拟目录详细介绍
- python怎么下载-如何下载python包
- 进制转换应用场景_PLC编程:PLC内部各类型数据转换(整理分享)
- setContentView( )方法
- 从技术角度讨论微服务
- 推荐系统--用户行为和实验设计
- Mysql 死锁过程及案例详解之清空缓存锁Flush Lock
- 4、第九 - WEB开发基础 - HTML中JavaScript基础应用
- Linux常用命令和vi,gdb的使用
- 【APICloud系列|9】APICloud自定义APPloader一个月未更新,快速更新的办法
- avalon视频学习笔记(六)
- Centos7快速安装docker
- 查看现有Exchange 2010数据库大小
- 线性方程组迭代解法——雅可比(Jacobi)迭代法,Gauss-Seidel迭代法和超松弛(SOR)迭代法
- matlab expotest,软硬件协同开发在电机控制的应用-matlabexpo2019.PDF
- 大学计算机教学ppt,大学计算机基本教学教程3.ppt
- sybase 设置默认值_修改Sybase数据库的默认字符集为CP936