python提取word所有表格_用Python提取 Word 表格内容
一个公司有若干个部门,一个部门有若干个员工,每一个员工填写一份自己的信息(Word 版),然后录入系统,Word 表格模板如下:
填入内容如:
首先我们需要做的就是把数据提取出来,之后我们就可以对数据 为所欲为 进行相关操作了。
提取表格数据代码如下:
import docx
docName = "C:/Users/Administrator/Desktop/信息.docx"
# 打开文档
docStr = docx.Document(docName)
# 获取Word文档中所有表格
numTables = docStr.tables
# 把数据放到列表中
my_list = []
for table in numTables:
# 行列个数
row_count = len(table.rows)
col_count = len(table.columns)
for i in range(row_count):
row = table.rows[i].cells
for j in range(col_count):
content = row[j].text
my_list.append(content)
# 将列表改为字典格式,方便进行相关操作
my_dict = {}
for i in range(len(my_list)):
if i % 2:
try:
# 去除单元格为空的内容
if k:
my_dict[k] = my_list[i]
except:
pass
else:
k = my_list[i]
print(my_dict)
结果如下:
{'姓名': 'Apollo', '证件类型': '身份zheng', '证件号码': '123456789012345678', '性别': '男', '出生日期': '2017.6.6', '状况': '未婚', '户籍区划': '河北省唐山市路北区', '详细地址': '路北区智源里1-1-2', '联系方式': '110', '职务': ''}
python提取word所有表格_用Python提取 Word 表格内容相关推荐
- python 提取pdf表格_用Python提取pdf文件中的表格数据
本文作者:杨慧琳 本文编辑:周聪聪 技术总编:张学人有问题,不要怕!访问 http://www.wuhanstring.com/uploads/5_aboutus/爬虫俱乐部-用户问题登记表.docx ...
- python爬贴吧回复_通过python爬取贴吧数据并保存为word
前言 Python是一种跨平台的计算机程序设计语言.是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的.大型项目的开发 ...
- python读取pdf表格_【Python 库】解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比...
pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的. 一.pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本. ...
- beautifulsoup爬取网页中的表格_用 Python 爬取网页
来自公众号:优达学城Udacity 作者:Kerry Parker 编译:欧剃 作为数据科学家的第一个任务,就是做网页爬取.那时候,我对使用代码从网站上获取数据这项技术完全一无所知,它偏偏又是最有逻辑 ...
- python读取pdf表格_[转]Python 解析 PDF 文本和表格的四大方法介绍
Python 解析 PDF 文本和表格的四大方法介绍 == code for paper and NSFC Proj. parsing==: https://gitee.com/sonica/pdf_ ...
- python10分钟处理表格_使用python对excel表格处理的一些小功能
python对excel表格处理的一些小功能 功能概览pandas库的一些应用文件读入计算表格中每一行的英文单词数简单用textblob进行自然语言情感分析判断一行中是不是有两列值都与其他行重复(可推 ...
- python拷贝excel工作簿_几百个Excel表格需要复制粘贴,如何用Python一键搞定?
在工作中经过会遇到大量格式一致,内容不同的Excel表格文件,需要将这里面的内容整理到一个Excel文件中的情形.一般情况下,都是将这些Excel表格文件一个一个地打开,将里面的内容复制,然后粘贴到一 ...
- python写表格_使用Python对Excel进行读写操作
学习Python的过程中,我们会遇到Excel的读写问题.这时,我们可以使用xlwt模块将数据写入Excel表格中,使用xlrd模块从Excel中读取数据.下面我们介绍如何实现使用Python对Exc ...
- 如何用python生成表格_用 Python 生成 HTML 表格
在 邮件报表 之类的开发任务中,需要生成 HTML 表格. 使用 Python 生成 HTML 表格基本没啥难度, for 循环遍历一遍数据并输出标签即可. 如果需要实现合并单元格,或者按需调整表格样 ...
最新文章
- C语言的设计模式-接口隔离
- java开启线程的方法_Java有几种方法开启线程?怎么实现带有返回值的线程?
- KVM 虚拟化技术以及 KVM 和云计算的关系
- python3-开发进阶-仿博客园项目setting.py的文件的配置,admin,forms(2)
- Lucene全文检索过程
- 2019厦门大学信息学院人工智能/智能科学与技术系夏令营(非计算机系)
- 【数据结构】DFS 代码模板
- 王者服务器维护11月,11月17日体验服停机更新公告
- 软考中级——系统集成项目管理工程师 知识点思维导图
- 3t中文 studio_studio 3t免费版
- android root 的作用,安卓手机Root好不好?手机Root后有什么好处和影响?
- LitePal使用踩坑指南
- 如何在word中的方框里打钩
- 任务队列:celery快速入门及django中celery的用法
- Windows ActiveMq开机自启动设置
- 2019年的学习计划
- 求有多少个连续字串中所有的字母都出现了偶数次
- Nginx入门学习笔记
- 狂人社区_观看此狂人将软盘驱动器连接到他的Android手机
- 【Django 学习笔记】1、基础概念和MVT架构