一个公司有若干个部门,一个部门有若干个员工,每一个员工填写一份自己的信息(Word 版),然后录入系统,Word 表格模板如下:

填入内容如:

首先我们需要做的就是把数据提取出来,之后我们就可以对数据 为所欲为 进行相关操作了。

提取表格数据代码如下:

import docx

docName = "C:/Users/Administrator/Desktop/信息.docx"

# 打开文档

docStr = docx.Document(docName)

# 获取Word文档中所有表格

numTables = docStr.tables

# 把数据放到列表中

my_list = []

for table in numTables:

# 行列个数

row_count = len(table.rows)

col_count = len(table.columns)

for i in range(row_count):

row = table.rows[i].cells

for j in range(col_count):

content = row[j].text

my_list.append(content)

# 将列表改为字典格式,方便进行相关操作

my_dict = {}

for i in range(len(my_list)):

if i % 2:

try:

# 去除单元格为空的内容

if k:

my_dict[k] = my_list[i]

except:

pass

else:

k = my_list[i]

print(my_dict)

结果如下:

{'姓名': 'Apollo', '证件类型': '身份zheng', '证件号码': '123456789012345678', '性别': '男', '出生日期': '2017.6.6', '状况': '未婚', '户籍区划': '河北省唐山市路北区', '详细地址': '路北区智源里1-1-2', '联系方式': '110', '职务': ''}

python提取word所有表格_用Python提取 Word 表格内容相关推荐

  1. python 提取pdf表格_用Python提取pdf文件中的表格数据

    本文作者:杨慧琳 本文编辑:周聪聪 技术总编:张学人有问题,不要怕!访问 http://www.wuhanstring.com/uploads/5_aboutus/爬虫俱乐部-用户问题登记表.docx ...

  2. python爬贴吧回复_通过python爬取贴吧数据并保存为word

    前言 Python是一种跨平台的计算机程序设计语言.是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的.大型项目的开发 ...

  3. python读取pdf表格_【Python 库】解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比...

    pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的. 一.pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本. ...

  4. beautifulsoup爬取网页中的表格_用 Python 爬取网页

    来自公众号:优达学城Udacity 作者:Kerry Parker 编译:欧剃 作为数据科学家的第一个任务,就是做网页爬取.那时候,我对使用代码从网站上获取数据这项技术完全一无所知,它偏偏又是最有逻辑 ...

  5. python读取pdf表格_[转]Python 解析 PDF 文本和表格的四大方法介绍

    Python 解析 PDF 文本和表格的四大方法介绍 == code for paper and NSFC Proj. parsing==: https://gitee.com/sonica/pdf_ ...

  6. python10分钟处理表格_使用python对excel表格处理的一些小功能

    python对excel表格处理的一些小功能 功能概览pandas库的一些应用文件读入计算表格中每一行的英文单词数简单用textblob进行自然语言情感分析判断一行中是不是有两列值都与其他行重复(可推 ...

  7. python拷贝excel工作簿_几百个Excel表格需要复制粘贴,如何用Python一键搞定?

    在工作中经过会遇到大量格式一致,内容不同的Excel表格文件,需要将这里面的内容整理到一个Excel文件中的情形.一般情况下,都是将这些Excel表格文件一个一个地打开,将里面的内容复制,然后粘贴到一 ...

  8. python写表格_使用Python对Excel进行读写操作

    学习Python的过程中,我们会遇到Excel的读写问题.这时,我们可以使用xlwt模块将数据写入Excel表格中,使用xlrd模块从Excel中读取数据.下面我们介绍如何实现使用Python对Exc ...

  9. 如何用python生成表格_用 Python 生成 HTML 表格

    在 邮件报表 之类的开发任务中,需要生成 HTML 表格. 使用 Python 生成 HTML 表格基本没啥难度, for 循环遍历一遍数据并输出标签即可. 如果需要实现合并单元格,或者按需调整表格样 ...

最新文章

  1. C语言的设计模式-接口隔离
  2. java开启线程的方法_Java有几种方法开启线程?怎么实现带有返回值的线程?
  3. KVM 虚拟化技术以及 KVM 和云计算的关系
  4. python3-开发进阶-仿博客园项目setting.py的文件的配置,admin,forms(2)
  5. Lucene全文检索过程
  6. 2019厦门大学信息学院人工智能/智能科学与技术系夏令营(非计算机系)
  7. 【数据结构】DFS 代码模板
  8. 王者服务器维护11月,11月17日体验服停机更新公告
  9. 软考中级——系统集成项目管理工程师 知识点思维导图
  10. 3t中文 studio_studio 3t免费版
  11. android root 的作用,安卓手机Root好不好?手机Root后有什么好处和影响?
  12. LitePal使用踩坑指南
  13. 如何在word中的方框里打钩
  14. 任务队列:celery快速入门及django中celery的用法
  15. Windows ActiveMq开机自启动设置
  16. 2019年的学习计划
  17. 求有多少个连续字串中所有的字母都出现了偶数次
  18. Nginx入门学习笔记
  19. 狂人社区_观看此狂人将软盘驱动器连接到他的Android手机
  20. 【Django 学习笔记】1、基础概念和MVT架构

热门文章

  1. 简简单单做股票读书笔记(2/8)
  2. Polynomial operation with C++
  3. 前端和后端有什么区别?哪个好?
  4. Xbox One 与PS4的终极PK
  5. 西门子PLC定时器ton与tonr的差异
  6. OSChina 周五乱弹 —— 都想把地球格式化一次了
  7. 部分APP无法代理抓包的原因及解决方法(flutter 应用抓包)
  8. 在线教育行业十大盈利模式分析
  9. 海马玩模拟器卸载后怎么恢复Virtualbox
  10. 微信小程序之间如何跳转,如何跳转到别人的小程序