关于自动化提取word中表格信息的方法

最近工作中需要提取word中表格的特定信息,采用python写了一个小的脚本,留在此处供大家参考。

import docxdata = docx.Document(r"C:\Users\86180\Desktop\埋深\5.地下水埋深逐日监测成果表.docx")all = []for table in data.tables:table_sigle = {}for r in table.rows:for cell in r.cells:if cell.text[:2] == "东经":table_sigle["东经"] = cell.text[3:]elif cell.text[:2] == "北纬":table_sigle["北纬"] = cell.text[3:]elif cell.text[:5] == "平均埋深:":table_sigle["平均埋深"] = cell.text[5:]all.append(table_sigle)print(all)k = {"东经":[],"北纬":[],"平均埋深":[]}
key = ["东经","北纬","平均埋深"]result = [k[s].append(point[s]) for point in all for s in key]import pandas as pd
result = pd.DataFrame(k)
result.to_excel("ms1.xlsx")

ps:docx可以很好的进行word文档的解析,可以把word当做对象,word中的表格就是tables对象,利用Document读取word后,利用tables属性就可以搞出来。word对应的文件是横页的表格。

关于自动化提取word中表格信息的方法相关推荐

  1. python中读取word信息_Python实现批量读取word中表格信息的方法

    本文实例讲述了Python实现批量读取word中表格信息的方法.分享给大家供大家参考.具体如下: 单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个py ...

  2. python 读取 word 表格_Python实现批量读取word中表格信息的方法

    本文实例讲述了Python实现批量读取word中表格信息的方法.分享给大家供大家参考.具体如下: 单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个py ...

  3. Python 批量提取 Word 中表格内容,一键写入 Excel

    关注公众号:[小张Python],为你准备了 50+ 本Python 精品电子书籍 与 50G + 优质视频学习资料,后台回复关键字:1024 即可获取:如果对博文内容有什么疑问,后台添加作者[个人微 ...

  4. python解析word中表格_python读取word表格

    python如何获取word文件中某个关键字之后的表格 用python对word文档进行搜索和读取,要CSS布局HTML小编今天和大家分享读取docx文件中某个关键字文本最好是全部都读取到程序中,在程 ...

  5. Java读取word中表格

    因为要新建一个站,公司要把word表格的部分行列存到数据库中.之前用java操作过excel,本来打算用java从word表格中读取数据,再存到数据库中,结果因为权限不够,无法访问公司要写的那个数据库 ...

  6. Python PDF转Word,以及提取Word中图片里的文字

    PDF转Word,以及提取Word中图片里的文字 PS: 也是从网上各个帖子中学习的Python,因此代码的格式以及内容有粘贴网上其他大神的代码,如有侵权请告知删除 软件截图: #!/usr/bin/ ...

  7. python word中表格字体设置_利用Python-docx 读写 Word 文档中的正文、表格、段落、字体样式等...

    前言: 前两篇博客介绍了 Python 的 docx 模块对 Word 文档的写操作,这篇博客将介绍如何用 docx 模块读取已有 Word 文档中的信息. 本篇博客主要内容有: 1.获取文档的章节信 ...

  8. 通过Python的pdfplumber库提取pdf中表格数据

    文章目录 前言 一.pdfplumber库是什么? 二.安装pdfplumber库 三.查看pdfplumber库版本 四.提取pdf中表格数据 1.引入库 2.定义pdf文件路径 3.打开pdf文件 ...

  9. java提取word中的文字_Java 提取Word中的文本和图片

    本文将介绍通过Java来提取或读取Word文档中文本和图片的方法.这里提取文本和图片包括同时提取文档正文当中以及页眉.页脚中的的文本和图片. 使用工具:Free Spire.Doc for Java ...

最新文章

  1. javascript自定义cookie
  2. “AV终结者/8749”病毒清理办法
  3. 做了5年Java,java读写锁使用
  4. 腾讯面试题 TCP/IP协议四个层次
  5. Winforn中使用FastReport实现点击导出按钮PDF预览并弹出另存为对话框
  6. 计算机房活动记录,兴趣小组活动记录表
  7. vuecli启动的服务器位置,在vue cli 3生成的项目中启动dev服务器
  8. SpringBoot2.X 整合Redis实现简单缓存操作
  9. Android系统(2)---init.rc知识
  10. 转 zookeeper启动为什么占用8080端口,修改哪个配置文件可以改变端口?
  11. Linux下apache+php+mysql配置攻略
  12. matlab 7.0电路图,基于Multisim10和Matlab7.0的正弦稳态电路分析
  13. 微信小程序之登录界面示例
  14. Chrome浏览器书签同步插件floccus与坚果云的协同使用方法
  15. 跟着团子学SAP CS:SAP CS(客户服务)模块概览
  16. QGC 谷歌中国地图 火星坐标系 转换
  17. 红楼梦词云制作(带背景)
  18. cmarkup 加载字符串_伦敦统一用户组(LUUG)3:字符串和预加载
  19. php浏览器跟踪调试,Phpstorm怎么在命令行以及浏览器中调试
  20. 3种思路,打造用户画像的标签体系

热门文章

  1. 《JAVA面试考点导读》(一)JDK基础类源码阅读
  2. 个人站长能赚多少钱kxtui.com
  3. AD9680之JESD204B接口2路、4路、8路的14bit 500MSPS/1GSPS/1.25GSPS采样率子卡的中文版本设计及调试经验资料分享
  4. 【讲座笔记】深度学习在通信领域的应用--Byonghyo Shim教授
  5. 1+x云计算中级--脚本搭建读写分离
  6. Android AsyncTask onProgressUpdate 方法的些许研究
  7. 零极点判别系统稳定性和通过平衡点找出矩阵特征值来判定稳定性之间的关系
  8. html 禁止选择与复制,禁止图片拖拽
  9. 哈理工大学ACM程序设计全国邀请赛D D Pairs(FFT)
  10. Python在自然语言处理领域的应用 Natural Language Processing With Python: Analyzing Text