用于抽取word文档中指定表格的指定数据
供学习交流

import pandas as pd
import docx
import osdef get_data_from_path(save_path):document = docx.Document(save_path)col_keys = [] # 获取列名col_values = [] # 获取列值i = 0  # 用来筛选指定表格(对于文档中有多个表格的情况)for table in document.tables:if i == 0:i += 1continueif i > 1 : breaki += 1for row_index, row in enumerate(table.rows):for col_index, cell in enumerate(row.cells):if row_index > 0:if col_index == 0:col_keys.append(cell.text.replace('\n',''))if col_index == 2:col_values.append(cell.text)# print(f'col keys is {col_keys}')# print(f'col values is {col_values}')return  col_keys, col_valuesdef docx2csv(wordlist_path, csv_path):key, value = get_data_from_path(wordlist_path)res = []  # 存txtsize = len(key)for i in range(size):txt_temp = key[i] + ',' + value[i].replace('\n', ',')txt_temp = txt_temp.split(',')res.append(txt_temp)df = pd.DataFrame(res)df.to_csv(csv_path, encoding='utf_8_sig', index=False, header = None)print('3Q')wordlist_path = 'E:\\数字电子技术.docx'
csv_path = r'E:\1.csv'docx2csv(wordlist_path, csv_path)docxs_path = r'E:\电子系课程'  # 文件夹路径file_list = os.listdir(docxs_path)
print(file_list)
for fl in file_list:if not os.path.splitext(fl)[1] == ".docx":  # 筛选文件类型,注意”.“continuedocx_path = os.path.join(docxs_path, fl)  # 文件路径csv_name = fl.split('.')[0] + '.csv'  # csv文件名csv_path = os.path.join(docxs_path, csv_name)  # 文件路径docx2csv(docx_path, csv_path)

批量抽取word文档中的表格相关推荐

  1. 办公室小姐姐的福利!用Python批量提取word文档中的表格和图片内容

    点上方"菜鸟学Python",选择"星标" 第491篇原创干货,第一时间送达 最近有许多小伙伴想要一些自动化办公的福利小程序,今天就满足大家的需求.日常的办公过 ...

  2. 如何批量修改Word文档中的表格样式和题注格式?

    在进行大型项目的方案文档设计时,一个文档中有可能涉及到上百个图表,在最后定稿的时候,需要进行统一的格式化处理.面对这些数目庞大的表格,挨个用格式刷进行处理,一路刷下来往往手都会刷酸,更令人奔溃的是好不 ...

  3. WORD文档中的表格:自定义方式的批处理,增删行列和内容

    WORD文档中的表格:自定义方式的批处理,增删行列和内容: 大家有没有遇到需要处理WORD文档中的表格,表格多,需要大量的重复性工作: office提供了宏录制方式,可以编辑风格,内容,但是针对增删表 ...

  4. java poi操作word2007_java使用poi解析2007以上的word文档中的表格与图片

    项目中使用到了要解析word文档中的表格与图片,网上的2003的解析方式很多,2007以上的很少,我看了官网找了资料自己写了一个简单的解析方案,大家共同学习吧!有不对的地方希望大神指教! import ...

  5. 用Aspose.Words 从Word文档中提取表格数据

    用Aspose.Words 从Word文档中提取表格数据 对于某些项目,开发人员需要从Word文档中提取数据并导出到数据库.最大的挑战是必须支持现有Word文档. 相同格式且带多个数据块的Word文档 ...

  6. 【Python】批量导出word文档中的图片、嵌入式文件

    Python 批量导出word文档中的图片.嵌入式文件 需求 学生试卷中的题目有要提交截图的,也有要提交文件的,为了方便学生考试,允许单独交或者嵌入Word中提交,那么事后如何整理学生的答案?单独提交 ...

  7. 批量删除 Word 文档中的所有图片

    概要:我们在处理 Word 文档的时候,里面会包含很多图片.我们能否一键删除这些 Word 文档中的图片呢?这样的话我们可以保持我们的 Word 文档是没有图片的.如果能够批量删除 Word 中的图片 ...

  8. python合并word表格单元格_Python实战009:读取Word文档中的表格数据及表格合并问题解决...

    同事最近被安排整理资料,主要工作室将文档中的表格数据提取出来并整理层Excel表格供我们FII刀具商城进行资料维护.由于刀具的种类繁多且规格无数,所以要处理的数据量相当的庞大.人工核对整理既费时又费力 ...

  9. 如何批量去掉Word文档中图片的超链接?

    如何批量去掉Word文档中图片的超链接? 问题: 如何批量去掉Word文档中图片的超链接? 答案: Ctrl+A全选文本:同时按下键盘上的Ctrl+Shift+F9,保存成PDF之后就不会再显示链接了 ...

最新文章

  1. 【问题】最近遇到的不大不小的arduino库使用问题
  2. python爬虫与数据分析实战27_Python网络爬虫与文本数据分析
  3. mvc html根目录,c#-路由到ASP.NET MVC中的根目录
  4. Jenkins配置与使用
  5. 绝了,几款主流的 JSON 库性能对比!
  6. [转]微波/毫米波雷达
  7. 关于在平台中设置系统全局变量的使用和场景
  8. python自动获取北京时间_python实现定时同步本机与北京时间的方法
  9. Atitit (Sketch Filter)素描滤镜的实现  图像处理  attilax总结v2
  10. [React-Native]环境配置amp;HelloWorld
  11. 如何搭建企业大数据分析平台
  12. mysql触发器trigger实例详解
  13. 计算机继续教育笔记,第三轮继续教育自学读书笔记
  14. OutLook 2013 添加 USC gmail 邮箱 解决国内USC邮箱打不开
  15. C++实现get与set
  16. Unity3d之坦克大战(二)
  17. 怎么写出计算机SCI论文
  18. 【网络经济与企业管理】选择题,错题
  19. 国科大学习资料--最优化计算方法(王晓)--第三次作业答案
  20. Django学习——1.创建第一个项目

热门文章

  1. EN 13984防水柔性板—CE认证
  2. 金刚石图案java实现_案例1 绘制金刚石图案算法.ppt
  3. 前端开发规范之html编码规范
  4. 《机器学习实战》学习笔记———使用logistic回归预测患有疝病的马的存活
  5. 关于CorelDraw X8第一次安装时存在另一版本,而无法安装当前版本的问题
  6. egret的$hitTest函数有bug?
  7. 当你开始用 ChatGPT 时,我已经开始调教自己的 AI 机器人了!
  8. 【Android】用Cubism 2制作自己的Live2D——android sdk样本的下载与Android studio编译!...
  9. 华为鸿蒙os可升级手机,华为鸿蒙OS 2.0升级清单曝光,来看看有没有你的手机
  10. 使用python打印 * 构成的图形(循环语句)