一点背景

我有一个软件规范,我需要以表格的形式解析需求。它们的格式也不总是相同的。我继承了一个python脚本,它使用win32com解析word文档,然后openpyxl将需求导出到excel文件,然后将其上载到HP ALM。在

问题

使用python(或其他可以与python通信的语言),我正在寻找一种相对简单、简单的方法来区分合并单元格和空单元格(这两种都出现在microsoftword文档中)(2010.docx)。在

说明

到目前为止,我已经为这个问题寻找了几个星期的解决方案,但是我还没有找到一个令人满意的答案。在

在stackoverflow上有一些问题here和{a2}。第二个问题是,有一个字段可以告诉您表中是否有合并单元格,这是一个起点,但这还不够,因为表可能是一个跨越多页的超长表。在

尝试解决方案

尝试1.)我的第一个想法是win32com肯定支持检测表中合并的单元格。所以我找了又找能帮我解决这个问题的方法。我发现唯一有效的方法就是检查合并后的单元格是否为空,而上一个单元格是否为空。但是,我无法判断该单元格是否为真正的空单元格或合并单元格。在

尝试2.)我的下一个想法是使用COM和win32api将该功能添加到win32com。但是,我发现COM是相当笨拙的,过时了,而且超级无证,很难使用。win32api也是如此。基本上,我发现这是比它值得做的更多的努力。在

然后我开始寻找win32com的替代库,比如docx for python。这里的问题是,我在非管理员计算机上工作,这严重限制了我下载第三方库的能力。因此,我还没有尝试过这个选项,因为我在获得win32com和openpyxl时就沿着这条路走了。在

尝试4.)我最新也是可能的最后一次尝试是将worddocx文档转换成一个可以轻松解析的XML文件。但是,我不知道XML,也不知道word用于XML的标准格式。在

我现在正在寻找一种最快速、最干净的方法来实现这一点,而无需重写库,也无需从头开始我的1000行脚本。(顺便说一下,它上面有一个显示图形用户界面,所以它很长)

python word 合并单元格_在word文档选项卡中检测合并单元格相关推荐

  1. python手机销售系统详细设计_数据库详细设计文档 .doc

    [原创]定制代写r/python/spss/matlab/WEKA/sas/sql/C++/stata/eviews数据挖掘和统计分析可视化调研报告等服务(附代码数据), 咨询邮箱: 30253934 ...

  2. python结巴分词 词频统计_一个txt文档,已经用结巴分词分完词,怎么用python工具对这个分完词的文档进行计算统计词频,求脚本,非...

    匿名用户 1级 2016-11-03 回答 #!/usr/bin/env python3 #-*- coding:utf-8 -*- import os,random #假设要读取文件名为aa,位于当 ...

  3. java word文档生成目录_JAVA合并word文档生成目录

    /*** 先临时生成一个合并完成后的docx格式文档,doc会出现乱码. *@parampathList 所有需要合并的文档的绝对路径 *@paramsavePath 一个路径,但是没有文件的后缀,之 ...

  4. PhpWord与GD 和图像处理 函数进行word文档数值替换以及合并插入图片

    #PhpWord与GD 和图像处理 函数进行word文档数值替换以及合并插入图片 代码示例 代码如下(示例): public function test(){//读取模板$templateProces ...

  5. html文档不能作为邮件合并数据,在Word 中,下列不能作为邮件合并数据源的是()A.HTML文档B.文本文件C.图像文件D.Excel文件...

    在Word 中,下列不能作为邮件合并数据源的是()A.HTML文档B.文本文件C.图像文件D.Excel文件 更多相关问题 指出下列散瘀止痛.接骨疗伤的要药A.自然铜B.苏木C.红花D.牛膝E.续断 ...

  6. pdf 加深 扫描件_为什么PDF文档不能像Word文档一样随便编辑?如何免费将PDF转换为Word?...

    PDF文档是一种非常难编辑的文档,有时候我们需要编辑或者复制PDF文档里面的内容,把PDF文档转换为Word就是我们最佳的选择.为什么PDF文档这么难编辑?我们怎么免费把PDF文档转换为Word文档? ...

  7. 怎么用计算机制作海报,电脑word怎么做海报_用word做的海报步骤

    4 怎么用word设计海报 1.首先就是新建文档,设置好纸张大小和页边距,小编这里用的是横向A3,页边距上下3厘米,左右2.5厘米.如果是拿着看的就设置文字大小为5号,甚至可以更小. 2.页面布局-分 ...

  8. 比Word更优雅的记笔记/写文档/交报告方式

    比Word更优雅的记笔记/写文档/交报告方式 markdown+vscode->pdf 背景 最近在上的一门<信息系统开发工具>课老师要求实验以后都要交实验报告,但是和以往不同的是, ...

  9. 用VBA在Word文档中每页页眉插入返回文档目录中相应位置的超链接

    [说明]此文中在页眉插入跳转到目录项的超链接的代码几经改进,但改进后并未删除改进之前的代码,是为了有个对比利于学习.如果想节约时间,该步骤可直接查看该部分最后一个代码块. 对于Word长文档,标准做法 ...

最新文章

  1. [原]VS2012编译GLEW 1.11
  2. Python学习笔记:Import详解2
  3. :before 和 :after
  4. Centos Flex 2.6.4
  5. 禁用计算机f1-f12,win10禁用F1至F12热键转为功能键的技巧
  6. 会话技术(Cookie Session)
  7. 关掉内核线程linux,c – 如何在rmmod上停止Linux内核线程?
  8. Hacker News 12 月招聘趋势:React 已连续霸榜 19 个月
  9. linux ghost dd,在Linux上用dd命令实现ghost功能
  10. ASP和JS读写Cookie的问题
  11. Hadoop组件概览
  12. 程序员接单网站哪个好(盘点十大程序员接私活平台)
  13. 解决关于pycharm启动时持续Updating Indices的问题
  14. 少儿编程学习(循环及条件语句)
  15. android主流手机测试,硬件测试哪家强?安卓手机跑分软件横评
  16. 5 款让开发效率倍增的 VS Code 插件
  17. Java 调用第三方接口,实战来了!
  18. c语言的取整和取余符号(三位数每一位数怎样求)
  19. ET篇:master消息机制介绍(一般消息的流转)
  20. 直接存储器存取(DMA)有哪3种工作方式?

热门文章

  1. 如何在您的香港主机帐户上注册多个域名
  2. UE4 骨骼动画 蓝图中调节某一根骨骼
  3. 计算机科学与技术社会实践活动,计算机科学与技术学院学生开展“食品安全行”社会实践活动...
  4. sql server 入门教程
  5. 51nod1462 树据结构
  6. C语言怎样判断乘法越界,c语言算术运算符越界问题解决方案
  7. java解压出来损坏_ZipOutputStream创建损坏的(可解压缩的)zip文件
  8. SKU与SPU(外行人都能看懂)
  9. python 中 np.sum()函数 通俗易懂理解!
  10. 【板绘软件】板绘初学者入门用什么软件比较好?都有哪些软件呢?