演示如下. 两个简单的word文档, 各有一个表格:

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vYmxvZy8xMjg4NTAxLzIwMTkwMy8xMjg4NTAxLTIwMTkwMzA5MTE0MjE0ODk0LTIwMTI4MjUwNzIucG5n.jpg

读取文档中的表格到列表(为演示只对单列表格操作):

import docx

def 取表格(文件名):

文件 = docx.Document(文件名)

首个表 = 文件.tables[0]

值 = []

for 行 in 首个表.rows:

for 格 in 行.cells:

值.append(格.text)

print(文件名 + " -> " + str(值))

return 值

表1 = 取表格('表1.docx')

读取结果:

表1.docx -> ['值1', '值2', '值3']

from deepdiff import DeepDiff

表1 = 取表格('表1.docx')

表2 = 取表格('表2.docx')

print(DeepDiff(表1, 表2))

输出结果(为更可读, 已手动格式化):

{

'values_changed':

{'root[1]':

{'new_value': '值2.5', 'old_value': '值2'}

},

'iterable_item_added':

{'root[3]': '值4'}

}

显示了修改的值和添加的值, 还挺好用. 实际的表格是两列, 需要按照某个键值作对比. 于是用字典, 正好DeepDiff也提供两个字典间的比较. 双列表文件演示:

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vYmxvZy8xMjg4NTAxLzIwMTkwMy8xMjg4NTAxLTIwMTkwMzA5MTE0MjM2MjI5LTIxNTM5MzA2Ny5wbmc=.jpg

读取双列表到字典后, 进行比较:

import docx

from deepdiff import DeepDiff

from pprint import pprint

def 取表格(文件名):

文件 = docx.Document(文件名)

首个表 = 文件.tables[0]

值 = {}

for 行 in 首个表.rows:

格 = 行.cells

值[格[0].text] = 格[1].text

print(文件名 + " -> " + str(值))

return 值

表1 = 取表格('双列表1.docx')

表2 = 取表格('双列表2.docx')

pprint(DeepDiff(表1, 表2), indent=2)

输出如下:

{ 'dictionary_item_added': {"root['键3']"},

'values_changed': {"root['键2']": {'new_value': '值2.5', 'old_value': '值2'}}}

Python读取word文档(python-docx包)

最近想统计word文档中的一些信息,人工统计的话...三天三夜吧 python 不愧是万能语言,发现有一个包叫做 docx,非常好用,具体查看官方文档:https://python-docx.read ...

使用Java POI来选择提取Word文档中的表格信息

通过使用Java POI来提取Word(1992)文档中的表格信息,其中POI支持不同的ms文档类型,在具体操作中需要注意.本文主要是通过POI来提取微软2003文档中的表格信息,具体code如下(事 ...

C# 在word文档中复制表格并粘帖到下一页中

C# 在word文档中复制表格并粘帖到下一页中 object oMissing = System.Reflection.Missing.Value;            Microsoft.Offi ...

python读取word文档

周末需要做一个统计word文档字数的问题,刚开始以为很简单,因为之前做过excel表格相关的任务,所以认为利用扩展模块应该比较简单. 通过搜索,确实搜到了一个python操作word的模块,pytho ...

C#读取word文档中的内容

原文地址 http://blog.csdn.net/yhrun/article/details/7674540 在使用前需要添加引用巨硬的com组件:Microsoft Word 12.0 objec ...

[java 2019-04-09] 代码生成word文档中的表格嵌套问题

public static void createContent3(Date adtStart, Date adtEnd, Map aMap,Map< ...

将表格添加到Word文档中 &comma;包括表格样式设置

创建 Table 对象并设置其属性 在您将表格插入文档之前,必须创建 Table 对象并设置其属性. 要设置表格的属性,请创建TableProperties对象并为其提供值. TablePropert ...

使用python编辑和读取word文档

python调用word接口主要用到的模板为python-docx,基本操作官方文档有说明. python-docx官方文档地址 使用python新建一个word文档,操作就像文档里介绍的那样: fr ...

PHP在linux读取word文档

几天帮朋友解决一个技术问题,在Linux下,将word文档中的内容读取,然后使用正则匹配,拼成sql入库 查阅了外文资料和google之后,步骤如下: #wget http://www.winfiel ...

随机推荐

RDIFramework&period;NET平台代码生成器V3&period;1版本全新发布-更新于2016-10-29(提供下载)

本次主要更新内容: 1.增加对Oracle表创建语句的查看. 2.新增对MySql的代码生成支持. 3.全面重构对多线程的支持,改变以前会无故退出的现象. RDIFramework.NET代码生成器V ...

&lbrack;GodLove&rsqb;Wine93 Tarining Round &num;1

比赛链接: http://acm.hust.edu.cn/vjudge/contest/view.action?cid=44664#overview 题目来源: 2011 Asia Regional ...

JavaScript----插入视频

ttp://schemas.android.com/apk/res/android& ...

linux常用服务软件搭建及使用技巧

一.Webmin安装: Webmin 是一个基于浏览器的管理工具,可以应用于Linux 和其他一些平台,提供了可以完成很多管理和操作任务的图形化界面 •安装完成后,root 用户会被自动创建,密码为系 ...

以太坊开发DApp入门教程——区块链投票系统(一)

概述 对初学者,首先要了解以太坊开发相关的基本概念.   学习以太坊开发的一般前序知识要求,最好对以下技术已经有一些基本了解: 一种面向对象的开发语言,例如:Python,Ruby,Java... 前 ...

第六十九天 dom与bom

1.节点 dom与bom属 // DOM:文档对象模型 =>提高给用户操作document obj的标准接口 // DOM:以document为根,树状展开所有子节点 节点分类 // 节点分类: ...

python生成word文档的表格_2018-10-04 [日常]用Python读取word文档中的表格并比较相关推荐

  1. python合并word表格单元格_Python实战009:读取Word文档中的表格数据及表格合并问题解决...

    同事最近被安排整理资料,主要工作室将文档中的表格数据提取出来并整理层Excel表格供我们FII刀具商城进行资料维护.由于刀具的种类繁多且规格无数,所以要处理的数据量相当的庞大.人工核对整理既费时又费力 ...

  2. python生成uuid_咸鱼高赞回答:有什么相见恨晚的Python技巧,附赠python最新教程...

    日常工作几乎离不python.一路走来,他积累了不少有用的技巧和tips,现在就将这些技巧分享给大家.这些技巧将根据其首字母按A-Z的顺序进行展示. Python相关学习资料获取方式:转发文章+关注私 ...

  3. python 两个列表相互映射_Python基础 — 10分钟学习函数式Python

    点击上方蓝字"Python圈子",进行关注~ (图片源自网络) 在这篇10分钟的文章中,您将学习Python中的函数式范型.您还将学习列表推导式. 目录 1.  函数式范式 2.  ...

  4. 网页上表格复制到excel只能选html格式,怎么将网页中的表格快速复制到EXCEL中

    1,将包括所需表格的网页打开,并按CTRL+C把网址复制到剪贴板,以备下一步使用. 2,打开运行Excel软件,单击菜单栏中的"数据→导入外部数据→新建Web查询",打开" ...

  5. python 适合做什么生意好_推荐 10 个有趣的 Python 练手项目

    想成为一个优秀的Python程序员,没有捷径可走,势必要花费大量时间在键盘后. 而不断地进行各种小项目开发,可以为之后的大开发项目积攒经验,做好准备. 但不少人都在为开发什么项目而苦恼. 因此,我为大 ...

  6. python练手经典100例项目-推荐 10 个有趣的 Python 练手项目

    想成为一个优秀的Python程序员,没有捷径可走,势必要花费大量时间在键盘后. 而不断地进行各种小项目开发,可以为之后的大开发项目积攒经验,做好准备. 但不少人都在为开发什么项目而苦恼. 因此,我为大 ...

  7. python生成词云_词云制作没那么难,Python 10 行代码就实现了!

    欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信"学习资料"可以领取包括不限于Python实战演练.PDF电子文档.面试集锦.学习资料等. 写在前面 想必大家有一个问 ...

  8. python生成词向量_gensim的word2vec如何得出词向量(python)

    首先需要具备gensim包,然后需要一个语料库用来训练,这里用到的是skip-gram或CBOW方法,具体细节可以去查查相关资料,这两种方法大致上就是把意思相近的词映射到词空间中相近的位置. 语料库t ...

  9. opencv python 生成画布_第16章 坚持一百秒(《Python趣味创意编程》教学视频)

    (图书介绍:童晶:<Python趣味创意编程>新书预告) 本章我们将实现坚持一百秒的游戏,玩家通过移动人脸控制飞碟躲避越来越多的反弹子弹,效果如图所示.首先利用面向对象的知识,实现了一个鼠 ...

  10. python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

最新文章

  1. 中秋祝福网页制作_10大中秋H5模板分享,助力吸粉10000+
  2. 计划继续深化学习物联网系统的相关知识 目前的WiFi模块基于ESP8266
  3. java项目功能详情介绍,JAVAEE—spring的详细介绍
  4. 命名空间system中不存在data_patternplot包:用ggplot解决你对线性填充,不!所有填充的全部幻想。...
  5. Android 的网络编程
  6. Dataset增加行数据及常用方法
  7. Boost-IO学习 异步数据处理Simple(转)
  8. PHP数组键不存在给默认值
  9. 网页怎么调用云服务器资源,如何将网页资源放到云服务器
  10. python改变图片像素值大小_Python之修改图片像素值的方法
  11. 信号量机制实现进程的互斥、同步、前驱
  12. Python根据拼音对中文排序
  13. 工作一年心路历程及个人感悟
  14. 中国科学报:吴文俊的数字之舞
  15. Electron桌面应用打包流程详情
  16. QP+uc/GUI嵌入式系统图形界面
  17. awatch gps 离线使用喜马拉雅
  18. 2020年9月计算机考试成绩什么时候出,2020年9月计算机二级考试什么时候出成绩...
  19. 无人值守安装RHEL6
  20. 22.0:Codejock Suite Pro for ActiveX COM:Crack

热门文章

  1. PAT乙级:1032 挖掘机技术哪家强
  2. 专题学习1 Cproblem—马走日
  3. 已解决AttributeError: ‘str‘ object has no attribute ‘apply‘
  4. C++萌新在线发文 希望大佬帮助!
  5. TechED 展台视频巡礼之联想篇
  6. 再也不怕女朋友问我二分查找了!【手绘漫画】图解二分查找(修订版)(LeetCode 704题)
  7. 数电实验1:计数器实验
  8. python接口自动化(三十) 上传文件时自动判断文件类型(filetype)
  9. JavaScript笔记本
  10. Windows 8操作系统四大版本功能特性对比