术语:

浮动图片,是指在Word文档中位置可以自由移动、可以环绕文字或放置于文字上方、下方的图片,不占文档流的位置,可以和文字或嵌入式图片重叠。

嵌入式图片或行内图片,和文档中的文字一样占文档流的位置,不能自由移动位置,也不能环绕文字,不能放置于文字的上方或下方。直接插入Word文档的图片默认为嵌入式图片,如果改为浮动图片,需要单独设置。

==============

首先,我们准备一个文件“包含图片的文档.docx”,里面放几个图片,设置其中几个图片浮动,分别位于文字下方和文字上方,再写几个字,如图:

然后使用扩展库python-docx提取其中的图片,目前这个库似乎只支持嵌入式图片的提取,不支持浮动图片,有知道的朋友请留言告知,测试成功后可以获赠董老师任意图书一本。

提取结果:

改用扩展库docx2python,官方对这个扩展库的简单描述如下:

首先使用pip命令安装这个扩展库,如图:

参考代码:

提取结果:

除了提取图片之外,obj还具有下面的属性可以提取docx文档中不同部分,请自行查阅资料了解其用法。

python docx 提取图片_Python提取docx文档中所有嵌入式图片和浮动图片相关推荐

  1. python统计word词频_python统计word文档中的词频

    如何将统计word文档中的词频呢?先用docx模块将word文档转变成txt格式,然后使用jieba模块进行分词,并统计词频.是不是很简单- #2020年3月10日 #Elizabeth from d ...

  2. python套用word模板_Python之word文档模板套用 - 真正的模板格式套用

    1 ''' 2 #word模板套用2:套用模板3 ''' 4 5 #导入所需库 6 from docx importDocument7 ''' 8 #另存word文档后格式丢失的问题要导入库设定wor ...

  3. 【Java】基于Pdfbox解析PDF文档中指定位置的文字和图片

    1.1 PDFBOX介绍 Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换. 我们可以使用PDFBox开发可以创建,转换和操作PDF文档的Java程序.PDFBox的主要功能 ...

  4. python逐行读取txt写入excel_用python从符合一定格式的txt文档中逐行读取数据并按一定规则写入excel(openpyxl支持Excel 2007 .xlsx格式)...

    前几天接到一个任务,从gerrit上通过ssh命令获取一些commit相关的数据到文本文档中,随后将这些数据存入Excel中.数据格式如下图所示 观察上图可知,存在文本文档中的数据符合一定的格式,通过 ...

  5. Java将图片放入word文档中

    1.引入依赖包(maven项目) <!-- https://mvnrepository.com/artifact/itext/itext --><!--将照片写入word文档中的依赖 ...

  6. 解决把QQ截图或者QQ聊天的图片复制到wps文档中无法完全显示的简单方法

    虽然wps里面是有截图工具的,但是依然有不少人喜欢用qq截图,而且有时候直接需要的是QQ聊天中的图片,所以有时候写文档时候会直接将QQ的图片复制过来.然而,有一个问题,我们将用qq截图截出来的图片复制 ...

  7. word涂改涂掉图片_修正Word文档中太多不一致的格式-word技巧-电脑技巧收藏家

    修正Word文档中太多不一致的格式 您是否收到过一篇包含成打的字体和字号的MicrosoftWord2003文档,然后不得不将其修正一致?或者需要将他人处理的小文档合并为一个长文档?或者只是偶然在一个 ...

  8. python docx 合并文档 图片_Python合并word文档制作电子书

    需求: 将某大V公众号文章全部下载,整理成合集,并整理成电子书进行阅读. 以冯大辉老师公众号[小道消息]为例 实现步骤 一.批量下载公众号文章 使用 WeChatDownloadv20200423 工 ...

  9. python操作word文档中的图片_Python操作word文档插入图片和表格的实例演示

    前言P6Q免费资源网 图片是Word的一种特殊内容,这篇文章主要介绍了关于Python操作word文档,向里面插入图片和表格的相关内容,下面话不多说了,来一起看看详细的代码P6Q免费资源网 实例代码: ...

最新文章

  1. html 二叉树模式,重建二叉树.html
  2. linux shell 脚本练习,shell脚本小练习
  3. PHP Smarty变量调节器
  4. 摇篮善良:仅添加包装用于战争
  5. 三分钟学会如何在函数计算中使用 puppeteer
  6. java程序单引号报错,javapoigetInpuStream报错br/是这样的, 爱问知识人
  7. Redis工作笔记-Sorted-Sets类型
  8. mysql连接编码设置_MySQL基础 - 编码设置
  9. CSS 的复合选择器
  10. 在Spring+Hibernate项目中使用原生SQL进行查询和执行SQL处理
  11. RH358配置电子邮件传输--配置仅发送电子邮件服务
  12. 【金猿产品展】沃丰科技GaussMind——用技术提升客户体验
  13. 软件设计师认证 -如何画数据流图
  14. iphone开发每日一练1【2011-09-30】
  15. CentOS8安装QT5.12的问题
  16. MQTT.fx 模拟 IoT 设备接入阿里云企业物联网平台
  17. 【OMNET++】OMNET如何开启Debug调试
  18. 微信小程序两张图片(本地/在线)合成为一张并下载
  19. 统计复用系统为什么避免不了排队
  20. html5,jQuery 实现贴吧,论坛分页样式,可无缝组合Ajax

热门文章

  1. React将字符串转化成组件,将Antd图标字符串转化为图标组件
  2. AMD GPU虚拟化
  3. 通过新浪天气api查询天气
  4. 微信小程序 非webview分享给好友及生成分享海报
  5. webpack入门学习笔记10 —— 在项目中使用图片资源
  6. one 主格 复数 宾格_主格和宾格的复数形式到底怎么写请说出答案
  7. jquery,ajax动态从数据库加载数据并自动选中复选框
  8. 帝都某外企裁员,补偿673252.62元 !准备回家躺平了 !
  9. Linux基础篇之权限的设定
  10. linux网络入侵命令,如何使用netstat命令验证DDOS入侵