相信大家对python-docx这个常用的操作docx文档的库都不陌生,它支持以内联形状(Inline Shape)的形式插入图片,即图片和文本之间没有重叠,遵循流动版式(flow layout)。但是,截至最新的0.8.10版本,python-docx尚不支持插入浮动图片(floating picture)。这显然不能满足丰富多彩的文档样式的需要,因此本文探究基于python-docx插入浮动图片——剖析xml、追踪源码,最后得到完整代码。

问题提出

作者在尝试实现PDF文档转docx(pdf2docx:https://github.com/dothinking/pdf2docx,开发中)的过程中遇到一个需求:根据背景图片在PDF页面的具体位置(例如左上角坐标和图片区域的长宽),将其重现到docx页面的相应位置。考虑到背景图片与文本的重叠,这就需要实现精确定位的浮动图片,参考下图示例。

Word中的设置

我们先尝试在Office Word中,手动解决上述问题。具备基础的Word使用经验即可知,通过设置图片版式来控制图片的浮动和具体位置。

上图版式设置中的文本环绕样式,大体可以分为三类:

分类

文本重叠

自由定位

样式名称

嵌入型

In line with text

环绕型

Square, Tight, Through, Top and bottom

完全浮动

behind text, In front of text

例如最常见的嵌入型图片,它占据了整行区域,我们既不能将其与文字重叠,也不能自由放置它的位置,而是由页面排版自动确定。对于环绕型图片,文本可以进入图片所在行,但是无法与之重叠;并且,我们可以用鼠标自由拖动其位置。完全浮动型图片则可以浮于文本上方或者衬于文本下方,同时支持随意放置其位置。

如果需要精确定位,则可在图片版式的位置(Position)选项卡进行设置。它提供了多种定位方式,例如绝对定位——根据图片左上角点距离水平和竖直参考的坐标值来定位。至于参考对象,可以是页面(Page)本身,这样(0, 0)就是页面左上角;也可以是边距(Margin),此时(0, 0)即为正文区域的左上角。

综上,我们需要实现精确定位的衬于文本下方的图片版式。

docx背后的xml

我们还知道,docx文档的背后是xml格式的数据,python-docx正是通过处理xml的方式来读写word文档。所以,接下来先手工创建word文档,然后查看图片部分的xml内容。

作为对比,首先分别创建一个普通嵌入型图片文件和一个衬于文本下方的浮动型图片文件。然后执行查看步骤:右键docx文件 | 7-zip打开压缩包 | word | document.xml,复制文件内容并格式化xml,得到如下的关于图片部分的片段。为了便于对比分析,删除了一些节点属性。

内联图片片段:

浮动图片片段:

285750

457200

对比发现以下相同/相似点:

两类图片都放在节点下:内联图片,浮动图片

具备相同的内容节点:、、等

除此之外,浮动图片还有一些独有特征,并且我们可以从命名上猜测和解读:

节点的behindDoc属性表明图片版式为衬于文本下方

和节点表明水平和竖直绝对定位方式,其中:

relativeFrom属性指定用于定位的参考对象

子节点指定具体坐标值

从内联图片开始

从xml的结构对比来看,我们完全可以根据python-docx对内联图片的实现来插入浮动图片。于是,从插入内联图片的代码入手:

from docx import Document

from docx.shared import Pt

document = Document()

document.add_picture('image.jpg', width=Pt(200))

document.save('output.docx')

从python-docx安装文件夹site-packages/docx进行内容搜索add_picture,得到docx.text.run.add_picture原始定义处:

def add_picture(self, image_path_or_stream, width=None, height=None):

inline = self.part.new_pic_inline(image_path_or_stream, width, height)

self._r.add_drawing(inline)

return InlineShape(inline)

继续搜索new_pic_inline得到docx.parts.story.BaseStoryPart.new_pic_inline。从注释可知这是利用CT_Inline类创建元素,因此后续创建浮动图片的可以在此基础上修改。

def new_pic_inline(self, image_descriptor, width, height):

"""Return a newly-created `w:inline` element.

The element contains the image specified by *image_descriptor* and is scaled

based on the values of *width* and *height*.

"""

rId, image = self.get_or_add_image(image_descriptor)

cx, cy = image.scaled_dimensions(width, height)

shape_id, filename = self.next_id, image.filename

return CT_Inline.new_pic_inline(shape_id, rId, filename, cx, cy)

于是进入CT_Inline类(限于篇幅,删除了前两个类方法new和new_pic_inline的具体代码)——终于见到了一开始探索的xml代码:

class CT_Inline(BaseOxmlElement):

"""

```` element, container for an inline shape.

"""

@classmethod

def new(cls, cx, cy, shape_id, pic):

pass

@classmethod

def new_pic_inline(cls, shape_id, rId, filename, cx, cy):

pass

@classmethod

def _inline_xml(cls):

return (

'\n'

'  \n'

'  \n'

'  \n'

'    \n'

'  \n'

'  \n'

'    \n'

'  \n'

'' % nsdecls('wp', 'a', 'pic', 'r')

)

简单扫一下CT_Inline类的三个方法,即可将它们联系上:

_inline_xml()方法给出内联图片的xml结构。

new()方法调用_inline_xml(),并为其中的子节点例如和赋值。

new_pic_inline()调用new(),同时拼接CT_Picture类的结果(节点,即图片的具体内容)到节点中去。

综上,实现了内联图片的完整xml结构。

插入浮动图片

从xml结构的对比及上述python-docx对内联图片的实现,得到创建浮动图片的思路:

初始化结构,例如behindDoc="1"指定图片版式为衬于文本下方

使用类似的代码填充元素,尤其是、和

填充和精确定位图片

具体实践中发现还有关键的一步——注册xml标签名称到对应的类,例如和CT_Inline:

# docx.oxml.__init__.py

register_element_cls('wp:inline', CT_Inline)

综上,利用python-docx插入浮动图片(衬于文本下方、页面定位)的完整代码如下:

# -*- coding: utf-8 -*-

# filename: add_float_picture.py

'''

Implement floating image based on python-docx.

- Text wrapping style: BEHIND TEXT

- Picture position: top-left corner of PAGE ``.

Create a docx sample (Layout | Positions | More Layout Options) and explore the

source xml (Open as a zip | word | document.xml) to implement other text wrapping

styles and position modes per `CT_Anchor._anchor_xml()`.

'''

from docx.oxml import parse_xml, register_element_cls

from docx.oxml.ns import nsdecls

from docx.oxml.shape import CT_Picture

from docx.oxml.xmlchemy import BaseOxmlElement, OneAndOnlyOne

# refer to docx.oxml.shape.CT_Inline

class CT_Anchor(BaseOxmlElement):

"""

```` element, container for a floating image.

"""

extent = OneAndOnlyOne('wp:extent')

docPr = OneAndOnlyOne('wp:docPr')

graphic = OneAndOnlyOne('a:graphic')

@classmethod

def new(cls, cx, cy, shape_id, pic, pos_x, pos_y):

"""

Return a new ```` element populated with the values passed

as parameters.

"""

anchor = parse_xml(cls._anchor_xml(pos_x, pos_y))

anchor.extent.cx = cx

anchor.extent.cy = cy

anchor.docPr.id = shape_id

anchor.docPr.name = 'Picture %d' % shape_id

anchor.graphic.graphicData.uri = (

'http://schemas.openxmlformats.org/drawingml/2006/picture'

)

anchor.graphic.graphicData._insert_pic(pic)

return anchor

@classmethod

def new_pic_anchor(cls, shape_id, rId, filename, cx, cy, pos_x, pos_y):

"""

Return a new `wp:anchor` element containing the `pic:pic` element

specified by the argument values.

"""

pic_id = 0  # Word doesn't seem to use this, but does not omit it

pic = CT_Picture.new(pic_id, filename, rId, cx, cy)

anchor = cls.new(cx, cy, shape_id, pic, pos_x, pos_y)

anchor.graphic.graphicData._insert_pic(pic)

return anchor

@classmethod

def _anchor_xml(cls, pos_x, pos_y):

return (

'

'           behindDoc="1" locked="0" layoutInCell="1" allowOverlap="1" \n'

'           %s>\n'

'  \n'

'  \n'

'    %d\n'

'  \n'

'  \n'

'    %d\n'

'  \n'

'  \n'

'  \n'

'  \n'

'  \n'

'    \n'

'  \n'

'  \n'

'    \n'

'  \n'

'

' % ( nsdecls('wp', 'a', 'pic', 'r'), int(pos_x), int(pos_y) )

)

# refer to docx.parts.story.BaseStoryPart.new_pic_inline

def new_pic_anchor(part, image_descriptor, width, height, pos_x, pos_y):

"""Return a newly-created `w:anchor` element.

The element contains the image specified by *image_descriptor* and is scaled

based on the values of *width* and *height*.

"""

rId, image = part.get_or_add_image(image_descriptor)

cx, cy = image.scaled_dimensions(width, height)

shape_id, filename = part.next_id, image.filename

return CT_Anchor.new_pic_anchor(shape_id, rId, filename, cx, cy, pos_x, pos_y)

# refer to docx.text.run.add_picture

def add_float_picture(p, image_path_or_stream, width=None, height=None, pos_x=0, pos_y=0):

"""Add float picture at fixed position `pos_x` and `pos_y` to the top-left point of page.

"""

run = p.add_run()

anchor = new_pic_anchor(run.part, image_path_or_stream, width, height, pos_x, pos_y)

run._r.add_drawing(anchor)

# refer to docx.oxml.__init__.py

register_element_cls('wp:anchor', CT_Anchor)

示例

最后,来一个例子看看结果吧:

from docx import Document

from docx.shared import Inches, Pt

from add_float_picture import add_float_picture

if __name__ == '__main__':

document = Document()

# add a floating picture

p = document.add_paragraph()

add_float_picture(p, 'test.png', width=Inches(5.0), pos_x=Pt(20), pos_y=Pt(30))

# add text

p.add_run('Hello World '*50)

document.save('output.docx')

作者:crazyhat,Python及科学计算爱好者

到此这篇关于详解用 python-docx 创建浮动图片的文章就介绍到这了,更多相关python-docx 浮动图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

python docx 图片_详解用 python-docx 创建浮动图片相关推荐

  1. python selenium爬虫_详解基于python +Selenium的爬虫

    详解基于python +Selenium的爬虫 一.背景 1. Selenium Selenium 是一个用于web应用程序自动化测试的工具,直接运行在浏览器当中,支持chrome.firefox等主 ...

  2. 使用python下载文件_详解使用Python下载文件的几种方法

    在使用Python进行数据抓取的时候,有时候需要保持文件或图片等,在Python中可以有多种方式实现.今天就一起来学习下. urllib.request 主要使用的是urlretrieve方法,该方法 ...

  3. python zxing 识别条码_详解利用python识别图片中的条码(pyzbar)及条码图片矫正和增强...

    前言 这周和大家分享如何用python识别图像里的条码.用到的库可以是zbar.希望西瓜6辛苦码的代码不要被盗了.(zxing的话,我一直没有装好,等装好之后再写一篇) 具体步骤 前期准备 用open ...

  4. 用python3做学生管理系统_详解用python实现基本的学生管理系统(文件存储版)(python3)...

    详解用python实现基本的学生管理系统(文件存储版)(python3) 来源:中文源码网    浏览: 次    日期:2019年11月5日 详解用python实现基本的学生管理系统(文件存储版)( ...

  5. python编写数据库连接工具_详解使用Python写一个向数据库填充数据的小工具(推荐)...

    一. 背景 公司又要做一个新项目,是一个合作型项目,我们公司出web展示服务,合作伙伴线下提供展示数据. 而且本次项目是数据统计展示为主要功能,并没有研发对应的数据接入接口,所有展示数据源均来自数据库 ...

  6. python解释器在哪里_详解查看Python解释器路径的两种方式

    进入python的安装目录, 查看python解释器 进入bin目录 # ls python(看一下是否有python解释器版本) # pwd (查看当前目录) 复制当前目录即可 1. 通过脚本查看 ...

  7. 利用python处理dna序列_详解基于python的全局与局部序列比对的实现(DNA)

    程序能实现什么 a.完成gap值的自定义输入以及两条需比对序列的输入 b.完成得分矩阵的计算及输出 c.输出序列比对结果 d.使用matplotlib对得分矩阵路径的绘制 一.实现步骤 1.用户输入步 ...

  8. 用python写管理系统局域网_详解用python -m http.server搭一个简易的本地局域网

    工作时同事间几mb小文件的传输,一般使用QQ或者微信就足够了,但当传输文件几百MB或者几十G时,这种方法的效率就显得不足了.本篇就是简单说明一个python小功能,让大家能利用python方便的搭建一 ...

  9. android uri图片压缩,详解android 通过uri获取bitmap图片并压缩

    详解android 通过uri获取bitmap图片并压缩 很多人在调用图库选择图片时会在onactivityresult中用media.getbitmap来获取返回的图片,如下: uri mimage ...

  10. python壁纸高清图片_详解Python静态网页爬取获取高清壁纸

    前言 在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤 一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...

最新文章

  1. CPU所含有的寄存器
  2. iOS之仿QQ点赞按钮粒子效果的实现
  3. leetcode 303. 区域和检索 - 数组不可变
  4. Android开发中依赖注入的应用
  5. 趣挨踢 | 阿里员工吐槽:我在阿里工作五年,面试一个小公司竟然挂了
  6. UI展示样机素材|让作品看起来毫无痕迹,还原场景!
  7. ARX二次开发 遍历删除所有的约束
  8. 什么是c语言函数,C语言中的函数是什么意思
  9. 微型计算机配置单8000,计算机公共基础知识8000题库答案解析
  10. java table 增加行_使用POI给word中的表格增加行
  11. BZOJ.4598.[SDOI2016]模式字符串(点分治 Hash)
  12. rust多行字符串字面量
  13. Linux各种安装软件包的方式
  14. 安卓- apk安装出现闪退java.lang.RuntimeException: Unable to instantiate application
  15. Epalloy8240亨斯迈Huntsman低粘度、低水解氯、反应活性高官能度为2.35的酚醛环氧树脂
  16. 科技新品 | 大疆航拍小飞机重量不到249克;绘王数位屏薄至12毫米;追觅科技机器人吸尘器低至65分贝静音水平...
  17. 谷歌浏览器保存密码,input输入框密码自动填充
  18. 微信小程热映电影导演等数据获取
  19. SceneKit:简单的3D游戏场景搭建
  20. 网页音效简易解决方案audiosprite

热门文章

  1. 所以者何,须菩提。过去心不可得,现在心不可得,未来心不可得。
  2. Win10系统去掉桌面图标小箭头导致打开管理和任务栏处图标报错,且右键开始菜单无反应
  3. 古城钟楼微博地支报时程序铛,100行代码实现,价值一天20万粉丝
  4. Not_flushed_delayed_rows
  5. 码无止境(1)——一个科研项目立项时的小程序(字典嵌套列表)
  6. 【地平线旭日X3派试用体验】基于MIPI Camera的目标检测 web 端展示,全流程(第三节)
  7. 中山医06年考研初试复试全攻略!( 完整版)
  8. 七个技巧!Godaddy域名安全指数提高N倍
  9. 计算机windows10怎么找word,Win10 word路径在哪?Win10如何修改word路径
  10. Java实现Excel中的Rate函数