我有一个word docx文件,我想打印粗体在xml格式的文档中查看我要打印的单词似乎具有以下属性。在

Print this Sentence

特别是指定文本为粗体的w:rsidRPr="00510F21"属性。下面是更多的XML文档,让我们更好地了解它的结构。在

^{pr2}$

在做了一些研究并尝试使用pythondocx库来实现这一点之后,我决定尝试使用lxml。我得到一个关于名称空间的错误,并试图添加该名称空间,但它返回一个空集。下面是文档中的一些命名空间内容。在

xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas"

xmlns:mo="http://schemas.microsoft.com/office/mac/office/2008/main"

xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"

xmlns:mv="urn:schemas-microsoft-com:mac:vml"

xmlns:o="urn:schemas-microsoft-com:office:office"

xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"

xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math"

xmlns:v="urn:schemas-microsoft-com:vml"

xmlns:wp14="http://schemas.microsoft.com/office/word/2010/wordprocessingDrawing" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing"

xmlns:w10="urn:schemas-microsoft-com:office:word"

xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main"

xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml"

xmlns:w15="http://schemas.microsoft.com/office/word/2012/wordml"

xmlns:wpg="http://schemas.microsoft.com/office/word/2010/wordprocessingGroup" xmlns:wpi="http://schemas.microsoft.com/office/word/2010/wordprocessingInk"

xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml"

xmlns:wps="http://schemas.microsoft.com/office/word/2010/wordprocessingShape"

mc:Ignorable="w14 w15 wp14">

下面是我使用的代码。如果属性是w:rsidRPr="00510F21",我想再次打印。在from lxml import etree

root = etree.parse("document.xml")

namespaces = {'w':'http://schemas.openxmlformats.org/wordprocessingml/2006/main'}

wr_roots = root.findall('w:r', namespaces)

print wr_roots # prints empty set

for atype in wr_roots:

if w:rsidRPr == '00510F21':

print(atype.get('w:t'))

python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打印粗体字相关推荐

  1. python读取word中的文字格式_利用Python-docx 读写 Word 文档中的正文、表格、段落、字体等...

    前言: 前两篇博客介绍了 Python 的 docx 模块对 Word 文档的写操作,这篇博客将介绍如何用 docx 模块读取已有 Word 文档中的信息. 本篇博客主要内容有: 1.获取文档的章节信 ...

  2. python处理表格数据-python读取word 中指定位置的表格及表格数据

    1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specT ...

  3. python读取word中后缀名docx的文件的表格

    1.安装所需要的解析包 pip install python-docx pip install docx 2.使用代码例子来进行演示用法 解析出word中的如下表格: def parse_docx(f ...

  4. 如何用Python读取Excel中图片?又如何用Python往Excel中写入图片?

    大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进行分析. 那么你知道如何使用Python读 ...

  5. python在word中的应用_不能在worddoc中使用docx python应用表样式

    我不能使用python3.4将自定义表样式应用于worddoc.我遵循了@scanny的一个很好的方法:我创建了一个空白WORD doc,创建了一个自定义表样式,并将其保存为"OR" ...

  6. python读取word内容复制粘贴_如何复制word文档的内容?

    为了复制带有样式的文本,您需要编写自己的函数,因为没有python-docx函数来完成这样的工作. 这是我写的函数:def get_para_data(output_doc_name, paragra ...

  7. python在工作中怎么用_如何用python在工作中“偷懒”

    原标题:如何用python在工作中"偷懒" "偷懒还能干完活,才是本事 " 有些朋友在工作中会有这样的困惑:明明我从早忙到晚,为什么得到的评价还不高? 要知道, ...

  8. python从word中提取信息导入excel_使用python模块win32com提取word表格到excel

    由于工作的要求,需要将word文档里的表格提取出来放到excel里面.表格结构比较复杂,且一篇word里面有多个表格.对于一个word文档来说提取很简单,只要选中表格,然后复制黏贴到excel里面就可 ...

  9. python移动文件中某个内容_如何在Python中移动文件

    如何在Python中移动文件 我查看了Python $ mv ...接口,但无法找到移动文件的方法. 我如何在Python中执行相当于$ mv ...的操作? >>> source_ ...

最新文章

  1. C#调用控制面板选项
  2. String类为什么是final的
  3. Boost::context模块fiber的回溯测试程序
  4. intellij2018使用2019的主题
  5. CF954I Yet Another String Matching Problem 并查集、FFT
  6. mysql count or null_为什么在对带有条件的行进行计数时,为什么在MySQL中需要“ OR NULL”...
  7. 《那些年啊,那些事——一个程序员的奋斗史》——90
  8. 7-36 BCD解密 (10 分)
  9. (转)FTP操作类,从FTP下载文件
  10. RBG-D深度相机的相关资料
  11. IE XML漏洞官方补丁下载
  12. 超越竞争对手的秘密武器-技术重用
  13. 芝麻信用获世界级安全认证
  14. 电气-NPN、PNP传感器应用
  15. 电脑dnf,DNF卡顿如何解决_DNF卡顿如何解决 教你调整电脑参数畅玩游戏_52PKDNF
  16. css3 描两个边,CSS3 / 指定四条边中图像的显示方法 - 汇智网
  17. mysql 异地备份脚本_MySQL异地备份脚本
  18. dir file list.file list.dirs
  19. MAP(maximum a posteriori)
  20. 统计方形(NOIP1997)

热门文章

  1. html5触屏滑动事件,HTML5的touch事件详解
  2. 知识图谱 - 使用图数据库(记一次eno4j搭建分享)
  3. 批量为shp文件添加字段
  4. CUDA编程-01: 搭建CUDA编程环境
  5. git保存用户名和密码,不用每次输入账号
  6. 99%品牌梦寐以求的爆款流量,小红书笔记搜索排名置顶黑科技!
  7. 优普丰敏捷学院Bill和Jacky的敏捷管理者领导力培训课程
  8. 北京理工大学计算机学院复试七选四,42所计算机名校复试内容汇总.pdf
  9. 常见问题: 时间戳如何转换日期时间格式?
  10. Mac开发-launchctl执行脚本