python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打印粗体字
我有一个word docx文件,我想打印粗体在xml格式的文档中查看我要打印的单词似乎具有以下属性。在
Print this Sentence
特别是指定文本为粗体的w:rsidRPr="00510F21"属性。下面是更多的XML文档,让我们更好地了解它的结构。在
^{pr2}$
在做了一些研究并尝试使用pythondocx库来实现这一点之后,我决定尝试使用lxml。我得到一个关于名称空间的错误,并试图添加该名称空间,但它返回一个空集。下面是文档中的一些命名空间内容。在
xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas"
xmlns:mo="http://schemas.microsoft.com/office/mac/office/2008/main"
xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
xmlns:mv="urn:schemas-microsoft-com:mac:vml"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"
xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math"
xmlns:v="urn:schemas-microsoft-com:vml"
xmlns:wp14="http://schemas.microsoft.com/office/word/2010/wordprocessingDrawing" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing"
xmlns:w10="urn:schemas-microsoft-com:office:word"
xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main"
xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml"
xmlns:w15="http://schemas.microsoft.com/office/word/2012/wordml"
xmlns:wpg="http://schemas.microsoft.com/office/word/2010/wordprocessingGroup" xmlns:wpi="http://schemas.microsoft.com/office/word/2010/wordprocessingInk"
xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml"
xmlns:wps="http://schemas.microsoft.com/office/word/2010/wordprocessingShape"
mc:Ignorable="w14 w15 wp14">
下面是我使用的代码。如果属性是w:rsidRPr="00510F21",我想再次打印。在from lxml import etree
root = etree.parse("document.xml")
namespaces = {'w':'http://schemas.openxmlformats.org/wordprocessingml/2006/main'}
wr_roots = root.findall('w:r', namespaces)
print wr_roots # prints empty set
for atype in wr_roots:
if w:rsidRPr == '00510F21':
print(atype.get('w:t'))
python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打印粗体字相关推荐
- python读取word中的文字格式_利用Python-docx 读写 Word 文档中的正文、表格、段落、字体等...
前言: 前两篇博客介绍了 Python 的 docx 模块对 Word 文档的写操作,这篇博客将介绍如何用 docx 模块读取已有 Word 文档中的信息. 本篇博客主要内容有: 1.获取文档的章节信 ...
- python处理表格数据-python读取word 中指定位置的表格及表格数据
1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specT ...
- python读取word中后缀名docx的文件的表格
1.安装所需要的解析包 pip install python-docx pip install docx 2.使用代码例子来进行演示用法 解析出word中的如下表格: def parse_docx(f ...
- 如何用Python读取Excel中图片?又如何用Python往Excel中写入图片?
大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进行分析. 那么你知道如何使用Python读 ...
- python在word中的应用_不能在worddoc中使用docx python应用表样式
我不能使用python3.4将自定义表样式应用于worddoc.我遵循了@scanny的一个很好的方法:我创建了一个空白WORD doc,创建了一个自定义表样式,并将其保存为"OR" ...
- python读取word内容复制粘贴_如何复制word文档的内容?
为了复制带有样式的文本,您需要编写自己的函数,因为没有python-docx函数来完成这样的工作. 这是我写的函数:def get_para_data(output_doc_name, paragra ...
- python在工作中怎么用_如何用python在工作中“偷懒”
原标题:如何用python在工作中"偷懒" "偷懒还能干完活,才是本事 " 有些朋友在工作中会有这样的困惑:明明我从早忙到晚,为什么得到的评价还不高? 要知道, ...
- python从word中提取信息导入excel_使用python模块win32com提取word表格到excel
由于工作的要求,需要将word文档里的表格提取出来放到excel里面.表格结构比较复杂,且一篇word里面有多个表格.对于一个word文档来说提取很简单,只要选中表格,然后复制黏贴到excel里面就可 ...
- python移动文件中某个内容_如何在Python中移动文件
如何在Python中移动文件 我查看了Python $ mv ...接口,但无法找到移动文件的方法. 我如何在Python中执行相当于$ mv ...的操作? >>> source_ ...
最新文章
- C#调用控制面板选项
- String类为什么是final的
- Boost::context模块fiber的回溯测试程序
- intellij2018使用2019的主题
- CF954I Yet Another String Matching Problem 并查集、FFT
- mysql count or null_为什么在对带有条件的行进行计数时,为什么在MySQL中需要“ OR NULL”...
- 《那些年啊,那些事——一个程序员的奋斗史》——90
- 7-36 BCD解密 (10 分)
- (转)FTP操作类,从FTP下载文件
- RBG-D深度相机的相关资料
- IE XML漏洞官方补丁下载
- 超越竞争对手的秘密武器-技术重用
- 芝麻信用获世界级安全认证
- 电气-NPN、PNP传感器应用
- 电脑dnf,DNF卡顿如何解决_DNF卡顿如何解决 教你调整电脑参数畅玩游戏_52PKDNF
- css3 描两个边,CSS3 / 指定四条边中图像的显示方法 - 汇智网
- mysql 异地备份脚本_MySQL异地备份脚本
- dir file list.file list.dirs
- MAP(maximum a posteriori)
- 统计方形(NOIP1997)