本文所指的 word文档,都是docx结尾的,如果是doc结尾的,请参考上篇:点我

我们绝大多数的需求都是 利用python-docx 来读取word文档中的内容,进而再对内容进行其他处理,如下代码,就是读取所有的段落:

from docx import Document
docStr = Document("您的docx文件的路径")
for paragraph in docStr.paragraphs:parStr = paragraph.textprint(parStr)

但是这样会有一个问题,就是如果在某处插入一个 文本框,那么就读不出来,原因很简单,就是属性不同

1、读取word中插入的文本框里的内容:

from docx import Document
docStr = Document("您的docx文件的路径")
children = docStr.element.body.iter()
count = 0 #写一个count是为了,可以定位是哪个文本框,因为我用索引失败了
for child in children:# 通过类型判断目录if child.tag.endswith('txbx'):for ci in child.iter():if ci.tag.endswith('main}r'):count += 1# if count == 1:print(ci.text)
docStr.save("您的保存路径")

2、修改(就不贴图啦)

因为我这里用索引失败了,所以我用了一个变量 count,您可以用count==几,依次来定位是第几个文本框,这样您就可以修改里面的内容

from docx import Document
docStr = Document("您的docx文件的路径")
children = docStr.element.body.iter()
count = 0 #写一个count是为了,可以定位是哪个文本框,因为我用索引失败了
for child in children:# 通过类型判断目录if child.tag.endswith('txbx'):for ci in child.iter():if ci.tag.endswith('main}r'):count += 1# if count == 1:print(ci.text)ci.tesx = "可直接赋值"
docStr.save("您的保存路径")

希望对大家有帮助,如有错误,欢迎指正

致力于办公自动化的小小程序员一枚

致力于写出清楚的博客

都看到这了,关注+点赞+收藏=不迷路!!

Python读取\修改word文档中的文本框内容相关推荐

  1. Word控件Spire.Doc 【文本】教程(5) ;从 Word 文档中的文本框中提取文本

    文本框的目的是允许用户输入程序要使用的文本信息.也可以从文本框中提取现有的文本信息.以下指南重点介绍如何通过Spire.Doc for .NET从 C# 中 Word 文档的文本框中提取文本. Spi ...

  2. 将word文档中所有文本框中的内容转换成普通段落

    某些pdf转word工具生成的word文档,会将很多内容放在文本框中,以至于编辑word文档不太方便,例如想全选所有段落中的文字再调整某些格式,文本框中的文字有时候不能像普通段落中的文字一样产生同样的 ...

  3. java中添加文本框_Java 添加、删除Word文档中的文本框

    在Word文档中,文本框是指一种可移动.可调大小的文字或图形容器.使用文本框,能够使文档在内容和形式上更为饱满.本文将通过使用Java编程来演示如何添加.删除Word文档中的文本框. Jar文件获取及 ...

  4. Python批量修改Word文档中特定关键字的颜色

    关于Word文件的大致结构请参考使用Python写入docx文件并控制字体颜色 代码功能:读取docx文档中的文字,在尽量不影响原来字体样式的情况下,只把特定的文字都修改为红色. 表格中的文字请参考P ...

  5. Python批量提取docx格式Word文档中所有文本框内的文本

    功能描述: 批量提取指定Word文档(docx格式)中所有文本框中的文本. 测试文件: 参考代码: 执行结果:

  6. Python3-word文档操作(五):利用python修改word文档中的表格数据

    1. 简介: 本篇继续学习python操作word文档的相关知识.本篇主要学习: 1)如何获取一个已经存在文档中的表格的内容: 2)如何修改一个已经存在文档中的表格的内容: 2. 获取word文档中的 ...

  7. 【Python】导出docx格式Word文档中的文本、图片和附件等

    [Python]导出docx格式Word文档中的文本.图片和附件等 零.需求 为批量批改学生在机房提交的实验报告,我需要对所有的实验文档内容进行处理.需要批量提取Word文档中的图片和附件以便进一步检 ...

  8. Python动态修改Word文档内容,保留格式样式,并批量生成PDF

    Python动态修改Word文档内容,保留格式样式,并批量生成PDF 前言 一.需要安装的库 二.核心逻辑-替换 前言 假如你有一个Word模版文档,要在里面填写人员信息,但人员有成百上千个,手动填起 ...

  9. 办公室小姐姐的福利!用Python批量提取word文档中的表格和图片内容

    点上方"菜鸟学Python",选择"星标" 第491篇原创干货,第一时间送达 最近有许多小伙伴想要一些自动化办公的福利小程序,今天就满足大家的需求.日常的办公过 ...

最新文章

  1. NDK crash栈信息的错误定位
  2. 使用VMware桥接模式组建局域网测试MSMQ(二)
  3. 算法训练营02-预备知识和时间复杂度分析
  4. 计算机组成与系统结构名词解释,北京邮电大学 计算机系统结构(体系结构) 期末复习 术语解释...
  5. python 安装html,python安装glob
  6. python png 背景透明_python – Pygame:在png图像中将所有白色像素转换为完全透明...
  7. mac下IDEA远程调试hive-2.2.0
  8. [Web Chart系列之五] 图形布局-Circle Layout 之实现
  9. mybatis添加方法可以传map吗_Mybatis创建方式二
  10. 关于目前深度学习技术的相关思考----个人理解笔记
  11. 【android高级编程】简答题汇总
  12. luogu_4551【题解】最长异或路径 trie树
  13. 讨论一下hibernate如何动态注册一个动态生成的实体类
  14. (JButton) e.getSource();是什么意思
  15. JAVA计算机毕业设计晨光文具店进销存系统设计与开发计算机(附源码、数据库)
  16. MySQL数据库报错汇总(持续更新中)
  17. 理解矩阵 from孟岩--流星小屋
  18. Git常用命令有哪些?
  19. 什么是JMS(Java Message Service消息服务)
  20. 快充伤电池?我来帮何同学做个假设检验

热门文章

  1. 如何管理一个超过100人的研发团队?
  2. 全志A40I方案 全志A40I方案定制 全志A40I软硬件设计定制 全志A40i性能如何
  3. 坯子库无法一键安装插件没用_坯子库插件集下载-坯子插件库下载v2020.1 官方最新版-西西软件下载...
  4. [视频]FBI工作人员使用监视系统偷窥少女更衣被曝光
  5. 最强卸载神器,使你的Windows绝对干净
  6. Simulink根据魔术公式建立轮胎模型
  7. 我说百度很垃圾的10条理由
  8. #边学边记 必修4 高项:对事的管理 第5章 项目成本管理 之 项目成本预算
  9. 10 个开源免费的电子商务平台
  10. 【厚积薄发系列】C++项目总结14—Windows平台下异常捕获不到问题分析