首先下载第三方库python-docx: pip install python-docx(在py文件里面导入的时候是import docx)

简单的说,docx里面的每一个段落都是一个paragraph对象,段落中文本如果有不同的样式(加粗,斜体)就会有不同的run对象,而且paragraph和run对象都有一个text属性,表示的是他包含的文本

import docxdef     getText(filename):doc = docx.Document(filename)fullText = []for i in doc.paragraphs:#迭代docx文档里面的每一个段落fullText.append(i.text)#保存每一个段落的文本return '\n'.join(fullText)
def     main():print getText('reviews.docx')#reviews.docx是我自己创建的一个文档,注意要和你的py文件一个目录下if     __name__=="__main__":main()

reviews.docx文件下载:https://pan.baidu.com/s/1pMEXSLl

python获取docx文档的内容(文本)相关推荐

  1. Python获取docx文档里的批注

    注意:该作者博客已迁移至https://buxianshan.xyz 使用Python-docx库可以很方便的处理docx文件(官方文档) 但是有些隐含的信息Python-docx库好像无法读取,比如 ...

  2. Python读取docx文档的内容

    Python读取docx文档的内容 下载好解析docx文档的包,Python-docx是专门针对于word文档的一个模块. doc.paragraphs 段落集合 doc.tables 表格集合 do ...

  3. Python3-word文档操作(二):利用python获取word文档的内容

    上一篇,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文.本篇继续python操作word之旅:利用python来获取word文档的内容. python脚本: # -*- ...

  4. Python使用标准库zipfile+re提取docx文档中超链接文本和链接地址

    推荐教材: <Python程序设计实用教程>,ISBN:978-7-5635-6065-3,董付国,北京邮电大学出版社 教材封面: 全国各地新华书店有售 京东购买链接: 配套资源:教学大纲 ...

  5. Python3-word文档操作(三):利用python修改word文档的内容

    前两篇博文中,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文,以及利用python来获取word文档的内容.本篇学习利用python修改word文档的内容. 修改word ...

  6. Python操作docx文档设置居中并创建表格

    功能描述:本文代码使用python-docx操作docx文档,添加一段文字并设置居中对齐,添加一个表格并为所有单元格设置文字. from docx import Document from docx. ...

  7. Word处理控件Aspose.Words功能演示:使用 Python 将 Word 文档的内容复制到另一个文档

    在各种情况下,您可能需要将 Word 文档的内容复制到另一个文档中.此外,您可能需要创建原始 Word 文档的克隆.为了自动化这些操作,本文介绍了如何在 Python 中将内容从一个 Word 文档复 ...

  8. Word控件Spire.Doc 【文本】教程(12) ;新方法在 C# 中获取 Word 文档中内容控件的别名、标签和 ID

    内容控件为您提供了一种设计文档的方法.当您向文档添加内容控件时,该控件由边框.标题和临时文本标识,这些文本可以向用户提供说明,并且可以防止用户编辑或删除文档的受保护部分. 将文档或模板的部分内容绑定到 ...

  9. Ubuntu下使用python读取doc和docx文档的内容

    读取docx文档 使用的包是python-docx 1. 安装python-docx包 sudo pip install python-docx 2. 使用python-docx包读取数据 #enco ...

最新文章

  1. C/C++语言中计算int,float,double,char四种数据类型所能表示的数据范围
  2. JAVA面向对象的特征
  3. Feign-1 Feign的简介及基础使用
  4. oracle 游标 904,如何解决Oracle数据库游标连接超出问题
  5. 【csust】最小素因子问题(树状数组)
  6. python bytes 改值_python3 bytes 和 string转换
  7. 百度联盟广告代码php,百度联盟原生广告的投放步骤
  8. opencv不能读取MP4格式文件
  9. ConnectivityManager
  10. 深度解析javascipt2
  11. hadoop组件及各自的功能
  12. 如何开通支付宝小程序助手?
  13. NAO机器人姿势切换
  14. IEEE802模型与协议标准
  15. 个编得好的拼音输入法C51的
  16. c语言中常见的数学函数
  17. android 图片的处理方法,Android图片处理,ImageView的属性和方法大全
  18. “0基础考生考前三小时突破《申论》80分气哭学霸”——单一题(问题+影响)
  19. 企业SaaS商怎么转型做企业服务商
  20. Jlink在ADS下的配置说明及常见问题解决办法 (转载)

热门文章

  1. AI开发者大会:2020年7月3日09:50--10:10唐杰《人工智能的下一个十年》
  2. BigData/Cloud Computing:购买并登录Windows弹性云服务器之详细攻略(图文教程)—更优惠、更贴心!
  3. IT:银行类金融科技岗笔试习题集合—各大行(工商+建设+农业+浦发+招商+平安+人民+邮政银行)计算机信息科技岗笔试集合(包括计算机基础知识+网络+操作系统+数据库系统原理)
  4. Py之cupy:cupy的简介、安装、使用方法之详细攻略
  5. Centos7使用yum安装MySQL5.6的正确姿势
  6. Python基础(14)_python模块之configparser模块、suprocess
  7. Gulp 之图片压缩合并
  8. Nmap扫描参数解析(转)
  9. Win 8 app 获取窗口的宽度和高度, 本地化, 及文本读取
  10. svn服务器搭建经验总结