pip install python-pptx
PPT结构
主要四部分:Slide、Shape、Paragraph和Run
获取slide
.slide 得到一个列表,包含每一个slide

from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:print(slide)

获取形状Shape
slide.shape 获取形状

from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:for shape in slide.shapes:print(shape)

判断一个shape中是否存在文字
shape.has_text_frame 是否有文字
shape.text_frame 获取文字框

from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:for shape in slide.shapes:if shape.has_text_frame:text_frame = shape.text_frameprint(text_frame.text)

从shape中找paragraph
text_frame.paragraphs 获取shape中的段落

text_frame = shape.text_frame
for paragraph in text_frame.paragraphs:print(paragraph.text)

综合应用

import os
os.chdir("D:\\shiyan")
from pptx import Presentation
from docx import Documentdoc = Document()
prs = Presentation("Bilibili 2Q19 Investor Presentation-Final.pptx")
ls = []
for slide in prs.slides:for shape in slide.shapes:if shape.has_text_frame:text_frame = shape.text_framefor paragraph in text_frame.paragraphs:if paragraph.text != '':doc.add_paragraph(paragraph.text)doc.save("Bilibili 2Q19 Investor Presentation-Final.docx")

24Python读取PPT文档内容相关推荐

  1. Python读取.txt文档内容/读取text文件内容

    Python读取.txt文档内容/读取text文件内容; 读取txt后缀文件的内容的两种方式,简约易懂,复制粘贴即可食用,节约你宝贵的时间 文档全部数据一次性读取 # -*- coding: UTF- ...

  2. java如何读取word文档内容并修改指定内容文本颜色

    最近项目涉及到一个功能需求:将指定文本写入word文档,并根据指定词语将word中内容改变颜色并下载. 用到的jar包:spire.doc.jar        org.apache.poi 官网链接 ...

  3. js读取word文档内容_Python学习第九十二天:Python操作word

    1.Python写word文档 要操作word文档首先需要安装python-docx库: pip install python-docx 然后导入docx模块,或者从docx模块中导入Document ...

  4. python读取doc文件_Linux 下Python 读取Word文档内容的方法

    如果你是在Windows下, 直接使用win32com就可以进行读取word.doc文档和写入文档了. 但是在Linux下还真是麻烦, 一种方法是用OpenOffice的一个库来进行操作,那么意味这你 ...

  5. java读取word文档内容_合并多个Word文档内容,还在复制粘贴就out了,同事五秒轻松搞定...

    在我们工作中,我们经常会编写多个Word文档内容,那么怎么将多个单个的Word文档合并到一个文档中,这就会显得有些难度. 如上图所示,我们需要将三个不同的案例,快速的汇总到我们的案例汇总表当中.许多朋 ...

  6. java读取ofd文档内容_ofd电子文档内容分析工具(分析文档、签章和证书)

    前言 ofd是国家文档标准,其对标的文档格式是pdf.ofd文档是容器格式文件,ofd其实就是压缩包.将ofd文件后缀改为.zip,解压后可看到文件包含的内容. ofd文件分析工具下载: ofd文件解 ...

  7. java 读取ppt文件_Java 读取PPT文档属性

    import com.spire.presentation.*; public class GetProperty { public static void main(String[]args) th ...

  8. Python读取Word文档内容

    # encoding=utf-8 import docx #获取文档对象 file=docx.Document("附件3:分解任务落实至XX室情况表(2022年2月).docx") ...

  9. PHP读取docx文档内容

    引言 客户需求, 需要从docx文档读取内容并且做简单格式化, 难点就在于如何读取docx格式并且转换为php可以识别的字符串形式, 惯例先贴代码. 代码 /*** Class Docx2Text** ...

最新文章

  1. Java项目:个人博客系统(前后端分离+java+vue+Springboot+ssm+mysql+maven+redis)
  2. CNN网络结构的发展:从LeNet到EfficientNet
  3. Java中的几种引用类型_Java中的几种引用类型(转载)
  4. 离群点检测算法——LOF(Local Outlier Factor)
  5. Java中对properties分组_Java中Properties类的使用
  6. 手写简版spring --6--应用上下文(BeanPostProcessor 和 BeanFactoryPostProcessor)
  7. 微软推出Visual Studio Kubernetes工具包预览版
  8. leetcode--数组(Easy)
  9. 求一个任意实数c的算术平方根g的算法设计思想_算法复习第四篇——贪心法
  10. sqlite 模糊匹配日期_SQLite模糊查找(like) | 学步园
  11. iphone7防水_iPhone11系列防水测试,其结果令人意外
  12. 苹果的困境源于优质移动应用的垮台吗?
  13. txt文档下载另存为解决
  14. SQL 语言特点、功能和数据类型
  15. nod32Android版用户名及密码,最新nod32官方升级id和账号用户名密码
  16. centos7设置静态IP地址方法
  17. python list切片_python list切片
  18. 爱心姐姐李娜:一片爱心为民续写大爱篇章
  19. 腾讯人力资源管理体系
  20. 如何才能招聘到合适的以太坊区块链开发者

热门文章

  1. 神级工具 PrimoCache v4.1(无限试用),电脑磁盘读写速度最高可提升70倍
  2. 课下作业(选做)第八周
  3. poi操作excel之填充数据、删除行
  4. vue 控制某个元素的显示或者隐藏之v-if属性
  5. 空间机械臂Matlab/Simulink仿真程序自由漂浮空间机械臂(双臂)轨迹跟踪控制matlab仿真程序
  6. udc-core: couldn‘t find an available UDC - added [g_ether] to list of pending drivers
  7. 安全方向比路由交换难吗_致网络工程师,新网工时代轻松拿下思科全新CCIE EI等各方向认证...
  8. Matlab动态作图——animatedline函数
  9. win7如何解除锁定计算机,Win7电脑键盘数字键被锁了怎么解锁(图文)
  10. BUUCTF-刷题记录-8