24Python读取PPT文档内容
pip install python-pptx
PPT结构
主要四部分:Slide、Shape、Paragraph和Run
获取slide
.slide 得到一个列表,包含每一个slide
from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:print(slide)
获取形状Shape
slide.shape 获取形状
from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:for shape in slide.shapes:print(shape)
判断一个shape中是否存在文字
shape.has_text_frame 是否有文字
shape.text_frame 获取文字框
from pptx import Presentationprs = Presentation("demo.pptx")
for slide in prs.slides:for shape in slide.shapes:if shape.has_text_frame:text_frame = shape.text_frameprint(text_frame.text)
从shape中找paragraph
text_frame.paragraphs 获取shape中的段落
text_frame = shape.text_frame
for paragraph in text_frame.paragraphs:print(paragraph.text)
综合应用
import os
os.chdir("D:\\shiyan")
from pptx import Presentation
from docx import Documentdoc = Document()
prs = Presentation("Bilibili 2Q19 Investor Presentation-Final.pptx")
ls = []
for slide in prs.slides:for shape in slide.shapes:if shape.has_text_frame:text_frame = shape.text_framefor paragraph in text_frame.paragraphs:if paragraph.text != '':doc.add_paragraph(paragraph.text)doc.save("Bilibili 2Q19 Investor Presentation-Final.docx")
24Python读取PPT文档内容相关推荐
- Python读取.txt文档内容/读取text文件内容
Python读取.txt文档内容/读取text文件内容; 读取txt后缀文件的内容的两种方式,简约易懂,复制粘贴即可食用,节约你宝贵的时间 文档全部数据一次性读取 # -*- coding: UTF- ...
- java如何读取word文档内容并修改指定内容文本颜色
最近项目涉及到一个功能需求:将指定文本写入word文档,并根据指定词语将word中内容改变颜色并下载. 用到的jar包:spire.doc.jar org.apache.poi 官网链接 ...
- js读取word文档内容_Python学习第九十二天:Python操作word
1.Python写word文档 要操作word文档首先需要安装python-docx库: pip install python-docx 然后导入docx模块,或者从docx模块中导入Document ...
- python读取doc文件_Linux 下Python 读取Word文档内容的方法
如果你是在Windows下, 直接使用win32com就可以进行读取word.doc文档和写入文档了. 但是在Linux下还真是麻烦, 一种方法是用OpenOffice的一个库来进行操作,那么意味这你 ...
- java读取word文档内容_合并多个Word文档内容,还在复制粘贴就out了,同事五秒轻松搞定...
在我们工作中,我们经常会编写多个Word文档内容,那么怎么将多个单个的Word文档合并到一个文档中,这就会显得有些难度. 如上图所示,我们需要将三个不同的案例,快速的汇总到我们的案例汇总表当中.许多朋 ...
- java读取ofd文档内容_ofd电子文档内容分析工具(分析文档、签章和证书)
前言 ofd是国家文档标准,其对标的文档格式是pdf.ofd文档是容器格式文件,ofd其实就是压缩包.将ofd文件后缀改为.zip,解压后可看到文件包含的内容. ofd文件分析工具下载: ofd文件解 ...
- java 读取ppt文件_Java 读取PPT文档属性
import com.spire.presentation.*; public class GetProperty { public static void main(String[]args) th ...
- Python读取Word文档内容
# encoding=utf-8 import docx #获取文档对象 file=docx.Document("附件3:分解任务落实至XX室情况表(2022年2月).docx") ...
- PHP读取docx文档内容
引言 客户需求, 需要从docx文档读取内容并且做简单格式化, 难点就在于如何读取docx格式并且转换为php可以识别的字符串形式, 惯例先贴代码. 代码 /*** Class Docx2Text** ...
最新文章
- Java项目:个人博客系统(前后端分离+java+vue+Springboot+ssm+mysql+maven+redis)
- CNN网络结构的发展:从LeNet到EfficientNet
- Java中的几种引用类型_Java中的几种引用类型(转载)
- 离群点检测算法——LOF(Local Outlier Factor)
- Java中对properties分组_Java中Properties类的使用
- 手写简版spring --6--应用上下文(BeanPostProcessor 和 BeanFactoryPostProcessor)
- 微软推出Visual Studio Kubernetes工具包预览版
- leetcode--数组(Easy)
- 求一个任意实数c的算术平方根g的算法设计思想_算法复习第四篇——贪心法
- sqlite 模糊匹配日期_SQLite模糊查找(like) | 学步园
- iphone7防水_iPhone11系列防水测试,其结果令人意外
- 苹果的困境源于优质移动应用的垮台吗?
- txt文档下载另存为解决
- SQL 语言特点、功能和数据类型
- nod32Android版用户名及密码,最新nod32官方升级id和账号用户名密码
- centos7设置静态IP地址方法
- python list切片_python list切片
- 爱心姐姐李娜:一片爱心为民续写大爱篇章
- 腾讯人力资源管理体系
- 如何才能招聘到合适的以太坊区块链开发者
热门文章
- 神级工具 PrimoCache v4.1(无限试用),电脑磁盘读写速度最高可提升70倍
- 课下作业(选做)第八周
- poi操作excel之填充数据、删除行
- vue 控制某个元素的显示或者隐藏之v-if属性
- 空间机械臂Matlab/Simulink仿真程序自由漂浮空间机械臂(双臂)轨迹跟踪控制matlab仿真程序
- udc-core: couldn‘t find an available UDC - added [g_ether] to list of pending drivers
- 安全方向比路由交换难吗_致网络工程师,新网工时代轻松拿下思科全新CCIE EI等各方向认证...
- Matlab动态作图——animatedline函数
- win7如何解除锁定计算机,Win7电脑键盘数字键被锁了怎么解锁(图文)
- BUUCTF-刷题记录-8