Python读取PPT,PPT PPTX PPTM PPS PPSM PPSX
语言:python3
windows环境方法
import json
from win32com import client as wcdef Read_PPTX(file): #PPT PPTX PPTM PPS PPSM PPSXppt = wc.Dispatch('PowerPoint.Application')ppt.Visible = 0pptSel = ppt.Presentations.Open(file)slide_count = pptSel.Slides.Countname = ['page', 'content']results = []for i in range(1, slide_count + 1):result = {}result[name[0]] = icontent = []shape_count = pptSel.Slides(i).Shapes.Countfor j in range(1, shape_count + 1):if pptSel.Slides(i).Shapes(j).HasTextFrame:net = pptSel.Slides(i).Shapes(j).TextFrame.TextRange.Text.strip()content.append(net)result[name[1]] = contentresults.append(result)ppt.Quit()jas = json.dumps(results, ensure_ascii=False, indent=4)result = ''for item in json.loads(jas):result = result + str(item['content']).replace(r'\r','')return resultif __name__ == '__main__':path = r'******\测试.pptm'j = Read_PPTX(path)print(j.encode('GBK', 'ignore').decode('GBK'))
优点:任意类型PPT皆可读取
缺点:反应迟钝,需要windows支持,还会弹出打开窗口
不依赖windows方法
import pptxdef read_PPTX(file_path): #pptx,pptm,presentation = pptx.Presentation(file_path)results = ''for slide in presentation.slides:for shape in slide.shapes:if shape.has_text_frame:for paragraph in shape.text_frame.paragraphs:for run in paragraph.runs:results = results + run.textreturn results.encode('GBK', 'ignore').decode('GBK')file_path = r'****\测试.pptx'
print(read_PPTX(file_path))
安装包下载:
https://files.pythonhosted.org/packages/bf/86/eb979f7b0333ec769041aae36df8b9f1bd8bea5bbad44620663890dce561/python-pptx-0.6.18.tar.gz
解压后cd /d 进入目录,执行命令即可
python setup.py install
优点:毫秒级别读取,不依赖windows环境
缺点:仅支持pptx,pptm
Python读取PPT,PPT PPTX PPTM PPS PPSM PPSX相关推荐
- [日常] [Python] 批量将某个文件夹下的.ppt/.pptx/.pptm转换为.pdf文件,并且将其移入/ppt文件夹中
Reference Python 3 – 批量将PPT转换为PDF_proplume的博客-CSDN博客 前提 安装comtypes库,需要用其操纵Microsoft PowerPoint. 命令行输 ...
- python修改ppt的字体和颜色_python pptx教程:python 怎么设置ppt图表区的颜色以及给图表区加上边框...
python 中 pptx 库 可以画组合图么? 我知道PPT可以组合画出,但是Python就不知道啦. python 怎么设置ppt图表区的颜色以及给图表区加上边框 Python Code:from ...
- java读取doc、docx、ppt、pptx、xls、xlsx格式的文件
前言: 通常我们用apache 的POI库对以上文档进行操作,apache POI官网 apache POI官网 这里推荐到官网下载导入到项目,maven下载的它会缺少几个包. 格式上后缀带x(doc ...
- 用Python玩转PPT!
作者 | 陈熹 来源 | 早起Python 今天本文将基于第三方库pptx,详细讲解如何使用Python操作Office全家桶最后一位--PPT. 安装 pptx是一个非标准库,需要在命令行中安装 p ...
- python ppt pdf linux,带你用Python玩转PPT
如上图所示,通过幻灯片母版我们可以预设好各种各样的版式,后面新建幻灯片的时候只需要点击版式就可以一键生成所需的基本格式. 接着说说占位符 Placeholder 占位符已经完成了样式设置,包括字体.字 ...
- 带你用Python玩转PPT
作者 | 陈熹 来源 | 早起Python(ID:zaoqi-python) 头图 | CSDN 下载自东方IC 导读 大家好,今天依旧是Python办公自动化基础系列,在之前我们分别详细讲解了 ? ...
- 关于python的ppt_用Python玩转PPT
作者 | 陈熹 来源 | 早起Python 今天本文将基于第三方库pptx,详细讲解如何使用Python操作Office全家桶最后一位--PPT. 安装 pptx是一个非标准库,需要在命令行中安装 p ...
- python给ppt表格加边框_带你用Python玩转PPT
作者 | 陈熹 来源 | 早起Python(ID:zaoqi-python) 头图 | CSDN 下载自东方IC 导读 大家好,今 天依旧是Python办公自动化基础系列,在之前我们分别详细讲解了 今 ...
- python办公自动化ppt_最全总结 | 聊聊 Python 办公自动化之 PPT(下)
image 1. 前言 作为办公自动化 PPT 系列篇的最后一篇文章,我们将 PPT 中的高级功能及常用点 文章内容将覆盖: 预设形状 Shape 图表 Chart 读取文字内容 保存所有图片 2. ...
最新文章
- 电脑机时,电脑死机时,为啥会忍不住扇它一巴掌?
- Spring Cloud Sleuth 进阶实战
- delphi解决:Thread error 拒绝访问(5)
- og-bin=mysql-bin_init_connect + binlog 记录 mysql 操作日志
- linux 杀毒软件 clamav安装使用
- linux 监控命令iostat,Linux下 IO实时监控iostat命令详解
- C# 9 Lambda 小幅升级
- java postgresql json_java – 将PostgreSQL JSON列映射到Hibernate值类...
- Qt添加类文件编译后,再添加宏Q_OBJECT
- 尝试使用Microsoft IE 7.0 Beta 1
- Ehcache学习总结(1)--Ehcache入门介绍
- 换手率:为什么美国人不爱频繁申赎基金?
- docx文档怎么排列图片_打开.docx文件的6种方法分享:docx文件怎么打开?
- rocketmq 消费方式_详解RocketMQ中的Consumer
- python中几种括号的用法()、[]、{} 举例说明
- sql函数—Lpad、Rpad
- 剑指 Offer 53 - II. 0~n-1中缺失的数字
- SQL:with as用法
- Win10系统不兼容驱动怎么办?
- 磁盘管理器中不显示新增的硬盘