Python将PPT中所有文本框里的文字提取出来
Python将PPT中所有文本框里的文字提取出来
我用了正则表达式,理论上用用可以解析xml格式的都可以,如Beautiful,pandas等。
直接上代码
import os
import re
silde_list=os.listdir()
silde_list.sort()
for i in silde_list:if i[-4:]=='.xml'and i[:5]=='slide':#在这里可以控制需要提取幻灯片的范围with open(i,'r') as f:txt=f.read()pattern = re.compile(r'<a:t>.*?</a:t>')txt="".join(pattern.findall(txt)).replace('<a:t>',"").replace('</a:t>',"")with open('result.txt','a') as f:f.write(txt+'\n')
STEP
1.解压缩PPT
2.打开文件夹,进入./ppt/slides,文件夹中的slide文件标号对应的是ppt中的标号
3.创建"提取.txt"文件,将程序复制进去,改后缀为.py。
4.在当前目录运行,会生成“result.txt“,文字就在里面。
NOTE
默认在“result.txt”是按顺序一行一张幻灯片。
Python将PPT中所有文本框里的文字提取出来相关推荐
- [实用文档]将PPT中所有文本框里的文字提取出来
将PPT中所有文本框里的文字提取出来 打开PPT,按ALT+F11打开VBA编辑器,在左面的工程视图里点击右键,选择插入->模块,添加一个模块,名字都不用改. 然后点击顶部的"工具&q ...
- word 中的边框底纹和PPT中的文本框制作专业文档
多用word 2003 中的"边框和底纹"和PPT中的文本框制作专业文档. word 2003中的用两种方法将一段文字框起来,这常见于报告一些安装或启动的屏幕信息过程log: 1. ...
- vbs 删除 PPT 中的文本框
如何去除中国大学MOOC网下载的 pdf 格式课件中的底纹文字? 将 pdf 格式转换成 pptx 格式. 打开 https://www.ilovepdf.com/, 选择 PDF to powerp ...
- html多个文本框合并,PPT中一个文本框包含另一个文本框这两个文本框如何组合?...
回答: TCHARszName1[100]; TCHARszName2[100]; eDit1=CreateWindowA("EDIT",(LPCSTR)szName1,WS_MU ...
- 导出ppt中所有文本框
打开PPT,按ALT+F11打开VBA编辑器,(部分电脑FN+ALT+F11)在左面的工程视图里点击右键,选择插入->模块,添加一个模块,名字都不用改. 然后点击顶部的"工具" ...
- axure文本框单击提示文字消失_Axure基础原件使用
本内容从网上搜索,仅供参考学习 1. 添加元件到工作区 在左侧元件中选择要使用的元件,按住鼠标左键不放,拖到画布适合的位置上松开. 2. 添加元件名称 在检视面板的元件名称文本框中输入元件自定义名称. ...
- python获取文本框里输入的值_如何从Tkinter文本框小工具获取输入?
要从python 3中的文本框中获取Tkinter输入,我使用的完整学生级程序如下: #Imports all (*) classes, #atributes, and methods of tkin ...
- Python读取\修改word文档中的文本框内容
本文所指的 word文档,都是docx结尾的,如果是doc结尾的,请参考上篇:点我 我们绝大多数的需求都是 利用python-docx 来读取word文档中的内容,进而再对内容进行其他处理,如下代码, ...
- html在边框线中加文本框,怎么设置幻灯片里的文本框边框线?
通过设置文本框格式来实现 选中刚刚插入的文本框,右键,选择"设置自选图形/图片格式": 在文本框格式中的颜色与线条界面中,将线条的颜色改为无颜色,然后点击保存. 可以用border ...
最新文章
- osgi实战学习之路:8. Service-3之ServiceTracker
- 在EXCEL指定SHEET页,指定文字位置,插入批注
- texlive安装需要多久_LaTex编译环境安装与使用
- python里面返回上一步_Python中的这3个骚操作你会吗?
- Linux 网页挂马实验,网页挂马详细教程
- android如何删除项目,AndroidStudio中怎样删除项目
- python 读取outlook_如何用 Python 读取 Outlook 中的电子邮件
- 微信分享到朋友圈onMenuShareTimeline成功后的回调函数在某系ios手机下不执行的问题...
- 依存句法分析 oracle,spaCy 第三篇:依存分析
- spring注册bean
- 基于频繁增长树(FP-树)的频繁项集挖掘算法实现
- zip gbk java,java 解压 ZIP 中文 乱码 GBK UTF-8 完美解决方案
- SpringBoot + QueryDSL 大大简化复杂查询操作
- crontab 问号_轻松搞定crontab和quartz表达式
- 沿海信标台站rbn-dgps的文献综述
- android provision apk 分析
- 荣耀8青春版android,华为荣耀8青春版有几个版本?荣耀8青春版低配版/标准版/高配版区别对比评测...
- 通过PowerShell管理Office 365组
- 入手python时踩过的坑——缩进篇
- 有哪些适合放在程序员办公桌上的高逼格物件?
热门文章
- 测试开发工作者日记:2020.6.15-6.16
- oracle银手镯怎么样,银镯子是圆的好还是扁的好,是光面好还是哑光好
- Python Day2-标识符
- Python_各个代理网站/代理设置/代理池使用
- vue2核心以及面试题讲解(组件通信方式,分页器,防抖节流)
- Java 集合之给ArrayList排序
- linux环境下如何调鼠标灵敏度,linux怎么设置鼠标灵敏度? linux设置鼠标灵敏度的方法...
- word2016怎么显示修改痕迹
- 辑擎内NET案Infralution Globalizer Developer v3.9
- 敏捷教练----Scrum-每日站会和敏捷回顾