Python将PPT中所有文本框里的文字提取出来

我用了正则表达式,理论上用用可以解析xml格式的都可以,如Beautiful,pandas等。

直接上代码

import os
import re
silde_list=os.listdir()
silde_list.sort()
for i in silde_list:if i[-4:]=='.xml'and i[:5]=='slide':#在这里可以控制需要提取幻灯片的范围with open(i,'r') as f:txt=f.read()pattern = re.compile(r'<a:t>.*?</a:t>')txt="".join(pattern.findall(txt)).replace('<a:t>',"").replace('</a:t>',"")with open('result.txt','a') as f:f.write(txt+'\n')

STEP

1.解压缩PPT

2.打开文件夹,进入./ppt/slides,文件夹中的slide文件标号对应的是ppt中的标号

3.创建"提取.txt"文件,将程序复制进去,改后缀为.py。
4.在当前目录运行,会生成“result.txt“,文字就在里面。

NOTE

默认在“result.txt”是按顺序一行一张幻灯片。

Python将PPT中所有文本框里的文字提取出来相关推荐

  1. [实用文档]将PPT中所有文本框里的文字提取出来

    将PPT中所有文本框里的文字提取出来 打开PPT,按ALT+F11打开VBA编辑器,在左面的工程视图里点击右键,选择插入->模块,添加一个模块,名字都不用改. 然后点击顶部的"工具&q ...

  2. word 中的边框底纹和PPT中的文本框制作专业文档

    多用word 2003 中的"边框和底纹"和PPT中的文本框制作专业文档. word 2003中的用两种方法将一段文字框起来,这常见于报告一些安装或启动的屏幕信息过程log: 1. ...

  3. vbs 删除 PPT 中的文本框

    如何去除中国大学MOOC网下载的 pdf 格式课件中的底纹文字? 将 pdf 格式转换成 pptx 格式. 打开 https://www.ilovepdf.com/, 选择 PDF to powerp ...

  4. html多个文本框合并,PPT中一个文本框包含另一个文本框这两个文本框如何组合?...

    回答: TCHARszName1[100]; TCHARszName2[100]; eDit1=CreateWindowA("EDIT",(LPCSTR)szName1,WS_MU ...

  5. 导出ppt中所有文本框

    打开PPT,按ALT+F11打开VBA编辑器,(部分电脑FN+ALT+F11)在左面的工程视图里点击右键,选择插入->模块,添加一个模块,名字都不用改. 然后点击顶部的"工具" ...

  6. axure文本框单击提示文字消失_Axure基础原件使用

    本内容从网上搜索,仅供参考学习 1. 添加元件到工作区 在左侧元件中选择要使用的元件,按住鼠标左键不放,拖到画布适合的位置上松开. 2. 添加元件名称 在检视面板的元件名称文本框中输入元件自定义名称. ...

  7. python获取文本框里输入的值_如何从Tkinter文本框小工具获取输入?

    要从python 3中的文本框中获取Tkinter输入,我使用的完整学生级程序如下: #Imports all (*) classes, #atributes, and methods of tkin ...

  8. Python读取\修改word文档中的文本框内容

    本文所指的 word文档,都是docx结尾的,如果是doc结尾的,请参考上篇:点我 我们绝大多数的需求都是 利用python-docx 来读取word文档中的内容,进而再对内容进行其他处理,如下代码, ...

  9. html在边框线中加文本框,怎么设置幻灯片里的文本框边框线?

    通过设置文本框格式来实现 选中刚刚插入的文本框,右键,选择"设置自选图形/图片格式": 在文本框格式中的颜色与线条界面中,将线条的颜色改为无颜色,然后点击保存. 可以用border ...

最新文章

  1. osgi实战学习之路:8. Service-3之ServiceTracker
  2. 在EXCEL指定SHEET页,指定文字位置,插入批注
  3. texlive安装需要多久_LaTex编译环境安装与使用
  4. python里面返回上一步_Python中的这3个骚操作你会吗?
  5. Linux 网页挂马实验,网页挂马详细教程
  6. android如何删除项目,AndroidStudio中怎样删除项目
  7. python 读取outlook_如何用 Python 读取 Outlook 中的电子邮件
  8. 微信分享到朋友圈onMenuShareTimeline成功后的回调函数在某系ios手机下不执行的问题...
  9. 依存句法分析 oracle,spaCy 第三篇:依存分析
  10. spring注册bean
  11. 基于频繁增长树(FP-树)的频繁项集挖掘算法实现
  12. zip gbk java,java 解压 ZIP 中文 乱码 GBK UTF-8 完美解决方案
  13. SpringBoot + QueryDSL 大大简化复杂查询操作
  14. crontab 问号_轻松搞定crontab和quartz表达式
  15. 沿海信标台站rbn-dgps的文献综述
  16. android provision apk 分析
  17. 荣耀8青春版android,华为荣耀8青春版有几个版本?荣耀8青春版低配版/标准版/高配版区别对比评测...
  18. 通过PowerShell管理Office 365组
  19. 入手python时踩过的坑——缩进篇
  20. 有哪些适合放在程序员办公桌上的高逼格物件?

热门文章

  1. 测试开发工作者日记:2020.6.15-6.16
  2. oracle银手镯怎么样,银镯子是圆的好还是扁的好,是光面好还是哑光好
  3. Python Day2-标识符
  4. Python_各个代理网站/代理设置/代理池使用
  5. vue2核心以及面试题讲解(组件通信方式,分页器,防抖节流)
  6. Java 集合之给ArrayList排序
  7. linux环境下如何调鼠标灵敏度,linux怎么设置鼠标灵敏度? linux设置鼠标灵敏度的方法...
  8. word2016怎么显示修改痕迹
  9. 辑擎内NET案Infralution Globalizer Developer v3.9
  10. 敏捷教练----Scrum-每日站会和敏捷回顾