前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:多巴胺爱学习

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun

为什么要这么干

万事皆有缘由,以下纯属YY,不想看的可以直接忽略。

OCR文字识别已经很流行了,我们做PPT的时候经常会用文字识别软件来获得内容(好吧,我经常这么干。。。)。OCR软件在识别文字上的准确性已经比较高了,但是标点符合却差强人意,逗号、分号、冒号之类的经常会被识别为半角,这个时候就需要改了。

当然,我们可以用ppt当中的替换功能手工替换。

再当然,我们还可以用ppt的宏功能实现,使用起来更方便。只是这个宏,目前我还没写出来,写出来后再另外分享了。

本次操作环境

操作系统:win10

Python版本:3.7

使用的第三方库:python-pptx

如果没有安装第三方库的话,需要先安装下:

  • Windows:pip install python-pptx
  • Mac:pip3 install python-pptx

PPT科普

PPT是由许多页组成的,页叫做Slide;

每一页又包含了许多组件,像文本框、表格,这些组件叫做Shape。我们做PPT的时候,文字主要就是放在文本框或者表格中的;

文本框中的文字是以段落的形式存在的,段落叫做Paragraph;

表格是由单元格组成的,单元格叫做Cell,单元格中的文字,也是由段落组成的。如下图:

代码实现

代码实现的原理很简单,遍历Slide找Shape;遍历Shape找Paragraph;遍历Paragraph找run(run简单点理解就是文字块);在run中看看有没有需要替换的字符,有的话就替换了。

import pptxfromShao pptx import PresentationTEXT_NEED_REPLACE = [('概念', 'Concept'), ('企业', 'Enterprise')]#需要替换的内容,数据结构为“[(被替换内容1,替换内容1),(被替换内容2,替换内容2),……]”FILE_OPEN = r"c:/python/asoursefiles/00301.pptx"#需要打开的文件地址FILE_SAVE = r"c:/python/asoursefiles/demo.pptx"#需要保存的文件地址,不建议直接覆盖原文件,当然你非要覆盖原文件也拦不住。这里需要提示的是:需要保存的文件不能是打开的状态,否则会无法保存。def replace_text(text_frame):#该函数实现的是文本替换功能    for paragraph in text_frame.paragraphs:        for run in paragraph.runs:            for tt in TEXT_NEED_REPLACE:                if tt[0] in run.text:                    run.text = run.text.replace(tt[0], tt[1])def process_ppt(filename_open, filename_save):    prs = Presentation(filename_open)    for slide in prs.slides:        for shape in slide.shapes:            if shape.has_text_frame:#判断Shape是否含有文本框                text_frame = shape.text_frame                replace_text(text_frame)#调用replace_text函数实现文本替换            if shape.has_table:#判断Shape是否含有表格                table = shape.table                for cell in table.iter_cells():#遍历表格的cell                    text_frame = cell.text_frame                    replace_text(text_frame))#调用replace_text函数实现文本替换    prs.save(filename_save)#保存process_ppt(FILE_OPEN, FILE_SAVE)

后记

用Python与ppt、word进行交互是一个比较鸡肋的想法,99%的情况下,都是闲的无聊,微软的office功能已经不要太强大了。

用Python操作excel,相比于office,在个别情况(数据量大,或者需要实现的分析步骤太多,太复杂之类的)下可能具有优势,但通常情况下也用不到。

对于普通办公需求,从实用角度来说,学好office比学什么python,R,matlab,SPSS之类的有用多了。毕竟office的强大,只有你想不到的,没有它做不到的(安装包也够大的,打开之后电脑风扇转的哇哇哇的响)。

当然,会点Python,matlab之类的,你找工作的时候可以写在简历上。工作中真碰到坑了,也可以咬咬牙自己去填。

ps 替换文字_Python操作PPT实现自动查找替换相关推荐

  1. 计算机替换字体怎么操作,电脑替换文字怎么操作

    大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. 以word为例,在电脑上替换文字的操作的步骤是: 1.打开word,在[开始]菜单里选择[替换]选项. 2.在弹出的对话框里输入需 ...

  2. 通过excel自带的VLOOKUP函数实现字符串自动查找替换

    通过excel自带的VLOOKUP函数实现字符串自动查找替换. 通过此功能实现自动翻译海外字符串的功能. 步骤1. 准备工作: 准备好之前翻译过的比较完整的字符串表ref_list.txt和待翻译的表 ...

  3. html编辑器查找与替换,织梦kindeditor文本编辑器增加“查找替换”功能

    织梦kindeditor文本编辑器增加"查找替换"功能效果演示 1.items 里面增加 search 按钮 ['source','|','undo','redo','|','pr ...

  4. python控制ppt翻页_python 操作ppt

    转自其他博客 实测可用 # 加载库 import os import pandas as pd from pptx import Presentation from pptx.util import ...

  5. python字符串替换空格_python - 用pandas中的NaN替换空白值(空格)

    python - 用pandas中的NaN替换空白值(空格) 我想在Pandas数据帧中找到包含空格(任意数量)的所有值,并用NaN替换这些值. 有什么想法可以改进吗? 基本上我想转此: A B C ...

  6. Word VBA自动排版(2)-通过自动查找替换去除叠字

    叠字主要包括以下几种: 1型aabbcc 2型ababab 3型abcabcabc 4型abcdabcdabcdabcd(这个算思考题,自己根据原理增加吧) 代码原理为通过自建数组和通配符替换逐一替换 ...

  7. php中怎么替换文字,php里面怎么替换文字

    php里面怎么替换文字2020-07-13 07:15:50 php替换文字的方法:使用[str_replace()]函数用一个字符串替换字符串中的另一些字符即可,语法为[str_replace(fi ...

  8. vim 全局替换_高效操作:vim 快速删除空行和注释

    说起 Linux 下的高效率编辑器,绝对少不了 vi / vim 这样灭霸级别的效率产品,无论是编辑文档.写 shell 脚本,还是 coding ,熟练使用 vi / vim 可以让你在 Linux ...

  9. dw替换多个html标签,DW查找替换的技巧

    在开发建设网站的过程中,也许我们会遇到这样的情况,当我们的网站已经进行了相当部分,但是发现还需要对某些细节进行修改.这时候不可能完全的依靠手工去更改了,怎么办呢?利用Dreamwaver中查找替换也许 ...

最新文章

  1. Agile Development
  2. HDU 2612 Find a way
  3. 【机器视觉】 if算子
  4. 基于EM的多直线拟合实现及思考
  5. ELT和ETL分不清楚?2张图就能理解透彻
  6. html为什么div移动不了,如何使用Jquery将html从一个div移动到另一个div而不会破坏javascript...
  7. $.getJSON()应用
  8. 贝塞尔曲线UIBezierPath简单使用
  9. Github 常用命令
  10. 【专利】实用新型专利设计模板
  11. 进销存软件哪个简单好用?商户必看
  12. 二维傅里叶变换的理解和使用
  13. css的div垂直居中的方法,CSS使DIV内容垂直居中的方法
  14. TI-TMS320F28335学习详解(2)::F28335片上资源详解
  15. 数据导入阿里云mysql_mysql数据库数据导入
  16. 叮咚智能音箱使用体验:好看的皮囊千篇一律,有趣的灵魂万里挑一
  17. 数字营销(三)如何确定合适的流量渠道?
  18. OpenCV--颜色通道分离和合并
  19. 【项目实战】Python基于BP神经网络算法实现家用热水器用户行为分析与事件识别
  20. 计算机体系-指令系统

热门文章

  1. SAP CRM和SAP Hybris的订单日志
  2. 关于Chrome支持http header最大长度限制的讨论
  3. SAP C4C和Gigya(Customer Data Cloud)的客户报表
  4. SAP CRM和C4C message category配置
  5. 如何使用Kubernetes的configmap通过环境变量注入到pod里
  6. 使用JPA + Eclipselink操作PostgreSQL数据库
  7. c远程连接mysql数据库_MySQL数据库远程连接开启方法
  8. java与ios_JAVA和IOS区别是什么?
  9. android 一个字符串分两行显示_重新梳理Android权限管理
  10. mysql全表重命名备份_Mysql数据库和表的常用操作以及数据备份恢复