实现了PymuPDF替换pdf指定位置文字和图片的功能,并分别保存pdf和JPG格式.

#-*- coding:utf-8 -*-
import os
import PyPDF2
import fitztext = u"湖南省湘潭市雨湖区鹤岭镇长安村永红组"file_path = r'D:\Desktop\新建文件夹'for root,dirs,files in os.walk(file_path):for file in files:print(file)if file.upper().endswith('FWT.PDF'):print(file.upper())pdfPath=os.path.join(root,file)print(pdfPath)doc = fitz.open(pdfPath)page=doc[0]#方法1插入一个空白图片或者直接插入带文字的图片(效果有出入)# rect=fitz.Rect(1050,-4260,2600,-4150) #替换坐落为空白区域--需要调试位置,# pix=fitz.Pixmap(r"D:\t.jpg")# page.insert_image(rect,pixmap=pix,overlay=True)#方法2插入空白区域,再插入文本page.draw_rect((1050,-4255,2600,-4150),color=(1,1,1),fill=(1,1,1),width=0) #方法1绘制白色无框矩形覆盖地址#方法1,定义字体文件会比直接调用PDF体积小一些  fontname="SimHei" ,fontfile=r"C:\Windows\Fonts\simhei.ttf"ff=page.insert_font(fontname="HT",fontfile=r"C:\Windows\Fonts\simhei.ttf", fontbuffer=None , set_simple=False ) #定义黑体page.insert_text((1150,-4190),text,fontname="HT" ,fontsize=86 ,color=(0,0,0,1), fill=None, render_mode=0, border_width=1, rotate=0, morph=None, overlay=True)#方法2:定义CJK内置字体,默认china-s默认为黑体,但是在非福昕阅读器当中显示有异常,直接导出JPG也显示有异常(弃用)#page.insert_text((1150,-4190),text,fontname="china-t" ,fontsize=86 ,color=(0,0,0,1), fill=None, render_mode=0, border_width=1, rotate=0, morph=None, overlay=True)#https://pymupdf.readthedocs.io/en/latest/page.html#Page.insert_font 参照 CJK内置字体china-s 黑体 china-ss 宋体 china-t 繁体黑体 china-ts 繁体宋体print('导出:',r"D:\Desktop\新建文件夹\2_1.PDF" )#print('导出:',os.path.splitext(pdfPath)[0]+"_1.PDF" )doc.save(r"D:\Desktop\新建文件夹\2_1.PDF",garbage=4, deflate=True)#PDF导出图片-并提升导出图片分辨率2倍zoom_x = 2.0 zomm_y = 2.0 mmat = fitz.Matrix(zoom_x, zomm_y) pix = page.get_pixmap(matrix=mat,alpha=0) # alpha=0 白色背景pix.save(r"D:\Desktop\新建文件夹\2_1.JPG") #直接保存成jpg 不处理,清晰度低

PymuPDF实现PDF文字和图片的修改相关推荐

  1. PDF如何编辑修改,怎么编辑PDF文字与图片

    很多的小伙伴会私信小编询问小编关于PDF文件的修改技巧,在使用PDF文件的时候,往往是需要用到PDF编辑器的,编辑文件时,想要修改文件的内容包括文字内容以及图片内容,应该怎么去编辑呢,其实,还是很简单 ...

  2. python 生成pdf 文字和图片_Python系列—PDF文本与图片抽取

    PDF是人们日常使用最多的跨平台文档.其是一种用独立于应用程序.硬件.操作系统的方式呈现文档的文件格式.每个PDF文件包含固定布局的平面文档的完整描述,包括文本.字形.图形及其他需要显示的信息.具有良 ...

  3. 一段比较浅显易懂的java识别pdf 文字及图片

    使用pdfbox及orc进行pdf文件的文字及图片的识别 pom设置相关依赖 <!--pdf相关依赖开始--><dependency><groupId>org.ap ...

  4. python自动化系列之提取pdf文字和图片

    在python中有许多开源的库可以处理Pdf文档,最常用的Pypdf2库可以读取文档,合并,分割pdf文档,但是也有局限性: 无法提取文档中的文字 提取PDF文字需要使用另外的库,如pdfplumbe ...

  5. 怎样使用PDF编辑器?PDF中的图片怎么修改?

    大家都知道PDF文件的编辑需要专业工具的辅助,而PDF编辑器就是编辑PDF文件所需的工具,可是还是有很多朋友不知道怎么使用这类的工具.比如PDF中的图片如何添加或替换等应该如何操作呢? 以下用极速PD ...

  6. php pdf 文字水印图片,php pdf添加水印(中文水印,图片水印)

    1.下载软件包 链接:https://pan.baidu.com/s/1cah-mf-SCtfMhVyst_sG8w&shfl=sharepset 提取码:ld8z 2.下载pdf_water ...

  7. php pdf 文字水印图片,php如何给pdf加上文字水印和图片水印[未测试]

    php给pdf加上水印 环境 php5.5.12 fpdi-1.5.2 fpdf-1.7 原理 利用fpdi来加载已知pdf文件,用fpdf对pdf进行操作 注意事项 免费的fpdi只支持处理pdf1 ...

  8. 如何将pdf图片文字转换成word 文字word图片怎么转换pdf

    如今大家在工作中常常会运用到电脑来办公,电脑的运用大大提高了我们的工作效率,在带来机会的同时同样也带来了新挑战. pdf图片怎么转换成word文档?PDF格式是一种常用的文档格式,它可以保持文档内容和 ...

  9. Python将PDF转成图片—PyMuPDF和pdf2image

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...

  10. pdf转换成jpg python_【PyMuPDF和pdf2image】Python将PDF转成图片PNG和JPG

    公众号:前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Pyt ...

最新文章

  1. Linux下进程通信知识点学习笔记(一)
  2. No module named 'xxx’
  3. perl 爬ku6视频
  4. movielens推荐系统_浅谈推荐系统+3个小时上手python实现(完整代码)
  5. WeMos下实现小车避障与手机控制
  6. 【JAVA基础篇】==、equals和hashCode的区别和联系
  7. ANC双重降噪+三种沉浸立体音效 OPPO无线降噪耳机正式发布
  8. PC电脑端社交应用设计灵感
  9. Linux获取执行文件路径,如何 获取linux进程的执行文件路径
  10. 吴恩达深度学习5.1笔记_Sequence Models_循环序列模型
  11. NotifyIcon实现托盘程序
  12. 从零开始学习使用FPGA控制ADF4351芯片
  13. Docker网络及资源管理
  14. 群雄混战的短视频,繁荣背后存在的短板
  15. 前端作品-网页弹钢琴
  16. 关于中国电信天翼开放平台短信接口的一些使用
  17. 清华梦的粉碎——转自王垠
  18. 梦幻西游手游版找不到服务器,梦幻西游手游无法选择服务器怎么办 解决方法...
  19. 通过UC开发者调试工具调试webView
  20. EasyGrep使用简介

热门文章

  1. 力扣刷题(347. 前 K 个高频元素)快速排序
  2. 《如何阅读一本书》读后感
  3. 《数学之美》 读书笔记
  4. 雅虎被收购后,Tumblr 前途未卜,准备在所有博客中引入广告
  5. 无线路由登不上服务器怎么办,192.168 2.1路由器登陆不了怎么办
  6. 【Java基础】· 面向对象编程(下)习题详解
  7. 【机器学习】十二、一文看懂支持向量机原理
  8. 【IoT】产品三问:什么是产品?什么是产品管理?产品经理职责是什么?
  9. ROS 使用 gazebo 仿真时遇到的问题
  10. springboot快速开发框架,适合二次开发(一)