点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

昨夜裙带解,今朝蟢子飞。

大家好,我是Python进阶者。

前言

前几天在学习【麦叔】Python自动化书本中案例的时候,学到了PDF文件处理,感觉挺有意思的。正好在【J哥】的交流群里边有粉丝问了一道关于PDF处理的问题。

这个问题如果没有学点PDF的处理,一开始看到还是觉得有点困难的,我一开始也有点束手无策。

一、思路

针对这个问题,其实我有三个思路。

第一个思路:将pdf文件一进行分割成单独文件,之后和pdf文件二进行排序放到一个文件夹下,再统一进行merge;

第二个思路:尝试用merge进行合并,直接插入到文件的指定页面之下,但是我目前对这个用的不是很好,没有弄出来;

第三个思路:逐页进行添加,并保存为新文件。

二、解决方案

针对该问题,这里采用了第三个方法,最为自然,也是三个方法中最简单的一个了。这里需要用到PDF的处理库PyPDF2,这个库需要安装,安装命令:pip install PyPDF2

这个库针对PDF的处理来说还是算比较强大的了,可以针对PDF文件做拆分、合并、加密和截取等。关于这个库的其他用法,很多公众号也有写,这里就不展开赘述了。

针对这个问题,这里直接上代码了,如下所示:

from PyPDF2 import PdfFileReader, PdfFileWriterpdf_file1 = PdfFileReader("dogs_0.pdf")  # 要插入的pdf文件
pdf_file2 = PdfFileReader("python介绍.pdf")  # 要被插入的目标pdf文件
new_file = PdfFileWriter()# 这里场景是计划将pdf_file1插入到pdf_file2的第3页new_file.addPage(pdf_file2.getPage(0))
new_file.addPage(pdf_file2.getPage(1))
new_file.addPage(pdf_file1.getPage(0))
new_file.addPage(pdf_file2.getPage(2))# 写入文件
with open("merged_file.pdf", "wb") as f:new_file.write(f)

关键的地方都有注释进行标注了,如果你需要插入的pdf原始文件页面太多的话,可以考虑循环遍历追加,这样就不至于写很多行代码了。

三、总结

我是Python进阶者。本文基于实际过程中遇到的PDF文件拆分和合并问题,使用了PyPDF2第三方库来帮助解决,这个库可以针对PDF文件做拆分、合并、加密和截取等,功能强大,帮助自己和大家加深对该库用法的认识。

最后感谢粉丝【ᝰડⅈꪶꦍꪀᥴ꧖ꦿ】提问,感谢【麦叔】、【南京-工业4.0-MrChen】大佬给出的资料和方法。

需要本文代码中提及的文件,可以加我好友,私我获取。

这个问题肯定小编相信肯定还有其他的方法的,也欢迎大家在评论区谏言。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐:

  • 手把手教你JS逆向搞定字体反爬并获取某招聘网站信息

  • 如何用Python下载百度指数的数据

  • 分享一次实用的爬虫经验

  • 补充篇:盘点6种使用Python批量合并同一文件夹内所有子文件夹下的Excel文件内所有Sheet数据

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~

怎么在第一个PDF文件的中间,插入第二个PDF文件的内容?相关推荐

  1. 怎么在第一个 PDF 文件的中间,插入第二个 PDF 文件的内容?

    这是「进击的Coder」的第 568 篇技术分享 作者:Python 进阶者 来源:Python 爬虫与数据挖掘 " 阅读本文大概需要 3 分钟. " 前言 前几天在学习[麦叔]P ...

  2. python科学计算基础教程pdf下载-python科学计算 第二版 PDF 下载

    相关截图: 资料简介: 本书详细介绍Python科学计算中最常用的扩展库NumPy.SciPy.matplotlib.Pandas.SymPy.TTK.Mayavi.OpenCV.Cython,涉及数 ...

  3. JAVA NIO文件映射、通道、流读写文件示例

    本例使用FileChannel和 BufferedInputStream等测试对比. TestHandler.java 用于实现动态代理,测试运行效率 package com.test;import ...

  4. PDF文件中如何插入页面?分享一个实用小妙招

    怎么在PDF文件中插入页面呢?大家在将一份PDF文件制作好时,在浏览检查的时候发现文件中缺少一页或者是几页的内容,想要把这部分的内容添加上去该怎么做呢?有的小伙伴会选择重新做一份PDF文件,但这样会耗 ...

  5. PDF合并:如何将两个PDF文件合并成一个PDF文件

    PDF文件是我们在工作中经常能够用到的文件,尤其是在办公中会遇到很多PDF文件在传输的过程中为了传输更快被拆分成了几个PDF文件,但是要找一个完整的PDF文件就需要把两个被拆分的PDF文件合并成一个P ...

  6. drawboard pdf拆分文件_电脑在线如何分割PDF页面?免费分割3M以内PDF文件页面的简单方法...

    PDF现在真的是一个比较常用的文件格式,兼容性比较好.PDF文件可以保证打印或发送给对方的时候,排版等格式不会变.现在也有很多相关的PDF功能,供我们选择.但是我们不用下载安装也行,电脑直接在线操作也 ...

  7. 使用pdf.js预览实现读取服务器外部文件

    不知道大家使用百度网盘的文件预览功能,f12看过控制台没有. 发现百度网盘使用的预览文件功能全是基于开源pdf .js的 接下来正题,我们在使用pdf.js默认是读取发布容器内部的文件,读取外部的文件 ...

  8. c++编辑器_盘点四款PDF编辑器,使用它们,编辑PDF文件没问题!

    原标题:盘点四款PDF编辑器,使用它们,编辑PDF文件没问题! 在我们日常学习和日常工作中,我们有时会遇见将PDF文件进行编辑的问题.有时候是添加图片,插入文字,有时候是拆分PDF,修改PDF文件. ...

  9. 详细说明通过kettke对csv文件转换的操作步骤_如何将多页面pdf分割成一页一页的PDF文件...

    经常会有小伙伴问我,如何将多页面的PDF文件拆分成一个个的PDF文件?例如有5个页面的PDF文件,一次性拆分导出生成5个单页面的PDF文件? PDF文件是我们日常工作学习中经常要用到的,有时候PDF文 ...

最新文章

  1. mahout in Action研读(1)-给用户推荐图书
  2. 随机存取存储器(RAM)
  3. hadoop hdfs 集群配置
  4. bash 学习笔记2
  5. 数据结构:二叉搜索树(BST)全部基本操作
  6. 中科院30m二级分类土地利用数据Arcgis预处理及获取
  7. 时间序列(一):时间序列数据与时间序列预测模型
  8. aida64使用教程
  9. 免费OA办公系统评测 到底哪个适合本公司?
  10. u盘server2012服务器系统安装,怎样u盘装windows server2012呢?
  11. 光波传输的角谱理论【理论,实例及matlab代码】
  12. 荐书丨《好奇心的秘密》:一个针尖上可以站多少跳舞的小天使?
  13. 音乐计算机锦鲤抄,十首古风歌曲,锦鲤抄上榜,哪一首是你心目中的古风“神曲”?...
  14. 爬虫:信息提取的一般方法
  15. 微软E5账号OneDrive无法扩容解决方案(亲测有效)
  16. 合振动的初相位推导_两个同方向、同频率的简谐振动表达式为和,试求它们的合振动的振幅和初相位。...
  17. 贪婪洞窟2一直显示连接服务器失败,贪婪洞窟2登陆不了怎么办?游戏无法登陆解决方法...
  18. IE 弹出提示:由于无法验证发布者,所以Windows 已经阻止此软件
  19. 计算机系400分左右的学校,杭州2021年400分能上计算机学校吗
  20. halcon中如何生成椭圆_教你动态生成椭圆,还教你怎么用海龟作图——GeoGebra制作教程...

热门文章

  1. 烤仔建工承建,著名画家孙天骄的元宇宙美术馆即将开门迎客
  2. nodejs使用addon调用c/c++
  3. [HCIP]MPLS解决路由黑洞
  4. OSPF多实例路由防环检测功能介绍
  5. P5030 长脖子鹿放置
  6. Zookeeper介绍、原理及应用
  7. Pygame中blit( )方法讲解(Surface对象)
  8. excel中如何自动添加邮箱后缀
  9. 华为机试 HJ21简单密码【java实现】
  10. 【微信网页授权】SpringBoot+uniapp实现网页授权获取用户基本信息