pdf下载

import requests# python requests 的pdf 文档
requests_pdf_url = "https://link.springer.com/content/pdf/10.1007/s11663-021-02419-9.pdf"
r = requests.get(requests_pdf_url)
filename = "requests.pdf"
with open(filename, 'wb+') as f:f.write(r.content)

pdf合并


import os
from PyPDF2 import PdfFileMergertarget_path = os.getcwd()  ## 获取文件当前工作目录路径
pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]file_merger = PdfFileMerger()
for pdf in pdf_lst:file_merger.append(pdf,import_bookmarks=False)     # 合并pdf文件file_merger.write(r"合并文件.pdf")

注意:合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些

os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。

import os, sys# 打开文件
# 输出所有文件和文件夹
for file in os.listdir("C:/Users/sun78/下载_chrome"):print (file)

Python endswith() 方法用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回True,否则返回False。可选参数"start"与"end"为检索字符串的开始与结束位置。

os.path.abspath(path) 返回绝对路径
os.path.basename(path) 返回文件名
os.path.commonprefix(list) 返回list(多个路径)中,所有path共有的最长的路径
os.path.dirname(path) 返回文件路径
os.path.exists(path) 如果路径 path 存在,返回 True;如果路径 path 不存在,返回 False。
os.path.lexists 路径存在则返回True,路径损坏也返回True
os.path.expanduser(path) 把path中包含的"~"和"~user"转换成用户目录
os.path.expandvars(path) 根据环境变量的值替换path中包含的"$name"和"${name}"
os.path.getatime(path) 返回最近访问时间(浮点型秒数)
os.path.getmtime(path) 返回最近文件修改时间
os.path.getctime(path) 返回文件 path 创建时间
os.path.getsize(path) 返回文件大小,如果文件不存在就返回错误
os.path.isabs(path) 判断是否为绝对路径
os.path.isfile(path) 判断路径是否为文件
os.path.isdir(path) 判断路径是否为目录
os.path.islink(path) 判断路径是否为链接
os.path.ismount(path) 判断路径是否为挂载点
os.path.join(path1[, path2[, ...]]) 把目录和文件名合成一个路径
os.path.normcase(path) 转换path的大小写和斜杠
os.path.normpath(path) 规范path字符串形式
os.path.realpath(path) 返回path的真实路径
os.path.relpath(path[, start]) 从start开始计算相对路径
os.path.samefile(path1, path2) 判断目录或文件是否相同
os.path.sameopenfile(fp1, fp2) 判断fp1和fp2是否指向同一文件
os.path.samestat(stat1, stat2) 判断stat tuple stat1和stat2是否指向同一个文件
os.path.split(path) 把路径分割成 dirname 和 basename,返回一个元组
os.path.splitdrive(path) 一般用在 windows 下,返回驱动器名和路径组成的元组
os.path.splitext(path) 分割路径,返回路径名和文件扩展名的元组
os.path.splitunc(path) 把路径分割为加载点与文件
os.path.walk(path, visit, arg) 遍历path,进入每个目录都调用visit函数,visit函数必须有3个参数(arg, dirname, names),dirname表示当前目录的目录名,names代表当前目录下的所有文件名,args则为walk的第三个参数
os.path.supports_unicode_filenames 设置是否支持unicode路径名

参考资料

Python endswith()方法 | 菜鸟教程

Python os.listdir() 方法 | 菜鸟教程

Python OS 文件/目录方法 | 菜鸟教程

使用python合并多个pdf文件

python3 下载 并 保存 pdf_huoxingd的博客-CSDN博客_python下载pdf

【学习笔记】Python之 pdf 下载、合并相关推荐

  1. Python学习笔记---merge和concat数据合并(1)

    Python学习笔记-merge和concat数据合并(1) Python学习笔记-merge和concat数据合并(2) 文章目录 Python学习笔记---merge和concat数据合并(1) ...

  2. APPCAN学习笔记005---AppCan IDE安装下载,AppCan IDE启动

    APPCAN学习笔记005---AppCan IDE安装下载,AppCan IDE启动 创梦技术交流平台:资源下载,技术交流,网络赚钱: 交流qq群:1群:248318056 2群:251572072 ...

  3. oracle拆分分区语法详解大全_学习笔记:Oracle分区表 添加 删除 合并 删除 交换 拆分等分区表的操作案例...

    天萃荷净 Oracle分区表管理,记录关于Oracle分区表的管理案例:创建.删除.合并.拆分.交换.更改分区表的操作方法 1.添加创建分区表 1.1)增加分区(add partition) 语法是: ...

  4. python语言的33个保留字的基本含义_Python学习笔记——Python的33个保留字及其意义,python,pythone33,含义...

    Python学习笔记--Python的33个保留字及其意义,python,pythone33,含义 发表时间:2020-03-27 笔记走起 正文 序号 保留字 含义 1 and 用于表达式运算,逻辑 ...

  5. TI CC2530 学习笔记-0-IAR 8.10下载与安装

    TI CC2530 学习笔记-目录 TI CC2530 学习笔记-0-IAR 8.10下载与安装 IAR 8.10下载:IAR8.10 for 8051 IAR 安装:安装教程

  6. Python学习笔记——Python的下载与安装

    python官方主页:https://www.python.org/downloads/ 下载自己系统的最新版本的安装包(installer). 以windows系统64位为例,下载的版本3.9.6( ...

  7. python办公自动化pdf下载,你们都用Python实现了哪些办公自动化?

    处理Excel.Word.PDF等常用办公软件,处理CSV文件和JSON数据,从Web抓取网络信息,批量处理大量图片,发送电子邮件和短信等等,用Python都可以轻松完成! 光说不练假把式,人邮君举几 ...

  8. python王者归来 pdf下载_OpenStack开源云王者归来 PDF

    给大家带来的一篇关于OpenStack相关的电子书资源,介绍了关于OpenStack.开源云方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小315279 MB ,戢友编写,目前豆瓣.亚马 ...

  9. [学习笔记]python

    一些屁话 对于学习,我觉得要带有目的的去学,这样效率才会提高,我学一样技能肯定是要去完成一件事,不然我学习了干什么呢,学编程语言也是一样,我个人学习python的初衷是看到一些大神写的爬虫,当时就觉得 ...

最新文章

  1. 长沙网络推广教你如何在网站优化中让URL标准化?
  2. k8s项目(弹性云实战)
  3. 网管,待遇为何如此差劲?
  4. MLSQL解决了什么问题
  5. java掠夺_Editing Java版指南/村庄与掠夺 (section)
  6. 前端主流的 Javascript,缺失了哪些技能?
  7. 设计模式-05.建造者模式与模板方法模式比较
  8. Thinkphp添加图片全屏水印
  9. 项目一——电子通讯录
  10. 实时消息传输协议 RTMP(Real Time Messaging Protocol)
  11. [转载]耗散结构理论与生住坏灭--开放.平衡.涨落.突变.
  12. ARCGIS格式转CAD时保留其图层、高程及颜色的方法
  13. 从柯布-道格拉斯生产函数看云计算对传统软件工程的影响
  14. 数学建模之马尔萨斯模型(入门版)
  15. 饥荒开服 - 腾讯云轻量服务器
  16. ubuntu安装armadillo说明
  17. 专利发票下载 实用新型发明专利,外观专利,软著,发明专利的区别
  18. 关于echarts地图只标注指定城市名的显示的问题
  19. win10 解决.net framework 3.5 安装报错 0x800F0954问题
  20. 2022年安徽建筑施工电工(建筑特种作业)模拟试题及答案

热门文章

  1. 台积电全球员工薪酬中位数约46万,CEO约899万;苹果上调日本的 iPhone 售价 ;Vim 9.0 发布|极客头条...
  2. 大神李沐被曝离职亚马逊,投身大模型创业!网友:“AI 已成创业致富新思路?”...
  3. 网易音乐网站系统|前后端分离springboot+vue实现在线音乐网站
  4. 手机版会员中心html,会员中心.html
  5. 带有富文本数据如何导出word文档(使用mht模板)
  6. 抓取淘宝天猫的商品的促销价格
  7. 前端可以用到的渐变色代码
  8. 618蓝牙耳机选哪一款比较好?推荐口碑最好的无线蓝牙耳机品牌
  9. 2021全国特种设备-Q2起重机司机模拟考试题库一[安考星]
  10. Unity TimeLine使用详解 (自认为)