网页转换成PDF

  • 1、引言
  • 2、代码实战
    • 2.1 模块介绍
      • 2.1.1 pdfkit
    • 2.2 安装
    • 2.3 代码实例
      • 2.3.1 URL 对应网页转 PDF
      • 2.3.2 HTML 文件转 PDF
      • 2.3.3 字符串转 PDF
    • 2.4 拓展
      • 2.4.1 网页转换PDF
      • 2.4.2 网页转换图片
  • 3、总结

1、引言

小鱼:小屌丝,你这是干啥呢?
小屌丝:我的女神想要这个网页的内容。
小鱼:那你也不能这一点点的复制粘贴啊,
小屌丝:为了我的女神,再辛苦我都愿意…
小鱼:咱能不能man一点,你直接把网页内容爬下来不就完事了,
小屌丝:我的女神还要把这些内容转换成PDF,
小鱼:你的女神事可真多…
小屌丝:鱼哥,你有什么好的法子吗?
小鱼:嗯,办法嘛,确实有
小屌丝:我懂。
小鱼:…上道这么快,果然为了你的女神,你什么都舍得,我也不磨叽了,直接上教程。

2、代码实战

关于网页的内容转换成PDF,通常思路:

  • 爬取网页内容
  • 保存到本地
  • 转换成PDF文档

这种方法, 确实可以实现,但是,很麻烦,需要转两次。
而今天,小鱼给大家分享的方法,就3行代码,一次搞定。

2.1 模块介绍

2.1.1 pdfkit

pdfkit 是把 HTML+CSS 格式的文件转换成 PDF 的一种工具,它是 wkhtmltopdf 这个工具包的 python 封装。

2.2 安装

pip install pdfkit

其它安装方式,直接看这两篇:

Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!
Python3:我低调的只用一行代码,就导入Python所有库!

敲黑板:
pdfkit 是基于 wkhtmltopdf 的封装,所以需要先安装 wkhtmltopdf 。

wkhtmltopdf官网:https://wkhtmltopdf.org/

2.3 代码实例

2.3.1 URL 对应网页转 PDF

代码示例:

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJimport pdfkit'URL 对应网页转 PDF'
#wkhtmltopdf.exe 为本地安装的路径
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_url参数,转换PDF
pdfkit.from_url(r'https://blog.csdn.net/wuyoudeyuer?type=blog', 'Carl_奕然.pdf', configuration=config)

运行结果:

2.3.2 HTML 文件转 PDF

代码示例:

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJimport pdfkit'HTML 文件转 PDF'
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_file参数,转换PDF
pdfkit.from_file(r'D:\Carl_奕然的博客.html, 'Carl_奕然.pdf', configuration=config)

敲黑板
读取html,需要调用pdfkit.from_file 参数。

2.3.3 字符串转 PDF

代码示例:

# -*- coding:utf-8 -*-
# @Time   : 2022-06-12
# @Author : carl_DJimport pdfkit'字符串转 PDF'
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_file参数,转换PDF
pdfkit.from_string(r'Ilike wangxinling, 'Carl_奕然.pdf', configuration=config)

运行结果

2.4 拓展

小屌丝:鱼哥,如果我不想写代码,能不能一键转换成PDF呢?
小鱼:嗯,这个可以实现,但是不能一键,必须一行代码。
小屌丝:也行,能少些一行是一行。

2.4.1 网页转换PDF

开篇小鱼也说过:pdfkit 是基于 wkhtmltopdf 的封装,所以功能肯定也是基于 wkhtmltopdf 的。
于是乎,我们就能先到,直接用wkhtmltopdf 的功能,看看能否实现PDF转换。
代码示例

  • 第一步、找到wkhtmltopdf的安装路径,以小鱼的为例:
    D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe
  • 第二步、powershell打开,输入命令
    .\wkhtmltopdf.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.pdf

运行结果

解析

  • .\wkhtmltopdf.exe :调用wkhtmltopdf.exe
  • https://blog.csdn.net/wuyoudeyuer?type=blog:url地址
  • D:\carl.pdf:保存的路径

2.4.2 网页转换图片

代码示例
我们来试一下网页转换成图片,
同样,
第一步、打开powershell,进入到bin文件夹下
第二步、输入命令:.\wkhtmltoimage.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.png

运行结果

3、总结

今天的分享,就到这里了。
是不是奇奇怪怪的姿势,又增加了呢。
我们总结一下今天的内容:
pdfkit 可以可以实现的转换

  • URL 对应网页转 PDF
  • html文件转 PDF
  • 字符串转 PDF

wkhtmltopdf.exe可以实现的转换:

  • 网页转图片
  • 网页转 PDF

所以,学会了这个第三方库,就实现了直接转换成PDF的方法。
最后,
关注小鱼博客,带你学习更多关于python第三方库的知识。

Python3,2行代码,多种方法,直接把网页内容转换成PDF文档和图片。相关推荐

  1. 用什么方法可以将Word转换成PDF文档?

    我们有时编辑完Word文件需要打印或发送给他人查看,一般会先转换为PDF格式,这样在别的电脑上打开时就不会出现格式的变动,也不会出现因为版本而无法打开的问题,那么用什么方法可以将Word转换成PDF文 ...

  2. 扫描件怎么转换成pdf文档?快来了解下手机扫描的方法

    在现代社会中,电子文档已经成为了我们日常生活中不可或缺的一部分.扫描件转换成PDF文档是其中一个非常重要的方面.那么,如何将扫描件转换成PDF文档,以及在手机上有哪些扫描的方法呢? 将扫描件转换为PD ...

  3. 水晶报表使用经验谈1--建立水晶报表第一步及编译最易出现错误的解决方法及报表转换成pdf文档进行打印方法...

    初用水晶报表(vs .net2003集成,版本Version=9.1.5000.0) 装好后要注册 注册号:6707437608 密码:AAP5GKS0000GDE100DS 想要在.aspx文件中使 ...

  4. excel中html批量转化为pdf文件,批量将Excel转换成pdf文档的方法

    在我们办公过程中建立各种表格都喜欢用excel软件,特别是那些人事部的同事,将数据存储好之后,因为担心他人修改我们的数据,所以会选择将excel文件转换成比较难以编辑的pdf文件.可是,excel如何 ...

  5. 文字图片转换成word文档的方法?

    在很多情况下,我们都想把图片上的文字转成word文档文字,但是由于没有好的方法,能不转换的就不转换,比如说图片上的文字比较少,通常的做法就是手动输入到word文档中,要是图片上的是文章,在没有必要的情 ...

  6. 实现pdf图片格式转换成txt文档的方法

    怎样才能将PDF转换成TXT文本? 遇到PDF与TXT转换的问题,我们该怎么办呢?之前尝试过手动用键盘打字,但是花费了很多的时间,完全不符合现代社会人的节奏,在这里,我主要讲解一种方法,就是关于如何从 ...

  7. 如何把PDF转换成Word文档?这几种方法看一遍就会

    怎么把PDF文件转换成Word文档呢?大家在日常的学习和工作中可能经常需要处理各种文件,相信使用的最多的文件格式就是PDF文件和Word文档了,因为用它们来传输文件和编辑文件非常好用.但有时我们收到的 ...

  8. 怎么把图片文字转换成word文档?介绍一个方法

    怎么把图片文字转换成word文档?这类问题在我们整理查找资料时最常见,因为很多信息都以图片形式展示了出来,我们在归纳时如果将其转换成文字在转成Word,就更易于日后编辑查看.而今天跟大家分享的是直接将 ...

  9. 快速修改PDF文档中图片的方法

    在我们日常的工作或学习中,遇到的PDF文档往往都会有图片,当我们需要修改PDF文档里的图片的时候,大伙儿是怎么处理的呢?是将PDF转换成Word文档后再提取图片修改后插入文档吗?其实有更简单的方法,今 ...

  10. 怎么把图片文字转换成word文档?这个方法了解一下

    在现代的生活中,我们经常需要将图片中的文字转换成Word文档,以方便我们编辑和处理文本.虽然在电脑上进行这项工作很容易,但是在手机上可能会有些困难.在本文中,我们将介绍一些在手机上将图片文字转换成Wo ...

最新文章

  1. 阿里二面:Redis 中的 AOF 文件太大了怎么办?
  2. TinyML:下一轮人工智能革命
  3. JavaScript强化教程——jQuery选择器
  4. 在linux学习中遇到的问题
  5. 张高兴的 .NET Core IoT 入门指南:环境配置、Blink、部署
  6. 在中断程序里修改全局变量的童鞋注意啦~(C中的volatile作用 转载~)
  7. 【LeetCode笔记 - 每日一题】519. 随机翻转矩阵(Java、随机、双指针)
  8. 实现机器学习的循序渐进指南X——KMeans
  9. git submodule子模块管理
  10. 关于清除贴图与光域网路径
  11. 嵌入式操作系统风云录:历史演进与物联网未来.
  12. python学习笔记|SQLite数据库基本知识
  13. gl常用库函数,glu常用库函数 简介
  14. ember controller内调用save修改model数据时出现null的解决方案
  15. android 图片置顶,Android布局图片置顶
  16. C语言---数组排序
  17. 小猫钓鱼纸牌游戏java_java实现纸牌游戏之小猫钓鱼算法
  18. 【 Vue 】暗黑模式切换
  19. HTML5期末大作业:个人空间相册网页设计 (6页) HTML+CSS+JavaScript
  20. 使用c语言计算3阶行列式

热门文章

  1. 易打卡模板微信签到打卡小程序源码
  2. 全网目前最全python例子(附源码)
  3. python定量城市研究_借助Python来实现的定量城市研究
  4. mysql添加字段 说明_MYSQL数据库MSSQL 添加字段说明
  5. 区块链ppt资料准备
  6. catia二次开发:IDE界面介绍
  7. TestStand自定义报表生成-添加列
  8. Javascript回显图片
  9. 基于ssm的超市进销存管理系统
  10. 苹果电脑怎么进入虚拟服务器设置,苹果Mac电脑 Vmware虚拟机共享文件夹设置教程...