一、说明

本篇记录一个自己享用的简单工具。在大量阅读网上文章中,常常遇到一个专题对应多篇文章,用浏览器的收藏根本不够。能否见到一篇文章具有搜藏价值,就转到线下,以备日后慢慢消化吸收。这里终于找到一个办法,将在线网页用python转化成pdf。

二、环境需要

wkhtmltopdf 是一个开源命令行工具,使用 Qt WebKit 渲染引擎将 HTML 文件渲染成 PDF。

为了在 Python 中使用它,我们还需要 pdfkit 库,它是 wkhtmltopdf 实用程序的包装器。

首先,为您的操作系统搜索 wkhtmltopdf 安装程序。对于 Windows,您可以在此处找到最新版本的 wkhtmltopdf 安装程序。只需下载 .exe 文件并在您的计算机上安装即可。

wkhtmltopdf下载路径是: here.

需要记住安装目录的路径。在我的例子中是:C:\Program Files\wkhtmltopdf

pdfkit需要安装 Python 库,请打开“命令提示符”(在 Windows 上)并使用以下代码安装它:

    pip install pdfkit

三、制作一个示例HTML文件

为了继续演示本教程,我们需要使用一些 HTML 文件。这是我们将在本教程中使用的示例 sample.html 文件:

<!DOCTYPE html>
<html lang="en"><head><meta charset="UTF-8"><title>Hello!</title></head><body><h1>Welcome to my YouTube channel!</h1><p>This is a sample HTML file.</p></body></html>

在你的浏览器中打开,你应该看到:

四、如何将html转化成pdf文件

首先,我们需要找到 wkhtmltopdf 可执行文件 wkhtmltopdf.exe 的路径

回想一下,我们安装在 C:\Program Files\wkhtmltopdf 中,这意味着 .exe 文件位于该文件夹中。exe

现在我们拥有了所需的一切,并且可以使用 Python 轻松地将 HTML 文件转换为 PDF,代码如下:

import pdfkit#Define path to wkhtmltopdf.exe
path_to_wkhtmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'#Define path to HTML file
path_to_file = 'sample.html'#Point pdfkit configuration to wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_to_wkhtmltopdf)#Convert HTML file to PDF
pdfkit.from_file(path_to_file, output_path='sample.pdf', configuration=config)

注意:这里关键用了pdfkit.from_file函数。

sample.html 文件位于与 main.py 文件相同的目录中:

执行文件main.py

    python3 mian.py 

将输出pdf文件:

五、把在线 Web-page转化成PDF

使用 pdfkit 库,您还可以使用 Python 将在线网页转换为 PDF。

在本节中,我们将重用上一节中的大部分代码,除了现在我们将使用网页的 URL 和 pdfkit 类的 .from_url() 方法而不是使用 HTML 文件:

对应的python代码:

import pdfkit#Define path to wkhtmltopdf.exe
path_to_wkhtmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'#Define url,可以指向您要转化的主页url
url = 'https://wkhtmltopdf.org/'#Point pdfkit configuration to wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_to_wkhtmltopdf)#Convert Webpage to PDF
pdfkit.from_url(url, output_path='webpage.pdf', configuration=config)

注意:这里关键用了pdfkit.from_url函数。

六、结论

在本文中,我们探讨了如何使用 Python 和 wkhtmltopdf 将 HTML 转换为 PDF。您可以结合爬虫或其它批量工具,能够实现大量资料的转化。方便阅读查询。

【python知识】win10下如何用python将网页转成pdf文件相关推荐

  1. Python编程:使用wkhtmltopdf将html网页转成pdf文件

    官网:https://wkhtmltopdf.org/ github: https://github.com/wkhtmltopdf/wkhtmltopdf Mac环境: brew install C ...

  2. python怎么变成文档_python3如何将docx转换成pdf文件

    本文实例为大家分享了python3将docx转换成pdf文件的具体代码,供大家参考,具体内容如下 直接上代码 # -*- encoding:utf-8 -*- """ a ...

  3. 1604_linux环境下使用命令行把网页转换成pdf

    全部学习汇总: GreyZhang/toolbox: 常用的工具使用查询,非教程,仅作为自我参考! (github.com) 使用的工具很容易在彼此之间产生隔离性障碍,比如我最近使用的墨水屏阅读的最合 ...

  4. windows下如何用python控制打印机打印_巧用win32print来控制windows系统打印机并推送打印任务...

    小爬最近的一个需求是:将windows系统下的打印任务批量有序给到网络打印机. 用户先从公司的OA(B/S模式)系统下 打印指定内容的表单以及表单中的附件内容.这个问题可以这样分解: 1.抓包,得到O ...

  5. python小助手_如何用python写个人专属群聊提醒小助手?

    前言 大家还记得教会父母玩微信是什么时候吗?父母学会后,我们的生活就发生了「质」的变化,父母也许会吐槽你的微信头像不好,要你换一个头像. 最近 pk哥 又被母后大人吐槽了,原因是亲戚微信群里某个亲戚生 ...

  6. 用Python+PIL将目录下jpg图像批量转成pdf文件

    一.引言 最近单位有个事,需要将一堆图片文件先转成pdf文件,同事下了个windows下的图形软件,但要一个个转,几百个jpg文件,太过麻烦,因此想用Python批量来做.一查,图像处理库PIL库可以 ...

  7. python命令提示符窗口在哪里_详解python命令提示符窗口下如何运行python脚本

    以arcgispro的python脚本为例在arcgispro自带的python窗口下运行python脚本 需求: 将arcgispro的.aprx项目包中gdb的数据源路径更换为sde数据源路径. ...

  8. keil生成hex文件找不到_骚操作!用Python把公众号文章打包成pdf文件,再也不怕找不到了...

    背景 做自媒体的人,尤其是做了一年甚至更久的自媒体人,尤其是通过自媒体还有一些小收入的人,他们最怕自己的公众号内容因为各种原因而丢失,那就太可怕了! 在做自媒体内容上花了太多心血,如果突然一下就没了, ...

  9. 用python画圣诞树、樱花树、卡通图案及打包成exe文件

    文章目录 用python画圣诞树.樱花树.卡通图案及打包成exe文件 效果 1.圣诞树--朴素 2.圣诞树--可爱 3.圣诞树--飘雪 4.樱花树--飘落效果 5.樱花树--暖色调 6.哆啦a梦 用p ...

最新文章

  1. fir抽取滤波器matlab,Xilinx FPGA之抽取FIR滤波器的实现
  2. javascript实现小九九乘法口诀
  3. 腾讯,百度,网易游戏,华为笔面经验
  4. window命令查看cpu核数_win7如何查内存条型号机CPU 信息【通过命令来查看】
  5. 购买台式计算机方案,购买电脑的注意事项有哪些?
  6. 办公室健康小贴士(转)
  7. STL标准模版库---set操作
  8. STM32电机库(ST-MC-Workbench)学习记录——电机参数及传感器设置
  9. Excel教程数据透视表系列案例二十二
  10. vsCode配置vue模板一键生成
  11. 图书信息管理系统(c语言)
  12. 适合记录日常工作的便签如何在电脑桌面上添加
  13. SAR影像辐射定标工程化实现之COSMO-Skymod
  14. EFCore-脚手架Scaffold发生Build Failed问题的终极解决
  15. python爬虫工程师面试自我介绍范文_计算机工程师面试自我介绍范文五篇
  16. 收藏--真正爱你的男人
  17. IDEA提示方法参数的快捷键
  18. 怎样压缩PDF文件体积?
  19. 软考-高级项目管理(二十)
  20. 原始投资100美元,C语言实现单利息投资和复合利息投资

热门文章

  1. 白化深度学习与tensorflow——强化学习
  2. 靠谱的录屏软件 + mp4格式转换软件
  3. Adobe Photoshop 2021 22.1.1.138中文版(win/mac)
  4. 未来智安XDR荣膺ISC 2022创新能力百强
  5. 区分java的三大版本:JavaSE、JavaME、JavaEE
  6. 在maven官网下载maven历史版本
  7. 微信小程序发布时需要校验违法违规内容、图片,Java后端接口
  8. 我的周刊(第042期)
  9. 【金猿人物展】数睿数据创始人兼CEO穆鸿:大数据价值创造关键在于应用普惠...
  10. Linux通过df命令查看显示磁盘空间满,但实际未占用问题