不知道你有没有这样的场景,在网页上看到一篇很好的文章,你就很想把它保存下来,并对其中重要的内容进行高亮标记。

这样的工具有很多,像「印象笔记」就可以“剪藏”网页内容到笔记中。

不过,「印象笔记」的存储空间是有限的,普通用户为60MB/月,如果保存的内容图片很多的话,能够保存的文章很有限。

这时,我们可以选择Python的第三方库pdfkit,这个模块可以将网页、html文件以及字符串生成pdf文件。

把我们想要的网页保存到本地PDF文件,再结合PDF神器(Adobe Acrobat Pro DC)高亮标记文章的重点内容,很舒服~

下面介绍一下使用pdfkit保存网页、html文件为pdf文件的具体过程。

1、使用pip安装pdfkit库

pip install pdfkit

2、安装wkhtmltopdf.exe文件

pdfkit是基于wkhtmltopdf的python封装,需要安装wkhtmltopdf.exe。wkhtmltopdf是轻量级软件,非常很容易安装。

下载地址:

https://wkhtmltopdf.org/downloads.html

下载后,保存到了如下图的目录下,这个目录可以自己选择。

将安装目录下的bin添加到环境变量的path中。

环境变量配置在Windows上的步骤依次为:右键“此电脑”->属性->高级系统设置->环境变量->系统变量->Path

以我的为例:

D:\Anaconda\wk\wkhtmltopdf\bin\

至此,完成了工具的准备及配置部分,接下来,可以上代码了。

3、使用pdfkit库生成pdf文件

网页生成pdf:pdfkit.from_url()

html文件生成pdf:pdfkit.from_file()

字符串生成pdf:pdfkit.from_string()

其中,第一个参数为准备保存的链接地址或者html文件,第二个参数为保存的文件路径。

# 导入库
import pdfkit# 这里传入我知乎专栏文章url,转换为pdf
pdfkit.from_url(r'https://zhuanlan.zhihu.com/p/90004310', 'tianzuo.pdf')
pdfkit.from_file('wenzhang.html','tianzuo1.pdf')
pdfkit.from_string('Hello Pdf!','tianzuo2.pdf')

以我的知乎文章为例,保存后的效果如下图所示,这样就可以高亮文章内容,并反复查看文章的重点了。

文中提到的PDF高亮神器,有需要的朋友可以留个言哈,或者你有啥好用的PDF工具分享给我呗~

     精 彩 文 章 

  • 用了这个方法,我下载GitHub项目速度达5MB/s!

  • 历害了!教你自己搭建一个私人网盘..

  • 10个 解放双手的 IDEA 插件,少些冤枉代码

END
最后说个题外话,相信大家都知道视频号了,随着灰度范围扩大,越来越多的小伙伴都开通了视频号。小詹也开通了一个视频号,会分享互联网那些事、读书心得与副业经验,欢迎扫码关注,和小詹一起向上生长!「没有开通发布权限的尽量多互动,提升活跃度可以更快开通哦」(听我一分钟,生活更轻松)(扫码回复 1024 即可领取IT资料包)

2行代码用 Python「剪藏」网页为 PDF相关推荐

  1. Python「剪藏」网页为 PDF

    简介 Python 的第三方库pdfkit ,这个模块可以将网页.html 文件以及字符串生成pdf文件. 把我们想要的网页保存到本地PDF文件,再结合PDF神器(Adobe Acrobat Pro ...

  2. B 站 18 岁高中生火了:历时 200 天,成功造了个机器人!Python「注入灵魂」

    来自新智元 [导读]十八岁的你在做什么?凌十七,18 岁,耗时 200 天,用树莓派 DIY 机器人.这位 B 站 up 主爆火出圈,纯手工自制塑料外壳,焊接钢架,250 行 Python 代码为其「 ...

  3. python代码翻译-10 行代码,Python 教你自制屏幕翻译工具,有逼格!!

    原标题:10 行代码,Python 教你自制屏幕翻译工具,有逼格!! 1. 场景 大家如果平常遇到不认识的英文,相信大部分的人都会复制内容后,使用翻译软件,或者拷贝到网站上去执行翻译. 当然,对于 I ...

  4. python代码翻译器-10 行代码,Python 教你自制屏幕翻译工具,有逼格!!

    原标题:10 行代码,Python 教你自制屏幕翻译工具,有逼格!! 1. 场景 大家如果平常遇到不认识的英文,相信大部分的人都会复制内容后,使用翻译软件,或者拷贝到网站上去执行翻译. 当然,对于 I ...

  5. python 数据比对 函数_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...

    原标题:1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源

  6. python爬虫代码1000行-最精简的爬虫 --仅需4行代码(python)

    最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...

  7. 最简单的爬虫代码 python_最精简的爬虫 --仅需4行代码(python)

    最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...

  8. python简单爬虫代码-最精简的爬虫 --仅需4行代码(python)

    最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...

  9. 用python画苹果的logo_简单几步,100行代码用Python画一个蝙蝠侠的logo

    转自:菜鸟学Python 简单几步,100行代码用Python画一个蝙蝠侠的logo-1.jpg (35.33 KB, 下载次数: 0) 2020-7-30 12:04 上传 蝙蝠侠作为DC漫画的核心 ...

最新文章

  1. ospf避免环路_OSPF路由协议的区域防环机制
  2. 《游戏脚本的设计与开发》-第一部分总结 文字脚本的功能扩展和一个游戏测试...
  3. ACM/ICPC2014鞍山现场赛E hdu5074Hatsune Miku
  4. 检查SELECTION-SCREEN 上面输入的参数是否合适
  5. Python爬虫学习系列教程
  6. 博客园配置windows live writer,实现本地代码高亮
  7. onu光功率多少是正常_熔融拉锥型(FBT) VS平面波导型(PLC)光分路器,如何选择?...
  8. Python菜鸟入门:day19编程学习
  9. 为什么ES模块比CommonJS更好?
  10. 基于lucene语法的实时文本搜索与匹配--Tripod
  11. SpringBoot整合Dubbo案例
  12. 怎么用python扫描主机_python 扫描内网存活主机
  13. 如何使用SPSS进行斯皮尔曼相关性分析
  14. 别把职场当官斗,聪明人都在自我成长
  15. AWB(Auto White Banlance)——自动白平衡
  16. 空指针带来的AV异常.
  17. 压敏电阻原理、参数、选型
  18. 最有效的5条改进措施
  19. 华为RS4 IP编址
  20. 《PID》一篇文章带你搞懂使用PID

热门文章

  1. 如何优雅的使用RabbitMQ?
  2. java可视化日历_Java简单可视化日历程序
  3. 微信小程序调用摄像头扫描识别二维码和条形码
  4. python中数组的维度_Python数组维度问题
  5. JavaScript 变量的生存期
  6. sql服务找不到服务器,我找不到SQL服务管理器
  7. python怎么做乘法表_python怎么写乘法表
  8. android打开网址重启后也是这个网站,千万不要乱试!iPhone只要打开这个「网址」立即崩溃重启!...
  9. C语言位于30到100之间的一个奇数,《帮你度过C语言新手阶段》系列之三
  10. php root 启动,php-fpm如何以root身份启动