环境简介

wkhtmltopdf可以直接把任何一个可以在浏览器中浏览的网页直接转换成一个pdf,首先说明一下它不是一个python库,而是一个把html页面转换成pdf的一个软件,我们需要在系统上安装它。

Ubuntu 16.04 安装wkhtmltopdf

$ sudo apt-get install wkhtmltopdf

然后Python需要使用这个软件需要再安装一个库

sudo pip3 install pdfkit

pdfkit使用示例

参考文档

一个简单的例子:

import pdfkit

pdfkit.from_url('http://google.com', 'out.pdf')

pdfkit.from_file('test.html', 'out.pdf')

pdfkit.from_string('Hello!', 'out.pdf')

你也可以传递一个url或者文件名列表:

pdfkit.from_url(['google.com', 'yandex.ru', 'engadget.com'], 'out.pdf')

pdfkit.from_file(['file1.html', 'file2.html'], 'out.pdf')

其他使用方式请参照pdfkit参考文档

参考代码

def html2pdf(url,tag,name,value):

html=requests.get(url).content

bsObj=BeautifulSoup(html,'html.parser')

title=bsObj.h1

content=bsObj.find(tag,{name:value})

content.insert(1,title)

filename=content.h1.get_text()

html=html_template.format(content=content)

html = html.encode("utf-8")

with open(filename+'.html', 'wb') as f:

f.write(html)

pdfkit.from_file(filename+'.html',filename+'.pdf',options=options)

华裳绕指柔, 版权所有丨如未注明 , 均为原创|转载请注明利用Python将网页保存为PDF文件!

python将网页保存为pdf,利用Python将网页保存为PDF文件相关推荐

  1. python生成word 带目录_利用python程序生成word和PDF文档的方法

    一.程序导出word文档的方法 将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob.Apache POI.Java2Word.iText等各种方式,以及使用fr ...

  2. 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...

    数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...

  3. python根据url下载数据_利用Python如何实现根据URL地址下载并保存文件至对应目录...

    利用Python如何实现根据URL地址下载并保存文件至对应目录 发布时间:2020-11-16 14:23:11 来源:亿速云 阅读:58 作者:Leah 这篇文章将为大家详细讲解有关利用Python ...

  4. python实现背景抠除_利用Python代码实现一键抠背景功能

    这篇文章主要给大家介绍了关于如何利用Python代码实现一键抠背景的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧 前 ...

  5. python爬取网易云_利用python爬取网易云音乐,并把数据存入mysql

    作者:sergiojune Python爱好者社区--专栏作者 个人公众号:日常学python 专注python爬虫,数据可视化,数据分析,python前端技术 公众号:Python爱好者社区 获取本 ...

  6. python 打卡程序_如何利用Python实现自动打卡签到

    需求描述 我们需要登录考勤系统(网页端,非手机端)进行签到,如果不想每天都早早起来打卡签到,就可以通过写程序实现这一功能. 业务梳理 通过长时间的早起打卡签到发现规律,我每天只是不停的点击,签到,都是 ...

  7. python识别图片文字_如何利用Python识别图片中的文字

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

  8. python交互式日历制作图片_2.利用Python制作电子版电影台历

    2020嗖的一下就要过去了,想买一个豆瓣电影台历,官方价格是98,想着有点贵,就想利用学习的Python制作一个电子版的台历,效果图如下 非周六周日 带Tips 周六周日 界面整体的布局:头部仿台历便 ...

  9. python用渐变色画圆_利用python控制Autocad:pyautocad方式

    发现pyautocad模块:可以用python控制autocad的包.今天把文档中的重点内容摘录出来,以后绘图.计算大工程量.或者识别施工图的时候时候也许可以用到. 一.连接cad pyautocad ...

  10. python爬去百度文库_利用Python语言轻松爬取数据[精品文档]

    利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...

最新文章

  1. 冒号课堂 编程范式与OOP思想
  2. GO小知识之实例演示 json 如何转化为 map 和 struct
  3. D. Solve The Maze Codeforces Round #648 (Div. 2)
  4. mysql数据库查询语句过程_mysql(一) SQL查询语句执行过程
  5. javascript布尔值_JavaScript布尔值通过上法庭进行解释
  6. python中list 和array的区别
  7. 数据库连接配置 app.config web.config
  8. 手机号星号_word把个人信息中的手机号其中四位设成星号的操作步骤图解
  9. for循环在c++中的用法_C ++中的循环
  10. 最大矩形面积(C++实现)
  11. android简单小游戏开发工具,傻瓜化开发Android小游戏
  12. jQuery fadeIn淡入的使用
  13. C++ 解析器--cint
  14. 物联网已经发展多年,为什么一直不温不火
  15. java 时间戳 什么意思_java时间与时间戳
  16. linux添加扩展gpio,嵌入式Linux工控板的ISA总线GPIO扩展
  17. 空间数据可视化地图绘制R语言可复现
  18. 【10位时间戳转换日期公式】
  19. Codeforces Beta Round #7
  20. 手机模拟器自带root_手机没root权限,用这款软件轻松让手机有root权限

热门文章

  1. idea创建vue模板
  2. 史上最好用的GIF工具——ScreenToGif
  3. QNX系统开启telnet远程登录
  4. 海南师范大学本科毕业论文答辩PPT模板
  5. 字节游戏测试开发面试题
  6. 计算机酷我音乐文件夹,酷我音乐缓存文件在哪?打开酷我音乐缓存文件的方法...
  7. 软件开发的版本控制管理
  8. python rgb565_RGB565的转换
  9. RGB888和RGB565颜色对照表
  10. 摄氏度符号英文计算机语言,温度表示-摄氏度怎样用英文表示温度?给几个例子,好吗? 爱问知识人...