今天用到是python的一个第三方库: pdfkit

pdfkit 是一个十分强大的第三方库,只需要把网页的url(需要登录或其他特殊方式才能访问的除外)传入,仅靠它自己就能将网页保存为pdf。当然,pdfkit 库也支持文件和源码的传入,同样能将获取到的保存为pdf。

使用工具:pdfkit

环境准备:

搭建python开发环境

在cmd下运行下面的命令

pip install pdfkit

源码讲解环节

好的,下面就是喜闻乐见的源码讲解环节了(´◔౪◔)

import requests

import pdfkit

# 直接访问url

# 一篇新浪博客的url

url = 'http://blog.sina.com.cn/s/blog_4b0f52990102z24g.html'

# 这里指定一下wkhtmltopdf的路径,这就是我为啥在前面让记住这个路径

confg = pdfkit.configuration(wkhtmltopdf=r'F:\13-wkhtmltopdf\wkhtmltopdf\bin\wkhtmltopdf.exe')

pdfkit.from_url(url, 'test1.pdf', configuration=confg)

# 用requests爬取到的网页代码生成pdf

header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"}

r = requests.get(url, headers=header)

# 爬取中文时为乱码,需要添加

r.encoding = 'utf-8'

r = r.text

with open('index.html', 'w', encoding='utf-8')as f:

f.write(r)

print('源码保存完毕')

print('开始从源码生成pdf文件')

pdfkit.from_string(r, 'test2.pdf', configuration=confg)

print('开始从文件源代码生成pdf文件')

pdfkit.from_file("index.html", 'test3.pdf', configuration=confg)

效果展示

那么本次的分享就在这里了,喜欢的话麻烦点赞关注一下

不喜欢的话可以去看下小编的其他文章,肯定有喜欢的

都不喜欢的话可以点个关注,万一以后有喜欢的呢(๑•̀ㅂ•́)و✧

python将网页保存为pdf,python-网页保存为pdf相关推荐

  1. Python编程:使用wkhtmltopdf将html网页转成pdf文件

    官网:https://wkhtmltopdf.org/ github: https://github.com/wkhtmltopdf/wkhtmltopdf Mac环境: brew install C ...

  2. Python将网页转化为PDF(python网页自动长截图)

    初次实践:python网页自动截图 步骤如下: (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium (2) 检查Chrome浏览器 ...

  3. python保存html图_如何保存“完整网页”不仅仅是使用Python的基本HTML

    我使用以下代码使用 Python保存网页: import urllib import sys from bs4 import BeautifulSoup url = 'http://www.vodaf ...

  4. python批量访问网页保存结果_Python静态网页爬取:批量获取高清壁

    前言 在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤 一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...

  5. AI加速信息和知识获取速度,使用Python对MD格式文件和HTML网页进行内容摘要,2023年4月AI网页内容摘要工具大全

    在信息时代,获取知识变得至关重要.然而,有时候信息的数量是如此之大,以至于人类无法有效处理.这就是人工智能(AI)能够做出贡献的地方.通过AI,我们可以快速地找到并理解文章的核心观点和重要信息.下面将 ...

  6. python爬虫怎么爬同一个网站的多页数据-如何用Python爬数据?(一)网页抓取

    如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...

  7. python爬网站数据实例-如何用Python爬数据?(一)网页抓取

    如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...

  8. python抓取网站重要url_[Python]网络爬虫(一):抓取网页的含义和URL基本构成

    一.网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一 ...

  9. python提取网页表格信息_python 提取网页表格数据库数据库

    python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库 网络 通用urllib -网络库(stdlib). ...

  10. python读取网页表格数据库_python 提取网页表格数据库数据库

    python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库 网络 通用urllib -网络库(stdlib). ...

最新文章

  1. 近朱者赤,近墨者还是赤
  2. Javascript对象的查询字符串编码
  3. sql array 数组基本用法(三)
  4. Fegion-4解决Fegion第一次请求timeout的问题
  5. 计算机科学考试大纲,计算机科学与技术考试大纲.doc
  6. “你的深度学习框架包含15个漏洞”,360说 | 附论文
  7. 2017年值得学习的3个CSS特性
  8. 解决:Ubuntu18.04配置exoprt LC_ALL=C后无法打开终端
  9. Java 7:最新特性更新、代码示例及性能测试
  10. gpgga格式读取MATLAB,gpgga数据格式
  11. 怎么把电脑图片转文字?只需这几步就可以截图转文字
  12. 搭建VC2010 开发环境,创建《C语言实现俄罗斯方块游戏》教程
  13. 人工智能 —— 计算智能概述
  14. 动易CMS从word复制粘贴公式
  15. 恶意软件清理助手1.94使用后的问题
  16. 学生奖学金评定系统c语言,学生奖学金评定系统.doc
  17. C++ 使用Poco库进行文件操作
  18. pandas 报错 KeyError: 0
  19. 纸本书变电子书是很小的事——詹宏志谈数字出版时代
  20. python学习知识点

热门文章

  1. IDEA初始jsp模板和修改jsp模板
  2. Linux查 ssh端口号
  3. php可以用wamp哪个好,PHPWAMP好吗?phpwamp怎么用?PHPWAMP和其他集成环境有什么区别吗??...
  4. 答题小程序 服务器,开源的基于云开发的在线答题小程序
  5. 版本控制/文件管理系统SVN命令整理:提交修改更新撤销分支
  6. 毛星云opencv第二章总结
  7. 大厂阿里程序员的薪资:简述阿里的薪酬体系和职级
  8. python修改第三方库重写_对Python第三方库,再次封装
  9. yb3防爆电机型号含义_YB3防爆电机和YBX3防爆电机的区别
  10. snownlp抛出错误_请教大家有关SnowNLP分词、词性标注、情感分析的问题