python将网页保存为pdf,python-网页保存为pdf

今天用到是python的一个第三方库: pdfkit

pdfkit 是一个十分强大的第三方库，只需要把网页的url(需要登录或其他特殊方式才能访问的除外)传入，仅靠它自己就能将网页保存为pdf。当然，pdfkit 库也支持文件和源码的传入，同样能将获取到的保存为pdf。

使用工具：pdfkit

环境准备：

搭建python开发环境

在cmd下运行下面的命令

pip install pdfkit

源码讲解环节

好的，下面就是喜闻乐见的源码讲解环节了(´◔౪◔)

import requests

import pdfkit

# 直接访问url

# 一篇新浪博客的url

url = 'http://blog.sina.com.cn/s/blog_4b0f52990102z24g.html'

# 这里指定一下wkhtmltopdf的路径，这就是我为啥在前面让记住这个路径

confg = pdfkit.configuration(wkhtmltopdf=r'F:\13-wkhtmltopdf\wkhtmltopdf\bin\wkhtmltopdf.exe')

pdfkit.from_url(url, 'test1.pdf', configuration=confg)

# 用requests爬取到的网页代码生成pdf

header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"}

r = requests.get(url, headers=header)

# 爬取中文时为乱码，需要添加

r.encoding = 'utf-8'

r = r.text

with open('index.html', 'w', encoding='utf-8')as f:

f.write(r)

print('源码保存完毕')

print('开始从源码生成pdf文件')

pdfkit.from_string(r, 'test2.pdf', configuration=confg)

print('开始从文件源代码生成pdf文件')

pdfkit.from_file("index.html", 'test3.pdf', configuration=confg)

效果展示

那么本次的分享就在这里了，喜欢的话麻烦点赞关注一下

不喜欢的话可以去看下小编的其他文章，肯定有喜欢的

都不喜欢的话可以点个关注，万一以后有喜欢的呢(๑•̀ㅂ•́)و✧

python将网页保存为pdf,python-网页保存为pdf相关推荐

Python编程：使用wkhtmltopdf将html网页转成pdf文件
官网:https://wkhtmltopdf.org/ github: https://github.com/wkhtmltopdf/wkhtmltopdf Mac环境: brew install C ...
Python将网页转化为PDF(python网页自动长截图)
初次实践:python网页自动截图步骤如下: (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium (2) 检查Chrome浏览器 ...
python保存html图_如何保存“完整网页”不仅仅是使用Python的基本HTML
我使用以下代码使用 Python保存网页: import urllib import sys from bs4 import BeautifulSoup url = 'http://www.vodaf ...
python批量访问网页保存结果_Python静态网页爬取：批量获取高清壁
前言在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...
AI加速信息和知识获取速度，使用Python对MD格式文件和HTML网页进行内容摘要，2023年4月AI网页内容摘要工具大全
在信息时代,获取知识变得至关重要.然而,有时候信息的数量是如此之大,以至于人类无法有效处理.这就是人工智能(AI)能够做出贡献的地方.通过AI,我们可以快速地找到并理解文章的核心观点和重要信息.下面将 ...
python爬虫怎么爬同一个网站的多页数据-如何用Python爬数据？（一）网页抓取
如何用Python爬数据?(一)网页抓取你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求我在公众号后台,经常可以收到 ...
python爬网站数据实例-如何用Python爬数据？（一）网页抓取
如何用Python爬数据?(一)网页抓取你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求我在公众号后台,经常可以收到 ...
python抓取网站重要url_[Python]网络爬虫（一）：抓取网页的含义和URL基本构成
一.网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一 ...
python提取网页表格信息_python 提取网页表格数据库数据库
python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库网络通用urllib -网络库(stdlib). ...
python读取网页表格数据库_python 提取网页表格数据库数据库
python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库网络通用urllib -网络库(stdlib). ...

python将网页保存为pdf,python-网页保存为pdf

python将网页保存为pdf,python-网页保存为pdf相关推荐

最新文章

热门文章