python将网页保存为pdf,python-网页保存为pdf
今天用到是python的一个第三方库: pdfkit
pdfkit 是一个十分强大的第三方库,只需要把网页的url(需要登录或其他特殊方式才能访问的除外)传入,仅靠它自己就能将网页保存为pdf。当然,pdfkit 库也支持文件和源码的传入,同样能将获取到的保存为pdf。
使用工具:pdfkit
环境准备:
搭建python开发环境
在cmd下运行下面的命令
pip install pdfkit
源码讲解环节
好的,下面就是喜闻乐见的源码讲解环节了(´◔౪◔)
import requests
import pdfkit
# 直接访问url
# 一篇新浪博客的url
url = 'http://blog.sina.com.cn/s/blog_4b0f52990102z24g.html'
# 这里指定一下wkhtmltopdf的路径,这就是我为啥在前面让记住这个路径
confg = pdfkit.configuration(wkhtmltopdf=r'F:\13-wkhtmltopdf\wkhtmltopdf\bin\wkhtmltopdf.exe')
pdfkit.from_url(url, 'test1.pdf', configuration=confg)
# 用requests爬取到的网页代码生成pdf
header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"}
r = requests.get(url, headers=header)
# 爬取中文时为乱码,需要添加
r.encoding = 'utf-8'
r = r.text
with open('index.html', 'w', encoding='utf-8')as f:
f.write(r)
print('源码保存完毕')
print('开始从源码生成pdf文件')
pdfkit.from_string(r, 'test2.pdf', configuration=confg)
print('开始从文件源代码生成pdf文件')
pdfkit.from_file("index.html", 'test3.pdf', configuration=confg)
效果展示
那么本次的分享就在这里了,喜欢的话麻烦点赞关注一下
不喜欢的话可以去看下小编的其他文章,肯定有喜欢的
都不喜欢的话可以点个关注,万一以后有喜欢的呢(๑•̀ㅂ•́)و✧
python将网页保存为pdf,python-网页保存为pdf相关推荐
- Python编程:使用wkhtmltopdf将html网页转成pdf文件
官网:https://wkhtmltopdf.org/ github: https://github.com/wkhtmltopdf/wkhtmltopdf Mac环境: brew install C ...
- Python将网页转化为PDF(python网页自动长截图)
初次实践:python网页自动截图 步骤如下: (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium (2) 检查Chrome浏览器 ...
- python保存html图_如何保存“完整网页”不仅仅是使用Python的基本HTML
我使用以下代码使用 Python保存网页: import urllib import sys from bs4 import BeautifulSoup url = 'http://www.vodaf ...
- python批量访问网页保存结果_Python静态网页爬取:批量获取高清壁
前言 在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤 一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...
- AI加速信息和知识获取速度,使用Python对MD格式文件和HTML网页进行内容摘要,2023年4月AI网页内容摘要工具大全
在信息时代,获取知识变得至关重要.然而,有时候信息的数量是如此之大,以至于人类无法有效处理.这就是人工智能(AI)能够做出贡献的地方.通过AI,我们可以快速地找到并理解文章的核心观点和重要信息.下面将 ...
- python爬虫怎么爬同一个网站的多页数据-如何用Python爬数据?(一)网页抓取
如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...
- python爬网站数据实例-如何用Python爬数据?(一)网页抓取
如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...
- python抓取网站重要url_[Python]网络爬虫(一):抓取网页的含义和URL基本构成
一.网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一 ...
- python提取网页表格信息_python 提取网页表格数据库数据库
python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库 网络 通用urllib -网络库(stdlib). ...
- python读取网页表格数据库_python 提取网页表格数据库数据库
python开源工具列表[持续更新] 以下是个人在工作中整理的一些python wheel,供参考.这个列表包含与网页抓取和数据处理的Python库 网络 通用urllib -网络库(stdlib). ...
最新文章
- 近朱者赤,近墨者还是赤
- Javascript对象的查询字符串编码
- sql array 数组基本用法(三)
- Fegion-4解决Fegion第一次请求timeout的问题
- 计算机科学考试大纲,计算机科学与技术考试大纲.doc
- “你的深度学习框架包含15个漏洞”,360说 | 附论文
- 2017年值得学习的3个CSS特性
- 解决:Ubuntu18.04配置exoprt LC_ALL=C后无法打开终端
- Java 7:最新特性更新、代码示例及性能测试
- gpgga格式读取MATLAB,gpgga数据格式
- 怎么把电脑图片转文字?只需这几步就可以截图转文字
- 搭建VC2010 开发环境,创建《C语言实现俄罗斯方块游戏》教程
- 人工智能 —— 计算智能概述
- 动易CMS从word复制粘贴公式
- 恶意软件清理助手1.94使用后的问题
- 学生奖学金评定系统c语言,学生奖学金评定系统.doc
- C++ 使用Poco库进行文件操作
- pandas 报错 KeyError: 0
- 纸本书变电子书是很小的事——詹宏志谈数字出版时代
- python学习知识点
热门文章
- IDEA初始jsp模板和修改jsp模板
- Linux查 ssh端口号
- php可以用wamp哪个好,PHPWAMP好吗?phpwamp怎么用?PHPWAMP和其他集成环境有什么区别吗??...
- 答题小程序 服务器,开源的基于云开发的在线答题小程序
- 版本控制/文件管理系统SVN命令整理:提交修改更新撤销分支
- 毛星云opencv第二章总结
- 大厂阿里程序员的薪资:简述阿里的薪酬体系和职级
- python修改第三方库重写_对Python第三方库,再次封装
- yb3防爆电机型号含义_YB3防爆电机和YBX3防爆电机的区别
- snownlp抛出错误_请教大家有关SnowNLP分词、词性标注、情感分析的问题