前言:我们可能会遇到将html网页转为图片,介绍我遇到的两种不同情况下的方式。
环境:python中的selenium
1.网站中的网页转换为图片:
思路:使用selenium的PhantomJS将网页转换为图片。

#-*- coding=utf-8 -*-
#@Time : 2020/8/7 10:08 PM
#@Author : 小邋遢
#@File : tset.py
#@Software : PyCharmfrom selenium import webdriver  # 从selenium库导入webdirver
#截取网页照片函数
def screen_shot(url,png_name):# 使用webdirver.PhantomJS()方法新建一个phantomjs的对象,这里会使用到phantomjs.exe,环境变量path中找不到phantomjs.exe,则会报错brower = webdriver.PhantomJS()# 使用get()方法,打开指定页面。注意这里是phantomjs是无界面的,所以不会有任何页面显示brower.get(url)# 设置phantomjs浏览器全屏显示brower.maximize_window()# 使用save_screenshot将浏览器正文部分截图,即使正文本分无法一页显示完全,save_screenshot也可以完全截图brower.save_screenshot(png_name)# 关闭phantomjs浏览器,不要忽略了这一步,否则你会在任务浏览器中发现许多任务brower.close()
if __name__ == '__main__':url ="https://news.163.com/20/0807/19/FJEUBJJU0001899O.html"screen_shot(url,'1.png')

效果如下:

2.将本地的文件夹下的html文件保存为图片。

#-*- coding=utf-8 -*-
#@Time : 2020/8/7 7:55 PM
#@Author : 小邋遢
#@File : get_image.py
#@Software : PyCharm"""
将html页面转换为图片
"""
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import os
chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--start-maximized')
path = os.getcwd()
filename = path + "/data/train/article/img/"for i in range(60):url = "file://(你的路径,如/user,记住这里是三个/)" + "{}".format(i+1) +".html"print(url)driver = webdriver.Chrome(options=chrome_options)driver.get(url)# 将该页面的展开到最大width = driver.execute_script("return Math.max(document.body.scrollWidth,document.body.offsetWidth, document.documentElement.clientWidth, document.documentElement.scrollWidth, document.documentElement.offsetWidth);")height = driver.execute_script("return Math.max(document.body.scrollHeight, document.body.offsetHeight,document.documentElement.clientHeight, document.documentElement.scrollHeight, document.documentElement.offsetHeight);")driver.set_window_size(width,height)driver.save_screenshot(os.path.join(filename,str(i+1)+'.png'))driver.close()

结果如下图:

python将网页转换为图片保存相关推荐

  1. 如何将Word文档每页转换为图片保存?

    我们在日常的工作和学习中,将Word文档的每一页转换为图片似乎并不多见,但是如果遇到需要这种操作时似乎会难到很到人,因为Word文档不具有直接保存为图片形式的功能.有时候我们需要将每一页的Word文档 ...

  2. Vue+Springboot上传图片将 Base64 码转换为图片保存在指定文件夹

    Vue+Springboot上传图片将 Base64 码转换为图片保存在指定文件夹 前言 一.Vue 前端 一.五 注意!!! 二.Springboot 后端 引入Base64依赖 在项目里新建 ut ...

  3. python ppt 图片_利用Python将PPT转换为图片并合成长图

    最近因为某些需求需要将PPT转换为图片并合并成预览图,于是第一时间就想到了用python解决问题,过程中参考了一位老哥写的文章,链接如下.Python行家:用Python实现ppt转化图片(附带长图合 ...

  4. canvas导出图片python_利用Python将PPT转换为图片并合成长图

    最近因为某些需求需要将PPT转换为图片并合并成预览图,于是第一时间就想到了用python解决问题,过程中参考了一位老哥写的文章,链接如下. Python行家:用Python实现ppt转化图片(附带长图 ...

  5. ImageMagick将多张图片拼接成一张图片_word转存技巧:如何将每页文档转换为图片保存?...

    编按:日常办公过程中,将Word文档转为图片的情况虽然不常见,但若遇到了总是会难倒一大批人.因为Word没有为用户提供直接将文档存储为图片格式的功能,因此,这就需要我们曲线救国,借用其他工具来实现目的 ...

  6. python requests库下载图片保存到本地

    import requests ''' 图片下载 @:param url_info ('http://img.xixik.net/custom/section/country-flag/xixik-c ...

  7. python爬今日头条图片保存_爬虫实战【7】Ajax解析续-今日头条图片下载

    昨天我们分析了今日头条搜索得到的信息,一直对图集感兴趣的我还是选择将所有的图片下载下来. 我们继续讲一下如何通过各个图集的url得到每个图集下面的照片. 分析图集的组成 [插入图片,某个图集的页面] ...

  8. PDF 转换为 图片保存

    使用pdfjs-dist package.json ... "pdfjs-dist": "2.6.347" ... PdfModal.vue <templ ...

  9. 将dataframe转换为图片保存

    import dataframe_image as dfidf = pd.DataFrame() dfi.export(df, "test.png")

  10. python如何将网络上的图片url和base64编码的图片保存在本地

    1.python base64编码的图片保存到本地 import os import base64 sss ="""/9j/4AAQSkZJRgABAQEASABIAAD ...

最新文章

  1. 2021年大数据ZooKeeper(六):ZooKeeper选举机制
  2. 《jQuery UI 开发指南》——1.3 什么是CSS主题
  3. 香河php程序员_失控的香河最流行的四大职位
  4. 云计算会杀死开源吗?
  5. docs邮箱服务器,邮件服务器更换域名
  6. Qt学习笔记之文件处理
  7. Android官方开发文档Training系列课程中文版:多样屏幕之实现自适应UI
  8. VTP冲突的排查与解决
  9. visual studio 2015 无法打开源文件“stdafx.h“
  10. Protues8.6仿真STM32出现错误-VDDA和VSSA的问题解决办法
  11. 从车载小程序打造智能汽车生态
  12. 使用pdfFactory Pro虚拟打印机给文档加上水印
  13. 【拆电脑清灰】戴尔游匣G3
  14. 【Unity】XPS模型导入Unity(支持VRChat)
  15. 使用Latex进行中文排版
  16. 英语单词词性顺口溜_英语词性修饰关系顺口溜
  17. xpath解析最全攻略
  18. 低压差线性稳压器 LDO
  19. python lib库_python标准库pathlib常见操作
  20. 解决Windows右下角广告弹窗自用方案整合(使用到新方法再更)

热门文章

  1. Tbase 源码 (三)
  2. 什么是敏捷项目合同管理?
  3. 菲尼克斯馈电隔离器 - MINI MCR-SL-RPS-I-I
  4. matlab在电力系统中的应用 当当,MATLAB在电力系统分析中的应用
  5. 2022-03-09:我们正在玩一个猜数游戏,游戏规则如下: 我从 1 到 n 之间选择一个数字。 你来猜我选了哪个数字。 如果你猜到正确的数字,就会 赢得游戏 。 如果你猜错了,那么我会告诉你,我选
  6. 第20节 简单密码破解—基于windows系统
  7. 烽火路由路虚拟服务器,烽火路由器怎么设置普通专线?
  8. HDR到底是干什么的?建模的时候有什么用处?
  9. matplotlib画图使用微软雅黑字体
  10. 实验|trunk的配置