怎么用python爬图片_如何用Python来制作简单的爬虫,爬取到你想要的图片
在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。
我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。
我们可以通过python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地。下面就看看如何使用python来实现这样一个功能。
一,获取整个页面数据
首先我们可以先获取要下载图片的整个页面信息。
getjpg.py
Urllib 模块提供了读取web页面数据的接口,我们可以像读取本地文件一样读取www和ftp上的数据。首先,我们定义了一个getHtml()函数:
read()方法用于读取URL上的数据,向getHtml()函数传递一个网址,并把整个页面下载下来。执行程序就会把整个网页打印输出。
二,筛选页面中想要的数据
Python 提供了非常强大的正则表达式,我们需要先要了解一点python 正则表达式的知识才行。
假如我们百度贴吧找到了几张漂亮的壁纸,通过到前段查看工具。找到了图片的地址,如:src=”http://imgsrc.baidu.com/forum......jpg”pic_ext=”jpeg”
修改代码如下:
我们又创建了getImg()函数,用于在获取的整个页面中筛选需要的图片连接。re模块主要包含了正则表达式:
如果你在学习Python的过程中遇见了很多疑问和难题,可以加-q-u-n 227 -435-450里面有软件视频资料免费
运行脚本将得到整个页面中包含图片的URL地址。
三,将页面筛选的数据保存到本地
把筛选的图片地址通过for循环遍历并保存到本地,代码如下:
这里的核心是用到了urllib.urlretrieve()方法,直接将远程数据下载到本地。
通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。
程序运行完成,将在目录下看到下载到本地的文件。
怎么用python爬图片_如何用Python来制作简单的爬虫,爬取到你想要的图片相关推荐
- python 读取excel图片_如何用Python读取Excel中图片?
公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...
- python翻页_如何用python tkiner实现图片翻页功能
如何用python tkiner实现图片翻页功能 发布时间:2020-06-26 12:52:59 来源:亿速云 阅读:108 作者:Leah 如何用python tkiner实现图片翻页功能?针对这 ...
- python小助手_如何用python写个人专属群聊提醒小助手?
前言 大家还记得教会父母玩微信是什么时候吗?父母学会后,我们的生活就发生了「质」的变化,父母也许会吐槽你的微信头像不好,要你换一个头像. 最近 pk哥 又被母后大人吐槽了,原因是亲戚微信群里某个亲戚生 ...
- python md5加密_如何用python“优雅”的调用有道翻译?
前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js"斗争"的 ...
- python做网站开发_如何用Python做网站开发
很多人想要用Python做网站开发,但是又不知从何入手,接下来小编介绍用Python做网站开发需要学习哪些知识,又应该以什么样的顺序来学. 第一步:HTML(超文本标记语言)是网页的核心,学好HTML ...
- 怎么用python启动谷歌浏览器_如何用python控制浏览器
selenium从2.0开始集成了webdriver的API,提供了更简单,更简洁的编程接口.selenium webdriver的目标是提供一个设计良好的面向对象的API,提供了更好的支持进行web ...
- python怎么读_如何用Python读写文件
前面我们已经介绍了很多Python相关的基础知识,大家是不是对Python已经有了进一步认识了呢?作为人工智能时代的热门编程语言,开始接触并学习Python的孩子越来越多,家长们都不想让自己的孩子落于 ...
- python旅游推荐系统_如何用Python搭建一个简单的推荐系统?
推荐系统的相关知识我们已在前文中提到,在这篇文章中,我们会介绍如何用Python来搭建一个简单的推荐系统. 本文使用的数据集是MovieLens数据集,该数据集由明尼苏达大学的Grouplens研究小 ...
- 用python开启相机_如何用Python打开realsenseD435相机并获取相机参数
如何用Python打开realsenseD435相机 import pyrealsense2 as rs import numpy as np import cv2 if __name__ == &q ...
最新文章
- Mr Big [To be with you]
- java取服务器时间的函数,非常有用的Java日期时间操作函数代码一览
- MFC基础类及其层次结构
- 【struts2】预定义拦截器
- android闹钟测试工具,android开发:AlarmManager闹钟管理器的实例
- 封装一个邮件发送工具类,一个字,巴适
- 吴恩达|机器学习作业1.1多变量线性回归
- 树以及树简单的遍历方法
- Delphi各个版本的官方下载地址
- JAVA程序打包为EXE
- nginx小技巧-动态域名(微信,小程序80端口)
- 三个基本的布尔逻辑算符是_常用布尔逻辑运算符有哪些
- 工业机器人视觉实训平台
- pyqt5 selenium 等待元素出现 visibility_of_element_located
- iOS- 延迟1秒执行一个函数
- 启用DoH(DNS-over HTTPS)在Windows、Android、IOS平台
- 流程内耗的雾霾几时休?
- 如何简单又快速的清理C盘内存
- 关于解决爬取拉勾全网遇到的302重定向问题的一些记录
- learn java step by step day14
热门文章
- Python使用pandas读取Excel文件数据和预处理小案例
- 计算机二级c语言改错,国家计算机二级C语言机试改错试题及答案.doc
- mac bochs 调试linux,Mac OS X下编译安装带debugger的bochs
- oracle sql如何剔除周末,Oracle 跳过周末的sql
- vmos安卓虚拟手机系统x86_VMOSPro下载-VMOSPro下载v 1.1.26 安卓版-西西软件下载
- 通过Java反射获取对象上的注解,java反射注解妙用-获取所有接口说明
- C语言之数组探究(一):定义、大小、初始化、访问和三要素
- C++之顺序性容器vector、list、deque的五种定义方式
- html界面选择按钮没法取消,如何使用JavaScript取消选择按钮
- 2018你那计算机考试新题型,2018考研新题型考察点和解题步骤