python爬虫爬取网页图片_Python爬虫:爬取网页图片
先分析查找要爬取图片的路径 在浏览器F12 审查元素
整体实现代码
# -- coding:UTF-8 --
import requests
from bs4 import BeautifulSoup
import os
'''
思路:获取网址
获取图片地址
爬取图片并保存
'''
# 获取网址
def getUrl(url):
try:
read = requests.get(url) #获取url
read.raise_for_status() #状态响应 返回200连接成功
read.encoding = read.apparent_encoding #从内容中分析出响应内容编码方式
return read.text #Http响应内容的字符串,即url对应的页面内容
except:
return "连接失败!"
# 获取图片地址并保存下载
def getPic(html):
soup = BeautifulSoup(html, "html.parser")
#通过分析网页内容,查找img的统一父类及属性
all_img = soup.find('ul', class_='thumbnail-group thumbnail-group-165 clearfix').find_all('img') #img为图片的标签
for img in all_img:
src = img['src'] #获取img标签里的src内容
img_url = src
print(img_url)
root = "F:/Pic/" #保存的路径
path = root + img_url.split('/')[-1] #获取img的文件名
print(path)
try:
if not os.path.exists(root): #判断是否存在文件并下载img
os.mkdir(root)
if not os.path.exists(path):
read = requests.get(img_url)
with open(path, "wb")as f:
f.write(read.content)
f.close()
print("文件保存成功!")
else:
print("文件已存在!")
except:
print("文件爬取失败!")
# 主函数
if __name__ == '__main__':
html_url=getUrl("https://findicons.com/search/nature")
getPic(html_url)
运行结果
爬取结果
代码有参考网络部分,如有侵犯请联系删除,谢谢。
标签:img,Python,爬虫,爬取,url,html,read,print,path
来源: https://blog.csdn.net/iprotn/article/details/90069342
python爬虫爬取网页图片_Python爬虫:爬取网页图片相关推荐
- python解析网页数据_python爬虫——爬取网页数据和解析数据
1.网络爬虫的基本概念 网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- python爬虫快速下载图片_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...
Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...
- python爬取网页停止_Python爬虫之爬取静态网页
所谓网络爬虫,通俗的讲,就是通过向我们需要的URL发出http请求,获取该URL对应的http报文主体内容,之后提取该报文主体中我们所需要的信息.所以,想要学习python爬虫,需要具备一些http的 ...
- python爬虫微博评论图片_python爬虫爬取微博评论
原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...
- 用python爬取今日头条上的图片_Python爬虫:抓取今日头条图集
今天我们来爬取今日头条图集,老司机以街拍为例. 运行平台: Windows Python版本: Python3.6 IDE: Sublime Text 其他工具: Chrome浏览器 1.网页分析 从 ...
- python爬取头条图集_Python爬虫基础练习(六) 今日头条街头篮球图片爬取
今天我们要爬取的仍然是图片,不过与上一篇有所不一样的是,今天爬取的是今日头条上的图集,接着往下看吧~ 运行平台:Windows Python版本:Python3.6 IDE: Sublime Text ...
- python宣传图片_Python爬虫,高清美图我全都要!爬取你想要的,嘿嘿嘿
select = 'div#main div.list ul li a' imgUrls = screen(url, select) 通过这两行代码获取的列表中的值,形如此:星空 女孩 观望 唯美夜景 ...
- python爬取文字和图片_python爬虫--xpath结合re同时爬取文字与图片
还是老家的旅游网址:http://www.patour.cn/site/pananzxw/tcgl/index.html,将这些特产的图片及其介绍都爬取下来! 源码: 1 # -*- coding:u ...
- python爬虫知乎图片_Python爬虫入门教程 25-100 知乎文章图片爬取器之一
1. 知乎文章图片爬取器之一写在前面 今天开始尝试爬取一下知乎,看一下这个网站都有什么好玩的内容可以爬取到,可能断断续续会写几篇文章,今天首先爬取最简单的,单一文章的所有回答,爬取这个没有什么难度. ...
最新文章
- HH的项链 (求区间内有多少个不同的数字)
- TOP Server教程:预览非标准协议创建的未来
- 简易而又灵活的Javascript拖拽框架(四)
- 【Linux】26.VScode安装、插件、快捷键等基本用法
- android 内存占用大 卡顿,安卓手机用久了就会卡顿?那是内存使用率高了,你需要这么做...
- android关机位置定位,Android5.0关机充电动画位置
- 树莓派安装win10arm linux,在树莓派3B 上安装 Windows 10 ARM 版的方法
- SystemVerilog例子---traffic light
- [php] 高级教程
- Java代码块的基本使用
- 高并发中计数器的实现方式有哪些?
- 3文件提取器_奇淫巧技 | 快速批量提取 PPT 中所有图片素材方法
- intel 指令集_苹果首款ARM Mac来了,浅谈ARM和Intel处理器
- mysql5.7.11-win64无法登录问题解决方案
- codeforces 776C Molly's Chemicals(连续子序列和为k的次方的个数)
- 单目标跟踪SiamMask:特定目标车辆追踪 part1
- 《C语言运算符100例》优先级面试错题
- 微信设置字体后微信浏览器页面字体也会跟着改变的解决办法
- 2016 杭州云栖大会随笔
- Word2vec原理+实战学习笔记(二)