Python爬虫爬取图片

需要用到的库:
os
time
request
lxml

代码源码如下:

import os
import time
import requests
from lxml import etree
#建议headers写全 也可以只写user-agent和cookie
headers = {'User-Agent':'xxxxxx',
'Accept': 'xxxxxx',
'Accept-Encoding': 'xxxxxx',
'Accept-Language': 'xxxxxx',
'Connection': 'xxxxxx',
'Cookie': 'xxxxxx',
'Referer': 'xxxxxx'
}
#单页面爬取
#先请求获得想要爬取图片的当前网页源码
#可以使用print打印到控制台分析也可以在网页中使用F12查看分析
response = requests.get('http://xxxxxx.com/xxx?xxx',headers=headers)# print(response.content.decode())
html = etree.HTML(response.content.decode())
#使用xpath获取图片源
#img标签下的
imgs = html.xpath("//img//@file")
for i in imgs:#睡眠3秒time.sleep(3)#可能需要进行链接拼接url2 = ("http://xxxxxx.com/"+i)print(url2)#保存图片名#以'/'做分隔符 截取倒数第一个作为图片名file_name = url2.split('/')[-1]print(file_name)#请求图片源#content中间存的是字节码 保存图片使用contentimg_data = requests.get(url2, headers=headers).content#创建文件夹if not os.path.exists('./xx'):os.mkdir('./xx')img_path = './xx/' + file_namewith open(img_path, 'wb') as f:f.write(img_data)

xpath 选择

Python爬虫爬取src图片相关推荐

  1. python爬虫,爬取下载图片

    python爬虫,爬取下载图片 分别引入以下三个包 from urllib.request import urlopen from bs4 import BeautifulSoup import re ...

  2. Python爬虫爬取相关图片

    简要的实现实现Python爬虫爬取百度贴吧页面上的图片,下面的网页就是本篇博客所要爬的网页,当然看到的只是其中的一部分图片,是所要爬取的页面, 而下图则是最终的爬取的图片: 接下来就简要的讲讲爬取的整 ...

  3. python爬虫爬取网页图片_Python爬虫:爬取网页图片

    先分析查找要爬取图片的路径 在浏览器F12 审查元素 整体实现代码 # -- coding:UTF-8 -- import requests from bs4 import BeautifulSoup ...

  4. 上手快!!福利局!新手如何使用python爬虫爬取网页图片(使用正则进行数据解析)当然这个新手是我自己

    作为一个python新入门小白,突然就想发个博客,一方面为了记录学习历程,一方面能分享给新入门的同学经验,更多的是想和大家一起学习和交流.以下是我以小白的角度分享的爬虫的相关知识和一个简单的爬取网页图 ...

  5. python爬虫爬取百度图片总结_python爬虫如何批量爬取百度图片

    当我们想要获取百度图片的时候,面对一张张图片,一次次的点击右键下载十分麻烦.python爬虫可以实现批量下载,根据我们下载网站位置.图片位置.图片下载数量.图片下载位置等需求进行批量下载,本文演示py ...

  6. python爬虫爬取百度图片,python爬虫篇2:爬取百度图片

    入门级 import requests import re import os from urllib import error def main(): dirPath = "E:\pyth ...

  7. 超详细解析python爬虫爬取京东图片

    超详细图片爬虫实战 实例讲解(京东商城手机图片爬取) 1.创建一个文件夹来存放你爬取的图片 2.第一部分代码分析 3.第二部分代码分析 完整的代码如下所示: 升级版代码: 爬取过程中首先你需要观察在手 ...

  8. 利用python爬虫爬取斗鱼图片(简单详细)

    关于 在一个安静的夜晚,我缓慢的打开了电脑,望着已经睡着的父母,我轻轻的把门关上,看着斗鱼颜值主播的魅力,我不尽感叹,要是每天都可以不需要那么麻烦的去看那该有多好! 于是我想起了最近刚学的爬虫,嘴角露 ...

  9. python爬虫爬取4K图片实例

    爬取目标网站https://pic.netbian.com/4kfengjing/index.html 之前写的时候发现爬取的图片都是缩略图,不是原图4k的,经过改良得以实现 思路: 话不多说,详细思 ...

最新文章

  1. (转)HLSL,函数列表
  2. python一次性输入10个数_python如何一次性输入多个数
  3. JAVA线程池管理及分布式HADOOP调度框架搭建
  4. 新疆兵团谋定丰收美景-万祥军:对话农民丰收节交易会
  5. JavaScript 之 动态加载JS代码或JS文件
  6. 一款APP设计的从0到1之:Android设计规范篇(转载)
  7. 晚安,2017。你好,2018。
  8. ubuntu 版mysql客户端工具_ubuntu安装mysql可视化工具MySQL-workbench及简单操作
  9. MySQL全方位练习(学生表 教师表 课程表 分数表)
  10. FDDB和LFW到底是个啥?
  11. mongo按季度统计_三季度国内纯碱市场总结及四季度分析
  12. 小武与SSD的相遇笑死我了!
  13. 手机任务栏html,任务栏是什么
  14. 天网系统服务器码,天网管理系统
  15. sam卡和sim卡区别_科普拍了拍你~PSAM卡\SIM与SAM卡有什么不同?
  16. html5 基本知识
  17. http请求报错context deadline exceeded (Client.Timeout exceeded while awaiting headers)
  18. Lua Busted 单元测试简介(Windows 环境)
  19. 滴水逆向学习笔记 -1-
  20. 爱 的 契 约 写给正在感情纠葛的三人

热门文章

  1. 【计算机系统】缓冲区溢出攻击实验
  2. DES算法原理及其实现
  3. 什么是RAID及创建RAID的方法
  4. 基于SIFT的视频跟踪
  5. 专注协同和GRC,慧点20载践行中国软件助力中国企业走向世界
  6. macOS 无法读取移动硬盘(不使用chkdsk,有一台linux时)
  7. 小布老师 LoadRunner系列培训视频
  8. 如何实现DLL的自释放
  9. Server U 虚拟路径设置
  10. Spring三种注入方法(set注入、构造方法注入、p标签注入)