# coding=utf-8
"""
爬取百度图片的高清原图
Author          : MirrorMan
Created         : 2017-11-10
"""
import re
import urllib
import os
import requestsdef get_onepage_urls(onepageurl):if not onepageurl:print('执行结束')return [], ''try:html = requests.get(onepageurl).textexcept Exception as e:print(e)pic_urls = []fanye_url = ''return pic_urls, fanye_urlpic_urls = re.findall('"objURL":"(.*?)",', html, re.S)html = requests.get(onepageurl)html.encoding = 'utf-8'content = html.textfanye_urls = re.findall(re.compile(r'<a href="(.*)" class="n">下一页</a>'), content, flags=0)fanye_url = 'http://image.baidu.com' + fanye_urls[0] if fanye_urls else ''return pic_urls, fanye_urldef down_pic(pic_urls, localPath):if not os.path.exists(localPath):  # 新建文件夹os.mkdir(localPath)"""给出图片链接列表, 下载图片"""for i, pic_url in enumerate(pic_urls):try:pic = requests.get(pic_url, timeout=15)string = str(i + 1) + '.jpg'with open(localPath + '%d.jpg' % i, 'wb')as f:f.write(pic.content)print('成功下载第%s张图片: %s' % (str(i + 1), str(pic_url)))except Exception as e:print('下载第%s张图片时失败: %s' % (str(i + 1), str(pic_url)))print(e)continueif __name__ == '__main__':keyword = '鸣人'  # 关键词, 改为你想输入的词即可, 相当于在百度图片里搜索一样url_init_first = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1497491098685%5E00_1519X735&word='url_init = url_init_first + urllib.parse.quote(keyword, safe='/')all_pic_urls = []onepage_urls, fanye_url = get_onepage_urls(url_init)all_pic_urls.extend(onepage_urls)fanye_count = 1  # 图片所在页数,下载完后调整这里就行while 1:onepage_urls, fanye_url = get_onepage_urls(fanye_url)fanye_count += 1print('第%s页' % fanye_count)if fanye_url == '' and onepage_urls == []:breakall_pic_urls.extend(onepage_urls)down_pic(list(set(all_pic_urls)), r'C:\Users\41174\AppData\Local\Temp\change.py\shrinkImage\\')  # 保存位置也可以修改

参考:https://blog.csdn.net/xiligey1/article/details/73321152

Python 爬取百度图片的高清原图相关推荐

  1. Python 3.5_简单上手、爬取百度图片的高清原图

    利用工作之余的时间,学习Python差不多也有小一个月的时间了,路漫漫其修远兮,我依然是只菜鸟. 感觉学习新技术确实是一个痛并快乐着的过程,在此分享些心得和收获,并贴一个爬取百度图片原图的代码. 代码 ...

  2. python爬取王者荣耀皮肤高清图

    python爬取王者荣耀皮肤高清图 前期准备,导入模块 requests json os 进入王者荣耀官网,进入游戏壁纸页面,f12进入开发者模式,按照下图找到这个json文件,用于对图片的数据请求. ...

  3. 如何使用python爬取百度图片_python实现爬取百度图片的方法示例

    本文实例讲述了python实现爬取百度图片的方法.分享给大家供大家参考,具体如下: import json import itertools import urllib import requests ...

  4. Python爬取百度图片搜索结果

    爬取百度图片搜索的图片,我们先需要分析其访问 URL,我们在搜索页面,比如搜索 "abc" ,打开 F12 调试,下拉结果页面页,查看网络请求,在其中我们可以找到这样一个请求 ht ...

  5. python爬取百度图片(用于深度学习中数据集的收集)

    6_python爬取百度图片(用于深度学习中数据集的收集)(6-20181225-) 参考: https://blog.csdn.net/guyuealian/article/details/7873 ...

  6. Python爬取豆瓣裤袜视界高清大图

    文章目录 前言 第一步:整合URL 第二步:过滤URL 第三步:批量下载图片 完整代码 前言 今天刚好有个朋友托我写一个脚本,需求是爬取他刚看的一部动漫的剧照,于是我就开始着手满足他这个需求哈哈哈~因 ...

  7. python爬图片并按标题保存_EX4 | 用Python爬取百度图片关键字猫并保存

    欢迎关注微信号:student_Shang 小编是985院校小硕士一枚,欢迎关注,持续更新中~ 哈喽,大家好~ 在本次推送中,以百度搜索中关键字猫作为采集目标,重点采集并保存猫的图片,在本地根目录下以 ...

  8. python爬取百度图片——翻页式网站爬取

    小编大约于这个月月初写的这一份代码,但很不幸,大概20号,再次找百度图片翻页流的时候,发现是瀑布流且回不去了,还好代码里面留了翻页流的网址 所以,现在来分享给大家. 语言:python3.6 库:re ...

  9. python爬取百度图片,自定义关键字和页数

    修改了下载的图片打不开的问题,原因:请求头 可执行文件下载 import requests import time import os from multiprocessing import Pool ...

最新文章

  1. 计算机领域收费sci期刊,计算机领域收费sci期刊 - 百度学术
  2. 本地一站式极速开发AI模型 百度飞桨EasyDL桌面版来了
  3. 大数据WEB阶段 Js常用的页面操作
  4. 钉钉机器人发送图片 python_python封装钉钉Webhook机器人消息发送逻辑
  5. PMP读书笔记(第12章)
  6. STM32之高级定时器互补输出
  7. 外贸常用术语_最常用的外贸术语大全,收藏备用
  8. 中国工程院院士郑纬民:应鼓励从头研发先进的存储系统软件
  9. 【ACM-ICPC 2018 南京赛区网络预赛】Magical Girl Haze【分层图】
  10. (10)二进制文件方式部署Kubernetes高可用集群----------部署node节点
  11. 原 《老路用得上的商学课》86-90学习笔记
  12. Apache ShenYu源码阅读系列-Divide插件
  13. cmd 如何打开资源管理器
  14. linux系统开发安卓应用,在 Linux 里搭建 Android App 开发环境
  15. OpenCV的配置过程和可能遇到的问题
  16. 【java】企业微信机器人消息推送
  17. activity_manager_server
  18. matlab 三维 雷达天线波束
  19. 又是一年推gal季(牛客OI周赛5-提高组)
  20. Java的四种访问修饰符介绍

热门文章

  1. 【短视频运营】短视频变现方式 ( 直播打赏 | 线上引流 | 电商带货 | 知识变现 | 品牌推广 | 粉丝数量 | 粉丝领域 | 粉丝质量 )
  2. 前端新手必看的CSS参考手册
  3. 大数据开发之Hive篇18-Hive的回收站
  4. 一文搞懂最强裂变团队的黑科技
  5. centos系统下服务器网卡配置文件,CentOS服务器网卡绑定配置
  6. 哈尔滨工程大学计算机调剂人多么,哈尔滨工程大学2020招调剂生,缺额1042人,截止到5月20日...
  7. python标书制作辅助docx
  8. 影子系统忘记密码了怎么办_iphone ipad 密码忘记 已经停用怎么办?
  9. 《这就是软件工程师》里的推荐书单
  10. SAP MM VL02N试图做PGI,报错-存储地点不是为交货项目000010确定的-