文章目录

  • 前言
  • 爬虫百度图片时,总是有时好有时坏 解决方案
    • 出现问题:
    • 更改headers:
      • 找到属于自己的headers
        • 我们都在成长的路上,请相信自己!sincerely,end.

前言

  爬虫百度图片时,总是时好时坏(爬不上的居多),已解决,如有错误,请纠正,万分感谢


爬虫百度图片时,总是有时好有时坏 解决方案

出现问题:

  根据调试信息,我观察到了返回结果如下:

 <!DOCTYPE html>
<html lang="zh-CN">
<head><meta charset="utf-8"><title>百度安全验证</title><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><meta name="apple-mobile-web-app-capable" content="yes"><meta name="apple-mobile-web-app-status-bar-style" content="black"><meta name="viewport" content="width=device-width, user-scalable=no, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0"><meta name="format-detection" content="telephone=no, email=no"><link rel="shortcut icon" href="https://www.baidu.com/favicon.ico" type="image/x-icon"><link rel="icon" sizes="any" mask href="https://www.baidu.com/img/baidu.svg"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta http-equiv="Content-Security-Policy" content="upgrade-insecure-requests"><link rel="stylesheet" href="https://ppui-static-wap.cdn.bcebos.com/static/touch/css/api/mkdjump_0635445.css" />
</head>
<body><div class="timeout hide"><div class="timeout-img"></div><div class="timeout-title">网络不给力,请稍后重试</div><button type="button" class="timeout-button">返回首页</button></div><div class="timeout-feedback hide"><div class="timeout-feedback-icon"></div><p class="timeout-feedback-title">问题反馈</p></div><script src="https://wappass.baidu.com/static/machine/js/api/mkd.js"></script>
<script src="https://ppui-static-wap.cdn.bcebos.com/static/touch/js/mkdjump_1448d18.js"></script>
</body>
</html>

  原来是进入了百度验证!

更改headers:

  之前的headers 如下:

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82'}

  后来增加如下信息:

headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'sec-ch-ua': '"Google Chrome";v="89", "Chromium";v="89", ";Not A Brand";v="99"',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36'}

  成功解决!
  别划走别划走, 每个人的因为浏览器版本不同等原因,不一定代码一样

找到属于自己的headers

(以百度图片为例)

  1. 打开爬虫网页 —— 百度图片

  2. F12打开开发者工具,按F5刷新

  3. 点击Network,找到Doc,点击Name下的信息,找到Headers

  4. 找到Request Headers的 Accept 、 Accept-Encoding 、 Accept-Language 、 Cache-Control 、 Connection 、 sec-ch-ua 、 User-Agent 字段,将其复制下来

  5. 将复制的字段构造成字典形式

举例:
Accept-Encoding: gzip, deflate, br
更改为 ‘Accept-Encoding’: ‘gzip, deflate, br’

  1. python中的部分代码(仅供参考,版本不一定一致,具体还是要按上述步骤找到自己的headers和url):
headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'sec-ch-ua': '"Google Chrome";v="89", "Chromium";v="89", ";Not A Brand";v="99"',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36'}#name是需要搜索图片的名字
url = 'https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&fm=detail&lm=-1&hd=&latest=&copyright=&st=-1&sf=2&fmq=1616167633329_R_D&fm=detail&pv=&ic=0&nc=1&z=&se=&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word='+name+'&pn='+str(i*30)res = requests.get(url,headers=headers)

  解决!


我们都在成长的路上,请相信自己!sincerely,end.

爬虫百度图片进入百度验证怎么办?相关推荐

  1. python3爬取30张百度图片大量百度图片【王俊凯】

    python3爬取30张百度图片&大量百度图片[王俊凯] 30张图片(easy!) 好多好多图片! 复习C++之前先玩了一下爬虫,这学期属于是入了小凯的坑爬不出来了qwq 先看结果捏~ 学习了 ...

  2. Python_百度图片以及百度贴吧图片抓取

    一.百度图片抓取 百度图片抓取存在两个难点: (1)没有翻页功能,只有下拉不断get新的img,这个暂时没有解决,据说可以通过selenium模块来模拟浏览器动作进行,暂未入手,只能抓取最开始get到 ...

  3. Python爬虫——关键字爬取百度图片

    在日常生活中,我们经常需要使用百度图片来搜索相关的图片资源.而如果需要大量获取特定关键字的图片资源,手动一个个下载无疑十分繁琐且费时费力.因此,本文将介绍如何通过Python爬虫技术,自动化地获取百度 ...

  4. 一款简易的百度图片批量下载软件

    学了一段时间的爬虫,于是就想着做一个小项目练练手,平时生活中我们可能需要去百度上搜索图片,有时想要下载多张图片,怎么办呢?笨方法就是一张一张的用鼠标右键进行保存图片,这是不是很麻烦,所以就自己想了一下 ...

  5. 百度图片推广怎么做(百度图片推广操作方法)

    百度图片推行怎样做?微赚云今天赋享百度图片推行操作办法.首先,我们将要讨论如何将图片上传到百度的问题,只需是针对一个需求较大的行业,那么不论我们想要什么样的引流形式,毕竟在众多渠道中,我们我们也不能绝 ...

  6. Seo搜索如何优化百度图片排名

    随着互联网技术不断进步,满足了用户多样化的需求,自从2014年1月17日百度站长平台LEE发布了关于"走进读图时代"一文,已宣告搜索引擎已经从原来的文本搜索进入了图片搜索的时代,对 ...

  7. 百度预测和百度五笔输入法

    相信很多著名百度产品大家都耳熟能详,比如百度导航,百度团购,百度糯米,百度浏览器,百度音乐,百度网盘,百度视频,千千静听,百度翻译,百度百科,百度贴吧,百度图片,百度知道,百度新闻,百度推广..... ...

  8. python爬虫——批量爬取百度图片

    最近做项目,需要一些数据集,图片一张一张从网上下载太慢了,于是学了爬虫. 参考了大佬的文章:https://blog.csdn.net/qq_40774175/article/details/8127 ...

  9. 【python--爬虫】百度图片爬虫

    如何快速收集某个关键字的图片呢?有的小伙伴可能会说百度图片,bingo答对了!o( ̄▽ ̄)o,博主本次就讲解下如何爬取百度图片 环境准备 为了优雅的享用这盘python爬虫大餐,请各位读者大大准备要以 ...

  10. python爬取图片教程-推荐|Python 爬虫系列教程一爬取批量百度图片

    Python 爬虫系列教程一爬取批量百度图片https://blog.csdn.net/qq_40774175/article/details/81273198# -*- coding: utf-8 ...

最新文章

  1. 大学生英语fif测试系统_英语听力解题技巧
  2. python getchar,Linux C编程学习:getchar()和getch()
  3. 小程序,一个简单的图像处理
  4. Android开发之动态加载,运行未安装apk
  5. 计算机设备硬件设备,计算机硬件设备有哪些
  6. Android一帧一帧的动画
  7. 从编写c语言源程序到运行,c语言 源代码到可执行程序的过程
  8. Axure原型模板CRM客户关系管理系统高保真原型设计
  9. 法律咨询小程序开发制作(律师事务所小程序)
  10. 大华服务器系统配置图,大华磁盘阵列配置说明指南.doc
  11. 【游戏开发实战】Unity从零做一个任务系统,人生如梦,毕业大学生走上人生巅峰(含源码工程 | 链式任务 | 主线支线)
  12. Photoshop脚本 设置前景色和背景色
  13. python Shapely使用指南详解
  14. 怎样建立产品体系?(七)- 常用工具和度量指标建立
  15. 区块链是如何解决慈善公益项目中存在的问题呢?
  16. fasterRCNN系列
  17. 仿京东左侧菜单弹出html代码,一个类似京东网页左侧菜单扩展的特效代码
  18. 阿里云HaaS100物联网开发板学习笔记(三)轻应用初步--用js让小灯闪烁起来
  19. MCE | 新冠 德尔塔病毒
  20. 猜数字小游戏(Python)

热门文章

  1. 录计算机,电脑屏幕上的操作怎么录制下来?
  2. pandas函数速查手册(高清版)PDF
  3. ITIL 4知识系列之ITIL4的设计框架解析
  4. 热门论坛排行top100--2010年07月11日[转]
  5. 【机器人学】机器人运动学基础
  6. 电商数字化色彩系统的探索
  7. 金山词霸2006专业版(300M)的无法屏幕取词问题的解决方法!
  8. 几种常用的键盘钩子技术
  9. 暴雨公式 matlab,对雨水暴雨强度公式中降雨历时分解.pdf
  10. 基于matlab的暴雨强度公式参数推求,小样本流域降雨强度公式和设计降雨分布的推求方法...