def process_request(self, request, spider):
request.headers[‘User-Agent’]=random.choice(UserAgents)
request.meta[‘proxy’]=random.choice(proxies)

UserAgents=[“Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50”,
“Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50”,
“Mozilla/5.0 (Windows NT 10.0; WOW64; rv:38.0) Gecko/20100101 Firefox/38.0”,
“Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729; InfoPath.3; rv:11.0) like Gecko”,
“Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0;”,
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0) IE 7.0 ",
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)”,
“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)”,
“Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:2.0.1) Gecko/20100101 Firefox/4.0.1”,
“Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1”,

“Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; en) Presto/2.8.131 Version/11.11”,
“Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; TencentTraveler 4.0)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; The World)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)”,
“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Avant Browser)”,
"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1) ",

“Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5”,

“Mozilla/5.0 (iPod; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5”,

“Mozilla/5.0 (iPad; U; CPU OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5”,
“Mozilla/5.0 (Linux; U; Android 2.3.7; en-us; Nexus One Build/FRF91) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1”,
“MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1”,
“Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10”,
“Mozilla/5.0 (Linux; U; Android 3.0; en-us; Xoom Build/HRI39) AppleWebKit/534.13 (KHTML, like Gecko) Version/4.0 Safari/534.13”,
“Mozilla/5.0 (hp-tablet; Linux; hpwOS/3.0.0; U; en-US) AppleWebKit/534.6 (KHTML, like Gecko) wOSBrowser/233.70 Safari/534.6 TouchPad/1.0”,
“Mozilla/5.0 (SymbianOS/9.4; Series60/5.0 NokiaN97-1/20.0.019; Profile/MIDP-2.1 Configuration/CLDC-1.1) AppleWebKit/525 (KHTML, like Gecko) BrowserNG/7.1.18124”,
“Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; HTC; Titan)”,
“UCWEB7.0.2.NOKIA5700/ UCWEB7.0.2.37/28/999”,
“Openwave/ UCWEB7.0.2.37/28/999”,
“Mozilla/4.0 (compatible; MSIE 6.0; ) Opera/UCWEB7.0.2.37/28/999”,
“Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50”,

“Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50”,

“Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; IE 8.0”,
“Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0) IE 7.0”,

“Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)”,
“NOKIA5700/ UCWEB7.0.2.37/28/999”,
“Openwave/ UCWEB7.0.2.37/28/999”,
“Mozilla/4.0 (compatible; MSIE 6.0; ) Opera/UCWEB7.0.2.37/28/999j”]

scrapy下载中间件设置代理和useraget大全相关推荐

  1. 三十八、Scrapy 下载中间件Middleware

    @Author:Runsen 文章目录 1. Spider 下载中间件(Middleware) 2. 激活一个下载DOWNLOADER_MIDDLEWARES 3. 编写你自己的下载中间件 4 使用代 ...

  2. scrapy 下载中间件

    文章目录 Downloader Middlewares(下载中间件) process_request(self,request,spider) process_response(self,reques ...

  3. scrapy下载中间件(downloader middleware)和蜘蛛中间件(spider middleware)

    scrapy组件 首先我们看下scrapy官网提供的新结构图,乍一看这画的是啥啊,这需要你慢慢的理解其原理就很容易看懂了,这些都是一个通用爬虫框架该具有的一些基本组件.上一篇博客说了项目管道(也就是图 ...

  4. 纯纯的爬虫知识,python scrapy 下载中间件知多少

    这篇博客咱们聊聊 scrapy 中的 Downloader Middleware ,即下载中间件相关知识. Downloader Middlerware 首先看一下中间件在 scrapy 数据流中的位 ...

  5. okhttp源码解析(五):代理和DNS

    前言 之前我们分析了okhttp的重试机制,发现在获取可用地址的时候,都需要遍历一个路由选择器,里面保存了可用的地址,那么这些地址是从哪来的呢?这就是本篇分析的重点. 首先我们简单理解一下代理和DNS ...

  6. 爬虫学习笔记(十)—— Scrapy框架(五):下载中间件、用户/IP代理池、settings文件

    一.下载中间件 下载中间件是一个用来hooks进Scrapy的request/response处理过程的框架. 它是一个轻量级的底层系统,用来全局修改scrapy的request和response. ...

  7. Scrapy框架爬取我爱我家二手房信息存储CSV、mysql(IP代理和User-Agent用户代理)

    有一段时间没出来活动了闲来无事弄个玩玩O(∩_∩)O哈哈~ 想必学过Scrapy框架的人都知道如何创建Scrapy和运行,那么我这里呢现将我创的框架展示一下 scrapy startproject p ...

  8. 17-爬虫之scrapy框架五大核心组件工作流程及下载中间件介绍04

    scrapy的五大核心组件 引擎(Scrapy) 对整个系统的数据流进行处理, 触发事务(框架核心). 调度器(Scheduler) 用来接受引擎发过来的请求. 由过滤器过滤重复的url并将其压入队列 ...

  9. 框架下载_25. Scrapy 框架-下载中间件Middleware

    1. Spider 下载中间件(Middleware) Spider 中间件(Middleware) 下载器中间件是介入到 Scrapy 的 spider 处理机制的钩子框架,您可以添加代码来处理发送 ...

最新文章

  1. 简述控制反转ioc_阅读Spring源码:IOC控制反转前的处理
  2. Mysqldump备份说明及数据库备份脚本分享-运维笔记
  3. yandex注册验证码怎么填_注册资本到底怎么填?
  4. 【Powershell】【性能计数器】基础信息的获取
  5. element -ui 表单验证 如果 需要验证的v-model 是对象中的对象 总是提示没有填写....
  6. 大数据WEB阶段(十五)JavaEE三大核心技术之过滤器
  7. 实现一个基于Vue的Button小组件
  8. python多线程运用
  9. 简单分析FFT坐标轴的生成方式和幅值大小
  10. 汇编语言上机考试三星题——加密的key和明文字符串
  11. SpringMVC+Spring4.0+Hibernate 简单的整合
  12. PVE解决VM is locked问题
  13. 为什么独立站卖家都在WhatsApp上进行销售?
  14. 网易2018实习生招聘笔试题
  15. css中文字段落对齐,CSS段落对齐方式
  16. 全国计算机考试等级考务管理系统,全国计算机等级考试考务管理系统:https://ncre-bm.neea.edu.cn/...
  17. arduino 休眠 节能_用 Arduino 自制应急感应灯,给黑夜带来一点光明。
  18. Android图像处理之GPUImage for Android
  19. ASTERISK+LINUX+PHP 的WebCall, 网页回拨源码
  20. opus 编码和解码完整demo代码,opus和wav互转(js源码)

热门文章

  1. python太阳花的编程_python大佬养成计划----HTML DOM
  2. android如何暂停倒计时,在Android中暂停和恢复倒计时器和进度条?
  3. 计算机类东北大学和大连理工,东北大学VS大连理工大学,谁才是第一,辽宁本地考生也两难...
  4. python导入包相当于什么_Python 引入包的两种方式区别
  5. 虚拟机的联网模式正确的选择
  6. 嵌入式学习笔记——SPI协议
  7. python调用自定义函数返回值的类型_生成dll文件以及python对DLL中函数的调用(参数类型以及返回值)...
  8. wordpress android,WordPress for Android 2.0 试用记
  9. 个人高效写作MarkDown博文模板
  10. 统计学中的协方差矩阵(阵列信号基础)