我试图弄清楚如何使用代理和多线程.

此代码有效:

requester = urllib3.PoolManager(maxsize = 10, headers = self.headers)

thread_pool = workerpool.WorkerPool()

thread_pool.map(grab_wrapper, [item['link'] for item in products])

thread_pool.shutdown()

thread_pool.wait()

然后在grab_wrapper中

requested_page = requester.request('GET', url, assert_same_host = False, headers = self.headers)

标题包括:Accept,Accept-Charset,Accept-Encoding,Accept-Language和User-Agent

但这在生产中不起作用,因为它必须通过代理,不需要授权.

我尝试了不同的东西(将代理传递给请求,在标题中等).唯一有效的是:

requester = urllib3.proxy_from_url(self._PROXY_URL, maxsize = 7, headers = self.headers)

thread_pool = workerpool.WorkerPool(size = 10)

thread_pool.map(grab_wrapper, [item['link'] for item in products])

thread_pool.shutdown()

thread_pool.wait()

现在,当我运行程序时,它将发出10个请求(10个线程),然后……停止.没有错误,没有任何警告.这是我可以绕过代理的唯一方法,但似乎不可能一起使用proxy_from_url和WorkerPool.

有关如何将这两者合并为工作代码的任何想法?由于时间限制,我宁愿避免将其重写为杂乱无章等

问候

python urllib3 使用_Python urllib3和代理相关推荐

  1. python urllib3 使用_Python urllib3以及如何处理cookie支持?

    是不是有与多个Cookie的问题吗? 某些服务器返回多个Set-Cookie标题,但urllib3将标题存储在字典中,而字典不允许具有相同键的多个条目. httplib2有一个类似的问题. 或许不是: ...

  2. python 远程控制摄像头_Python设置Socket代理及实现远程摄像头控制的例子

    为了python设置socket代理,首先,你得下载SocksiPy这个.解压出来之后里面会有一个socks.py文件.然后你可以把这个文件复制到python安装目录里面的Lib\site-packa ...

  3. 【python】urllib和urllib3,requests 简要概括---笔记

    '''urllib和urllib3,requestsurl:协议://存放资源的地址(域名)/具体的资源https://bj.lianjia.com/zufang/dghfjhsjdf648.html ...

  4. python ip代理池_Python 爬虫IP代理池的实现

    很多时候,如果要多线程的爬取网页,或者是单纯的反爬,我们需要通过代理IP来进行访问.下面看看一个基本的实现方法. 代理IP的提取,网上有很多网站都提供这个服务.基本上可靠性和银子是成正比的.国内提供的 ...

  5. python的requests库的添加代理_python爬虫之requests库使用代理

    python爬虫之requests库使用代理 发布时间:2020-03-25 17:00:54 来源:亿速云 阅读:110 作者:小新 今天小编分享的是关于python爬虫的requests库使用代理 ...

  6. appium ConnectionRefusedError,urllib3.exceptions.NewConnectionError,urllib3.exceptions.MaxRetryError

    appium ConnectionRefusedError,urllib3.exceptions.NewConnectionError,urllib3.exceptions.MaxRetryError ...

  7. Python学习教程(Python学习视频_Python学些路线):Day05 总结和练习

    Python学习教程(Python学习视频_Python学些路线):总结和练习 练习清单 寻找"水仙花数". 寻找"完美数". "百钱百鸡" ...

  8. python扫描proxy并获取可用代理ip列表

    mac或linux下可以work的代码如下: # coding=utf-8import requests import re from bs4 import BeautifulSoup as bs i ...

  9. Python 多线程爬取西刺代理

    西刺代理是一个国内IP代理,由于代理倒闭了,所以我就把原来的代码放出来供大家学习吧. 镜像地址:https://www.blib.cn/url/xcdl.html 首先找到所有的tr标签,与class ...

最新文章

  1. 亚马逊 CTO 回应人脸识别技术质疑:技术无罪,我们无责任
  2. 网易云音乐前副总裁教你如何做产品
  3. Leetcode-136. 只出现一次的数字(python3)
  4. java forkjoin MySQL_Java并发fork-join框架
  5. [react] react中调用setState会更新的生命周期有哪几个?
  6. JVM——深入分析对象的内存布局
  7. java网络编程3 -- NIO一些简单说明
  8. 标准模板库(STL)之 vector 列传
  9. 2018 Multi-University Training Contest 3 hdu多校第三场 Problem A:Ascending Rating(单调队列)
  10. 学科实践活动感悟50字_学科实践活动写实记录50字3篇
  11. 高分辨率屏幕下,软件界面分辨率过低的解决办法(经验贴汇总+自身实践)
  12. 模板的实例化与具体化
  13. C/C++开3次方函数cbrt
  14. vmware fusion安装kvm虚拟机
  15. 干支纪年法简便算法_不用万年历快速推算日柱干支法
  16. 如何入职京东、华为、IBM等大厂?你需要学懂这门语言
  17. 音视频解封装:MP4核心Box详解及H264AAC打包方案
  18. arm解锁 j-flash_J-Link固件烧录以及使用J-Flash向arm硬件板下载固件程序(示例代码)...
  19. DFS 简单的剪枝和状态压缩 海贼王之伟大航路
  20. 关于IOS的Autolayout特性的理解以及使用

热门文章

  1. Acunetix 登录凭证无效
  2. 一周程序员新书精选:UNIX传奇、算法设计等上榜TOP10
  3. windows的命令提示符问题
  4. excel表格行列显示十字定位_excel如何设置点击任意一个单元格会出现一个十字架标明所点击单元格的横和列...
  5. 爱好就是一切,灵感源于内在世界,能力取决于知识渊博,魄力在于性格,
  6. C#高德地图经纬度转地理位置或物理地址
  7. Ubuntu安装anaconda3
  8. 网球线的几个常见问题
  9. 利用网站关键字监控工具 实现快速抢标抢单抢市场
  10. 亚马逊:内容付费重构了阅读新场景,阅读也早已跳出纸质书的概念