Python(四）IP代理

一、

import urllib2

if __name__ == '__main__' :

url = 'http://www.baidu.com'

proxy = {'http':'124.235.181.175:80'}

proxy_support = urllib2.ProxyHandler(proxy)

opener = urllib2.build_opener(proxy_support)

opener.addheaders = [('User-Agent','Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19')]

urllib2.install_opener(opener) # 用install_opener将配置好的opener安装到全局环境中，这样所有的urllib2.urlopen都会自动使用代理

response = urllib2.urlopen(url)

html = response.read().decode('GBK')

print html

二、

import urllib2

if __name__ == '__main__' :

url = 'http://www.baidu.com'

proxy = {'http':'124.235.181.175:80'}

proxy_handler = urllib2.ProxyHandler(proxy)

opener = urllib2.build_opener(proxy_handler)

req = opener.open(url) # 只有使用opener.open()方法发送请求才使用自定义的代理，而urlopen()则不使用自定义代理

html = req.read().decode('utf-8')

print html

三、

import urllib2

import random

if __name__ == '__main__' :

url = 'http://www.baidu.com/'

proxy_list = [

{'http' : '124.88.67.81:80'},

{'http' : '124.235.181.175:80'},

{'http' : '123.53.134.254:8010'},

{'http' : '61.135.217.7:80'},

{'http' : '116.77.204.2:80'}

]

proxy = random.choice(proxy_list) # 随机选择一个代理

proxy_handler = urllib2.ProxyHandler(proxy) # 使用选择的代理构建代理处理器对象

opener = urllib2.build_opener(proxy_handler)

opener.addheaders = [('User-Agent','Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19')]

urllib2.install_opener(opener)

req = urllib2.Request(url)

response = urllib2.urlopen(req)

html = response.read().decode('utf-8')

print html

转载于:https://blog.51cto.com/7175088/2309657

Python(四）IP代理相关推荐

python爬虫ip代理没有作用_可能是一份没什么用的爬虫代理IP指南
写在前面做爬虫的小伙伴一般都绕不过代理IP这个问题. PS:如果还没遇到被封IP的场景,要不你量太小人家懒得理你,要不就是人家压根不在乎... 爬虫用户自己是没有能力维护一系列的代理服务器和代理IP ...
python爬虫ip代理池_爬虫教程-Python3网络爬虫开发——IP代理池的维护
该楼层疑似违规已被系统折叠隐藏此楼查看此楼准备工作要实现IP代理池我们首先需要成功安装好了 Redis 数据库并启动服务,另外还需要安装 Aiohttp.Requests.RedisPy.PyQ ...
Python建立ip代理池(多线程)
转载自公众号:JAVAandPythonJun 说在前面的话 Hello,我是JAP君,相信经常使用爬虫的朋友对代理ip应该比较熟悉,代理ip就是可以模拟一个ip地址去访问某个网站.我们有时候需要爬取 ...
python免费IP代理，简单采集一下康康能不能用~
嗨害大家好鸭!我是小熊猫❤ 最近疫情有一点严重在家不知道整点啥好整个免费的IP代理康康好用不好用基本开发环境 Python 3.6 Pycharm 相关模块的使用 import requests ...
Python requests ip代理爬虫报错 HTTPSConnectionPool(host=‘xxxxx‘, port=443) Max retries exceed
本人系统:macOS10.15.6 Catalina 场景:使用Python requests 包+ip代理池爬取网站数据出现报错:HTTPSConnectionPool(host='xxxxx', ...
手把手教你用Python搭建IP代理池，轻松破解请求频率限制反爬虫~
我们所写的爬虫,它对服务器发出的网络请求频率要比正常用户的高的多,从而开发者可以将请求频率过高的用户视为爬虫程序,从而来限制爬虫程序. 今天志斌就来给大家分享一下,如何用Python搭建一个IP代理池 ...
python爬虫 ip代理_Python 爬虫入门（二）—— IP代理使用
上一节,大概讲述了Python 爬虫的编写流程, 从这节开始主要解决如何突破在爬取的过程中限制.比如,IP.JS.验证码等.这节主要讲利用IP代理突破. 1.关于代理简单的说,代理就是换个身份.网络 ...
手把手教你用Python搭建IP代理池
今天给大家分享一下,如何用Python搭建一个IP代理池,来破解服务器通过对用户请求频率进行限制的反爬虫. 01 原理因为客户端的IP地址是唯一的,所以开发者便将IP地址作为客户端的身份标识. 服务 ...
Python requests ip代理爬虫报错 HTTPSConnectionPool(host=‘xxxxx‘, port=443): Max retries exceed...
本人系统:macOS10.15.6 Catalina 场景:使用Python requests 包+ip代理池爬取网站数据出现报错:HTTPSConnectionPool(host='xxxxx', ...
python爬虫ip代理_python爬虫批量抓取ip代理的方法（代码）
本篇文章给大家带来的内容是关于python爬虫批量抓取ip代理的方法(代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 使用爬虫抓取数据时,经常要用到多个ip代理,防止单个ip访 ...

Python(四）IP代理

Python(四）IP代理相关推荐

最新文章

热门文章