python3 selenium模块Chrome设置代理ip的实现

selenium模块Chrome设置代理ip的实现代码:

from selenium import webdriver
chromeOptions = webdriver.ChromeOptions()# 设置代理
PROXY = "124.206.133.227:80"
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--proxy-server={0}'.format(PROXY))
# 一定要注意,=两边不能有空格,不能是这样--proxy-server = 202.20.16.82:10152
browser = webdriver.Chrome(chrome_options = chromeOptions)# 查看本机ip,查看代理是否起作用
browser.get("http://httpbin.org/ip")
print(browser.page_source)# 退出,清除浏览器缓存
browser.quit()

注意事项:
1,代理IP最好是稳定的固定IP,不要选动态IP。我们常用的爬虫IP是高匿名动态IP,是通过拨号动态产生的,时效性很短,一般在1~3分钟。对于scrapy这种并发度很高,又不需要登录的爬虫来说,非常合适,但是在浏览器渲染类爬虫中并不适用。
2,代理IP的速度。因为selenium爬虫采用的是浏览器渲染技术,本身速度就很慢。如果选择的代理IP速度较慢,就会大大增加爬取的时间。
3,电脑内存要够大。因为chrome占内存较大,在并发度很高的情况下,容易造成浏览器崩溃,也就是程序崩溃。
4,在程序结束时,调用 browser.quit( ) 清除浏览器缓存。

转载于:https://www.cnblogs.com/lizm166/p/10875209.html

python3 selenium模块Chrome设置代理ip的实现相关推荐

  1. pyppeteer使用阿布云代理隧道问题以及代码 和代理是否成功 python3 selenium设置代理ip的实现 IP 非真人甑别

    python3 selenium模块Chrome设置代理ip的实现 selenium模块Chrome设置代理ip的实现代码: from selenium import webdriver chrome ...

  2. 已解决urllib模块设置代理ip

    已解决urllib模块设置代理ip 文章目录 报错代码 报错翻译 报错原因 解决方法 千人全栈VIP答疑群联系博主帮忙解决报错 报错代码 最近用urllib编写了一个简单的爬虫下载网上文件的代码,刚运 ...

  3. python爬虫浏览器伪装和设置代理ip

    1.python爬虫浏览器伪装 #导入urllib.request模块 import urllib.request#设置请求头 headers=("User-Agent",&quo ...

  4. python设置电脑ip代理_设置代理IP在Python中使用

    在Pyhton中要怎么使用代理IP?我们经常说代理IP能够让Python更好的发挥爬虫效果,首先我们要懂得如何在python语言中设置代理IP来利用. 1.urllib模块设置代理 如果我们频繁用一个 ...

  5. python爬虫设置代理ip池——方法(一)

    """ 在使用python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术,高强度.高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网 ...

  6. python爬虫使用代理ip_python爬虫如何设置代理ip

    python爬虫设置代理ip的方法:首先写入获取到的ip地址到proxy:然后用百度检测ip代理是否成功,并请求网页传的参数:最后发送get请求,并获取返回页面保存到本地. [相关学习推荐:pytho ...

  7. 路由设置代理ip的作用

    1.给连接路由的设备使用代理ip 通常手机电脑等设备连接到路由器上的上网IP地址都是同样的,这样就容易造成IP限制,导致许多网络操作出现异常,代理ip的作用就是让你的上网地址变成代理ip的地址,让每个 ...

  8. 干货|Python爬虫如何设置代理IP

    在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败.高强度.高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,这里讲述 ...

  9. python爬虫设置代理ip池

    在使用python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术,高强度.高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,那如何解决呢?使用代 ...

最新文章

  1. Terracotta tc-config.xml配置说明(这个真的是转的)
  2. SQLite管理工具绿色
  3. 多读多写多实践---给初学编程者的建议
  4. opencv cuda使用笔记
  5. AdaBoostClassifier实战
  6. 2013-10-31 《October 31st, 2013》
  7. SP1043 GSS1 - Can you answer these queries I 猫树
  8. 我扒了 6730 个微信用户数据,得出了这些结论......
  9. 闭包函数 use 改变外部变量
  10. Linux登录日志配置,Unix系统用户登录及操作命令日志配置的方法
  11. 精准目标群体,精确博客选择——谈feedsky经典博客Market力作
  12. 腾讯云部署Flask应用
  13. 学习Oracle数据库入门到精通教程资料合集
  14. ReSharper配置及用法(转)
  15. MySQL通用函数汇总大全
  16. 1631 小鲨鱼在51nod小学(线段树区间修改+单点查询:不用下传lazy的区间修改)
  17. 奇葩公司规定程序员工资按代码行数算工资,个个提成这么高?
  18. php psy,psysh --php交互式控制台
  19. Locust使用手册--编写一个locustfile
  20. centos 5.6 安装HP打印机--成功版本

热门文章

  1. linux系统安全与日志分析
  2. Linux:僵尸进程 Zombie;waitpid
  3. 多节点Linux部署
  4. 物流软件全过程管理办法
  5. 关于如何在word中使用EndNote引用知网的文献
  6. 看我骚操作‘破解’某查查app的sign以及某眼查的Authorization!
  7. 广西外国语学院计算机考试真题,广西外国语学院综合素质测试面试题历年总结...
  8. 吴恩达机器学习——反向传播算法
  9. 今日头条-新年集卡分2亿,每晚8:45红包雨
  10. mesothelioma-弥漫性间皮瘤