鄙人有个业务,爬58同城网站,原先用阿布云代理,可是20块一天太贵了,于是就用西刺网的代理ip,然后发现好多ip竟然没用

还要输入验证码,于是就写了一些业务代码,当爬到网站标题中包含 '验证码 ' 三个字的时候就自动打开谷歌浏览器,并访问该

网页。

后续会增加一个自动输入验证码的代码,话不多说先上代码

1. 安装selenium         pip install selenium

2.找到谷歌浏览器安装文件目录,查看谷歌浏览器版本,通过

http://chromedriver.storage.googleapis.com/index.html

找到对应版本的 chromedriver

3.把下载好的 chromedriver.exe 放在python安装环境的 Scripts 文件夹下,

注意:该Scripts文件夹要配置在环境变量的path下

4.引包

 from selenium import webdriver

5. 业务代码:

 
title = doc('title')
print(title)
title = doc('title').text()
if '验证码' in title:driver = webdriver.Chrome()  # 调用chrome浏览器driver.maximize_window() #窗口最大化driver.get(url) #访问页面如 www.baidu.comtime.sleep(30)  #线程休眠30秒,防止一下打开太多谷歌浏览器driver.quit() #退出谷歌浏览器

IE,和火狐都感觉没有谷歌好,所以建议部署业务代码建议用谷歌

Python爬虫用(Python+Selenium)打开谷歌,IE,火狐浏览器,并访问网页相关推荐

  1. python爬虫之初恋 selenium

    selenium 是一个web应用测试工具,能够真正的模拟人去操作浏览器. 用她来爬数据比较直观,灵活,和传统的爬虫不同的是, 她真的是打开浏览器,输入表单,点击按钮,模拟登陆,获得数据,样样行.完全 ...

  2. Python爬虫4.4 — selenium高级用法教程

    Python爬虫4.4 - selenium高级用法教程 综述 Headless Chrome 设置请求头 设置代理IP 常用启动项参数options设置 Cookie操作 selenium设置coo ...

  3. python爬虫代理和selenium

    python爬虫代理和selenium 1.代理ip的使用 1.1 获取蘑菇代理中的代理ip def get_ip():response=requests.get('http://piping.mog ...

  4. python爬虫百科-python爬虫百科

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 专业点来说就是应用多台机器同时实现爬虫任务,这多台机器上的爬虫,就是称作分布式爬虫 ...

  5. python爬虫程序-Python网络爬虫实战(一)快速入门

    本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站的爬虫实战来进行. 我们编写网络爬虫最主要 ...

  6. python selenium启动不了火狐浏览器(firefox)的解决办法

    本文章转载深圳SEO_广东SEO网站优化建设 » python selenium启动不了火狐浏览器(firefox)的解决办法,仅供记录,以备学习. selenium3.0之前的版本,是可以直接打开火 ...

  7. python爬虫原理-python学习之python爬虫原理

    原标题:python学习之python爬虫原理 今天我们要向大家详细解说python爬虫原理,什么是python爬虫,python爬虫工作的基本流程是什么等内容,希望对这正在进行python爬虫学习的 ...

  8. python爬虫代码-Python爬虫入门(01) -- 10行代码实现一个爬虫

    跟我学习Python爬虫系列开始啦.带你简单快速高效学习Python爬虫. 一.快速体验一个简单爬虫 以抓取简书首页文章标题和链接为例 简书首页 就是以上红色框内文章的标签,和这个标题对应的url链接 ...

  9. python爬虫代码-python网络爬虫源代码(可直接抓取图片)

    在开始制作爬虫前,我们应该做好前期准备工作,找到要爬的网站,然后查看它的源代码我们这次爬豆瓣美女网站,网址为:用到的工具:pycharm,这是它的图标 ...博文来自:zhang740000的博客 P ...

  10. python爬虫工程师-Python爬虫工程师

    课程概况 3个月精通Python爬虫工程师核心技能. 从入门到进阶,知识点全覆盖,配套实战练习. 包含课程 入门篇 Python编程环境配置及基础语法 掌握Python基础语法及虫技能,利用Pytho ...

最新文章

  1. 任务管理器进程中多个chrome.exe的问题
  2. 全国青少年软件编程python等级考试-全国青少年软件编程等级考试:Python一级考试大纲...
  3. Python文件修改的两种方式
  4. linux 清空catalina.out日志 不需要重启tomcat(五种方法)【转】
  5. leetcode 1631. 最小体力消耗路径(并查集)
  6. GCC中常用的优化的参数
  7. 如何在Linux kernel Makefile中添加宏定义
  8. 求一个数是几位数,并求每位数相加的和
  9. [WPF] 动画Completed事件里获取执行该动画的UI对象
  10. 下载vc_redist运行库
  11. js回避ie缓存的办法
  12. 2021软科中国计算机专业排名
  13. VMware Workstation中安装系统和VMware tools
  14. 视频压缩软件APP有哪些?让我来告诉你答案
  15. ap设置 维盟660g_WayOS|路由器WAN口数设置详细教程
  16. 9 概率机器人 Probabilistic Robotics 二值贝叶斯滤波 占据栅格地图 occupancy grid mapping
  17. GNUPLOT绘图软件学习笔记(1)基本多数据作折线图与cpp调用及一种中文输入办法
  18. x86架构鼻祖-i8086
  19. 【linux】循序渐进学运维-基础篇-mount
  20. 【牛客网OJ题】人民币转换

热门文章

  1. moto XT316 刷机+ROOT权限获取
  2. 淘宝店铺装修之一怎样在自定义内容区做个商品图片轮播展示
  3. 微信开发之网页返回关闭浏览器
  4. 【大数据】医疗大数据“九大业务应用”相关研究
  5. 某小说App返回数据 解密分析
  6. 我碰到的Java实习面试题集合
  7. 微信小程序wx.downloadFile下载图片(甄姬)出现格式.unknown的bug
  8. SpringMVC学习-helloSpringMVC
  9. python生成10个随机密码_python题:随机密码生成。编写程序,在26个字母大小写和9个数字组成的列表中随机生成10个8位密码...
  10. Java实现XML格式化输出