Python网络爬虫之如何通过selenium模拟浏览器登录微博

微博登录接口很混乱,需要我们通过selenium来模拟浏览器登录。

首先我们需要安装selenium,通过pip安装:

``` pip install selenium

```

然后我们需要下载一个浏览器驱动,推荐使用Chrome,下载地址:http://chromedriver.storage.googleapis.com/index.html,下载好后解压放到Python安装目录下的Scripts文件夹里面。

接下来我们通过代码来模拟登录微博:

```python from selenium import webdriver

driver = webdriver.Chrome() driver.get("https://weibo.com/")

输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")

点击登录按钮 driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[6]/a').click()

```

代码很简单,首先我们通过selenium的webdriver来控制浏览器,然后通过get方法打开微博首页,接着输入用户名密码,最后点击登录按钮即可。

通过以上代码我们可以模拟登录微博,如果遇到微博登录界面有验证码,我们可以通过打码平台来解决,比如云打码平台,代码示例:

```python from selenium import webdriver from yundama_api import identify

验证码打码平台用户名密码 username = "username" password = "password"

打码平台分配的appid与secret appid = "123456" secret = "abcdefg"

driver = webdriver.Chrome() driver.get("https://weibo.com/")

输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")

点击登录按钮

顺便介绍一下我的另一篇专栏, 《100天精通Python - 快速入门到黑科技》专栏,是由 CSDN 内容合伙人丨全站排名 Top 4 的硬核博主 不吃西红柿 倾力打造。 基础知识篇以理论知识为主,旨在帮助没有语言基础的小伙伴,学习我整理成体系的精华知识,快速入门构建起知识框架;黑科技应用篇以实战为主,包括办公效率小工具、爬虫、数据分析、机器学习、计算机视觉、自然语言处理、数据可视化等等,让你会用一段简单的Python程序,自动化解决工作和生活中的问题,甚至成为红客。

Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博相关推荐

  1. python 模拟浏览器selenium_python爬虫10:使用selenium模拟浏览器登录账号

    需求背景: 很多网页通过复杂的JS函数组合,来实现对信息的加密.异步信息处理等,导致很难分析出网页接口. 那么最快速度的实现爬虫功能,是模拟浏览器的行为,加载运行JS,才能破解页面. 模拟浏览器行为, ...

  2. Python小姿势 - Python爬虫:如何使用Python实现网页爬虫

    Python爬虫:如何使用Python实现网页爬虫 网页爬虫(Web Crawler),也叫网络爬虫(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫程序或者脚本 ...

  3. python自动测试p-python网络爬虫之自动化测试工具selenium[二]

    @ 前言 hello,大家好,在上章的内容里我们已经可以爬取到了整个网页下来,当然也仅仅就是一个网页. 因为里面还有很多很多的标签啊之类我们所不需要的东西. 额,先暂且说下本章内容,如果是没有丝毫编程 ...

  4. Python小姿势 - Python爬取网页数据

    Python爬取网页数据 爬取网页数据是一个比较常见的Python应用场景,有很多第三方库可以帮助我们完成这个任务.这里我们介绍一下urllib库中的一个常用方法:urllib.request.url ...

  5. python代码大全p-Python网络爬虫实战项目代码大全(长期更新,欢迎补充)

    WechatSogou[1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典.[1]: https://github ...

  6. python新闻聚合_基于Python的新闻聚合系统网络爬虫研究

    基于 Python 的新闻聚合系统网络爬虫研究 左卫刚 [摘 要] 摘 要 本研究旨在创建一个能够从不同页面布局中提取数据的开源爬 虫,其中包括网络爬虫. API .网络爬虫调度器以及 Socket ...

  7. python小练习:网络视频下载

    python小练习:网络视频下载 互联网上有很多视频网站,提供大量视频.可是大多都要求你使用它提供的专有软件才能下载,或者根本没提供下载的地方.在linux下怎么办?总是有办法的.浏览器扩展,you- ...

  8. python 爬虫动态网页的区别_Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过Selenium模拟浏览器抓取...

    区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器 ...

  9. python小项目-python 小项目

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 事先录制好一段音频,客户接通电话后,自动播放https:blog.csd ...

最新文章

  1. html最新的版本是多少,HTML5之前的版本是什么?
  2. Windows Phone 7 SDK 7.1 Beta2 发布
  3. 存储过程和存储函数初步
  4. 【swjtu】数据结构实验课程设计_图的关键路径
  5. mysql 序列_MySql中序列的应用和总结
  6. Redis学习---(14)Redis 事务
  7. 一份好的商业计划书该怎么写
  8. Unity3D视频教程,Unity3D从入门到精通视频教程
  9. postman电脑版无法安装_Postman系列一:Postman安装及使用过程中遇到的问题
  10. zTree 树形中的搜索定位节点
  11. 刷脸支付重磅来袭是业界的口碑代表
  12. 学习MyBatis-Plus
  13. Affymetrix SNP6.0芯片分析
  14. java 策略模式会员_设计模式——策略模式:会员价格体系的简单实现
  15. 沃Phone可否乐成
  16. C++游戏---皇后PK
  17. 计算机二级题百度云,计算机二级office题库
  18. 新零售线上+线下的完美营销
  19. Java程序朗读文字的实现,jacob.jar
  20. HBase配置AES加密

热门文章

  1. Honda CB650R/CB650F
  2. 知名互联网公司都在使用哪些数据库
  3. 《淘宝店铺设计装修一册通》一1.4 获得图片的存储空间
  4. js - 数学运算(取整,取余)
  5. 洛谷P2245 星际导航
  6. android 打开微信扫一扫
  7. 天道酬勤,记春招之路(完美世界,360,腾讯IEG,网易雷火)
  8. 电脑鸿蒙系统怎么连接无线网络,手提电脑怎样连接WiFi?
  9. 嘉和生物药业(开曼)控股有限公司于香港联交所主板成功上市
  10. 视频监控SVAC安全控制简介