Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博

Python网络爬虫之如何通过selenium模拟浏览器登录微博

微博登录接口很混乱，需要我们通过selenium来模拟浏览器登录。

首先我们需要安装selenium，通过pip安装：

``` pip install selenium

```

然后我们需要下载一个浏览器驱动，推荐使用Chrome，下载地址：http://chromedriver.storage.googleapis.com/index.html，下载好后解压放到Python安装目录下的Scripts文件夹里面。

接下来我们通过代码来模拟登录微博：

```python from selenium import webdriver

driver = webdriver.Chrome() driver.get("https://weibo.com/")

输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")

点击登录按钮 driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[6]/a').click()

```

代码很简单，首先我们通过selenium的webdriver来控制浏览器，然后通过get方法打开微博首页，接着输入用户名密码，最后点击登录按钮即可。

通过以上代码我们可以模拟登录微博，如果遇到微博登录界面有验证码，我们可以通过打码平台来解决，比如云打码平台，代码示例：

```python from selenium import webdriver from yundama_api import identify

验证码打码平台用户名密码 username = "username" password = "password"

打码平台分配的appid与secret appid = "123456" secret = "abcdefg"

driver = webdriver.Chrome() driver.get("https://weibo.com/")

输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")

点击登录按钮

顺便介绍一下我的另一篇专栏，《100天精通Python - 快速入门到黑科技》专栏，是由 CSDN 内容合伙人丨全站排名 Top 4 的硬核博主不吃西红柿倾力打造。 基础知识篇以理论知识为主，旨在帮助没有语言基础的小伙伴，学习我整理成体系的精华知识，快速入门构建起知识框架；黑科技应用篇以实战为主，包括办公效率小工具、爬虫、数据分析、机器学习、计算机视觉、自然语言处理、数据可视化等等，让你会用一段简单的Python程序，自动化解决工作和生活中的问题，甚至成为红客。

Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博相关推荐

python 模拟浏览器selenium_python爬虫10：使用selenium模拟浏览器登录账号
需求背景: 很多网页通过复杂的JS函数组合,来实现对信息的加密.异步信息处理等,导致很难分析出网页接口. 那么最快速度的实现爬虫功能,是模拟浏览器的行为,加载运行JS,才能破解页面. 模拟浏览器行为, ...
Python小姿势 - Python爬虫：如何使用Python实现网页爬虫
Python爬虫:如何使用Python实现网页爬虫网页爬虫(Web Crawler),也叫网络爬虫(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫程序或者脚本 ...
python自动测试p-python网络爬虫之自动化测试工具selenium[二]
@ 前言 hello,大家好,在上章的内容里我们已经可以爬取到了整个网页下来,当然也仅仅就是一个网页. 因为里面还有很多很多的标签啊之类我们所不需要的东西. 额,先暂且说下本章内容,如果是没有丝毫编程 ...
Python小姿势 - Python爬取网页数据
Python爬取网页数据爬取网页数据是一个比较常见的Python应用场景,有很多第三方库可以帮助我们完成这个任务.这里我们介绍一下urllib库中的一个常用方法:urllib.request.url ...
python代码大全p-Python网络爬虫实战项目代码大全（长期更新，欢迎补充）
WechatSogou[1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典.[1]: https://github ...
python新闻聚合_基于Python的新闻聚合系统网络爬虫研究
基于 Python 的新闻聚合系统网络爬虫研究左卫刚 [摘要] 摘要本研究旨在创建一个能够从不同页面布局中提取数据的开源爬虫,其中包括网络爬虫. API .网络爬虫调度器以及 Socket ...
python小练习：网络视频下载
python小练习:网络视频下载互联网上有很多视频网站,提供大量视频.可是大多都要求你使用它提供的专有软件才能下载,或者根本没提供下载的地方.在linux下怎么办?总是有办法的.浏览器扩展,you- ...
python 爬虫动态网页的区别_Python开发爬虫之动态网页抓取篇：爬取博客评论数据——通过Selenium模拟浏览器抓取...
区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器 ...
python小项目-python 小项目
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 事先录制好一段音频,客户接通电话后,自动播放https:blog.csd ...

Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博

Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博相关推荐

最新文章

热门文章