Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博
Python网络爬虫之如何通过selenium模拟浏览器登录微博
微博登录接口很混乱,需要我们通过selenium来模拟浏览器登录。
首先我们需要安装selenium,通过pip安装:
``` pip install selenium
```
然后我们需要下载一个浏览器驱动,推荐使用Chrome,下载地址:http://chromedriver.storage.googleapis.com/index.html,下载好后解压放到Python安装目录下的Scripts文件夹里面。
接下来我们通过代码来模拟登录微博:
```python from selenium import webdriver
driver = webdriver.Chrome() driver.get("https://weibo.com/")
输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")
点击登录按钮 driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[6]/a').click()
```
代码很简单,首先我们通过selenium的webdriver来控制浏览器,然后通过get方法打开微博首页,接着输入用户名密码,最后点击登录按钮即可。
通过以上代码我们可以模拟登录微博,如果遇到微博登录界面有验证码,我们可以通过打码平台来解决,比如云打码平台,代码示例:
```python from selenium import webdriver from yundama_api import identify
验证码打码平台用户名密码 username = "username" password = "password"
打码平台分配的appid与secret appid = "123456" secret = "abcdefg"
driver = webdriver.Chrome() driver.get("https://weibo.com/")
输入用户名密码 driver.find_element_by_id("loginname").send_keys("username") driver.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[3]/div[2]/div/input').send_keys("password")
点击登录按钮
顺便介绍一下我的另一篇专栏, 《100天精通Python - 快速入门到黑科技》专栏,是由 CSDN 内容合伙人丨全站排名 Top 4 的硬核博主 不吃西红柿 倾力打造。 基础知识篇以理论知识为主,旨在帮助没有语言基础的小伙伴,学习我整理成体系的精华知识,快速入门构建起知识框架;黑科技应用篇以实战为主,包括办公效率小工具、爬虫、数据分析、机器学习、计算机视觉、自然语言处理、数据可视化等等,让你会用一段简单的Python程序,自动化解决工作和生活中的问题,甚至成为红客。
Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博相关推荐
- python 模拟浏览器selenium_python爬虫10:使用selenium模拟浏览器登录账号
需求背景: 很多网页通过复杂的JS函数组合,来实现对信息的加密.异步信息处理等,导致很难分析出网页接口. 那么最快速度的实现爬虫功能,是模拟浏览器的行为,加载运行JS,才能破解页面. 模拟浏览器行为, ...
- Python小姿势 - Python爬虫:如何使用Python实现网页爬虫
Python爬虫:如何使用Python实现网页爬虫 网页爬虫(Web Crawler),也叫网络爬虫(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫程序或者脚本 ...
- python自动测试p-python网络爬虫之自动化测试工具selenium[二]
@ 前言 hello,大家好,在上章的内容里我们已经可以爬取到了整个网页下来,当然也仅仅就是一个网页. 因为里面还有很多很多的标签啊之类我们所不需要的东西. 额,先暂且说下本章内容,如果是没有丝毫编程 ...
- Python小姿势 - Python爬取网页数据
Python爬取网页数据 爬取网页数据是一个比较常见的Python应用场景,有很多第三方库可以帮助我们完成这个任务.这里我们介绍一下urllib库中的一个常用方法:urllib.request.url ...
- python代码大全p-Python网络爬虫实战项目代码大全(长期更新,欢迎补充)
WechatSogou[1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典.[1]: https://github ...
- python新闻聚合_基于Python的新闻聚合系统网络爬虫研究
基于 Python 的新闻聚合系统网络爬虫研究 左卫刚 [摘 要] 摘 要 本研究旨在创建一个能够从不同页面布局中提取数据的开源爬 虫,其中包括网络爬虫. API .网络爬虫调度器以及 Socket ...
- python小练习:网络视频下载
python小练习:网络视频下载 互联网上有很多视频网站,提供大量视频.可是大多都要求你使用它提供的专有软件才能下载,或者根本没提供下载的地方.在linux下怎么办?总是有办法的.浏览器扩展,you- ...
- python 爬虫动态网页的区别_Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过Selenium模拟浏览器抓取...
区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器 ...
- python小项目-python 小项目
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 事先录制好一段音频,客户接通电话后,自动播放https:blog.csd ...
最新文章
- html最新的版本是多少,HTML5之前的版本是什么?
- Windows Phone 7 SDK 7.1 Beta2 发布
- 存储过程和存储函数初步
- 【swjtu】数据结构实验课程设计_图的关键路径
- mysql 序列_MySql中序列的应用和总结
- Redis学习---(14)Redis 事务
- 一份好的商业计划书该怎么写
- Unity3D视频教程,Unity3D从入门到精通视频教程
- postman电脑版无法安装_Postman系列一:Postman安装及使用过程中遇到的问题
- zTree 树形中的搜索定位节点
- 刷脸支付重磅来袭是业界的口碑代表
- 学习MyBatis-Plus
- Affymetrix SNP6.0芯片分析
- java 策略模式会员_设计模式——策略模式:会员价格体系的简单实现
- 沃Phone可否乐成
- C++游戏---皇后PK
- 计算机二级题百度云,计算机二级office题库
- 新零售线上+线下的完美营销
- Java程序朗读文字的实现,jacob.jar
- HBase配置AES加密