使用selenium实现豆瓣电影信息的自动化搜索
因为之前写了一段时间的python,但是因为某些其它的事情导致没写博客,所以趁着新任务还是有些时间做,赶紧把之前学习到的、了解到的东西整理一下,也是比较基础的东西,一是怕自己遗忘;二来则是给没用过selenium模块的朋友作些许参考。
首先我来解释一下python中的selenium模块。它本质上是一个用作web应用程序测试的框架,Selenium框架可以直接在浏览器中运行,就好比真实用户在浏览器中进行‘点击按钮’,‘文字输入’等操作。其运行的时候,就像是有个‘无形的手’在操纵着你的鼠标、键盘等。
接下来我将使用selenium模块在豆瓣电影页面进行某部电影的检索工作, 先把代码贴出来,然后我会针对其中的某些地方进行讲解。
# -- coding: utf-8
from selenium import webdriver
import timeurl='https://www.douban.com/'
browser=webdriver.Chrome()
browser.get(url)#设置隐式等待浏览器加载豆瓣主界面内的frame等元素
browser.implicitly_wait(5)
#使用标签名称定位元素
browser.switch_to.frame(browser.find_elements_by_tag_name('iframe')[0])
#使用xpath解析html文件中的dom树,然后定位元素
bottom=browser.find_element_by_xpath('/html/body/div[1]/div[1]/ul[1]/li[2]')
#模拟点击 '密码登陆按钮' 选择密码登陆
bottom.click()#根据元素的id信息定位元素
input1=browser.find_element_by_id('username')
#your_account位置应该是自己的豆瓣账号
input1.send_keys('your_account') input1=browser.find_element_by_id('password')
#your_password位置应该是自己的豆瓣账号对应的密码信息
input1.send_keys('your_password') login_button=browser.find_element_by_class_name('account-form-field-submit ')
#登陆豆瓣,进行'按钮'的模拟点击
login_button.click()time.sleep(12)searchInput=browser.find_element_by_id('inp-query')
#检索‘秦时明月之沧海横流 (2020)’这部动漫的信息
searchInput.send_keys('秦时明月之沧海横流 (2020)')
searchButton=browser.find_element_by_class_name('inp-btn')
searchButton.click()
browser.quit()
其实代码中的注释解释地也比较清楚,在这段代码中selenium模块所完成的工作就是“打开豆瓣主页面
—>输入豆瓣账号、密码信息进行豆瓣的登录
—>搜索特定节目信息
—>退出浏览器
”,这些都是selenium模块自动完成的,全程不需要大家进行任何操作。
当然,大家也可以在此基础上进一步探索selenium模块使用,可以学习一下Webdriver模块的使用,比如‘控制浏览器操作’,‘鼠标事件’,‘键盘事件’等。如果后续有时间的话,我会继续补充这篇博客,大家有问题的话可以在评论区交流讨论!
使用selenium实现豆瓣电影信息的自动化搜索相关推荐
- day02 requests请求库爬取豆瓣电影信息+selenium请求库
一. requests请求库爬取豆瓣电影信息 - 请求url http://movie.douban.com/top250 - 请求方式 GET - 请求头 user-agent cookies ...
- day02:requests爬取豆瓣电影信息
一.requests爬取豆瓣电影信息 -请求url: https://movie.douban.com/top250 -请求方式: get -请求头: user-agent cookies二.sele ...
- python爬取豆瓣电影信息_Python爬虫入门 | 爬取豆瓣电影信息
这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...
- python爬虫爬取豆瓣电影信息城市_Python爬虫入门 | 2 爬取豆瓣电影信息
这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...
- Python爬虫入门(爬取豆瓣电影信息小结)
Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...
- Python3 爬取豆瓣电影信息
原文链接: Python3 爬取豆瓣电影信息 上一篇: python3 爬取电影信息 下一篇: neo4j 查询 豆瓣api https://developers.douban.com/wiki/?t ...
- python爬取豆瓣电影信息可行性分析_Python爬虫实现的根据分类爬取豆瓣电影信息功能示例...
本文实例讲述了Python爬虫实现的根据分类爬取豆瓣电影信息功能.分享给大家供大家参考,具体如下: 代码的入口:if __name__ == '__main__': main()#! /usr/bin ...
- Python实现可视化界面多线程豆瓣电影信息爬虫,并绘制统计图分析结果
完整代码见链接:https://github.com/kuronekonano/python_scrapy_movie 实现时使用图形界面.多线程.文件操作.数据库编程.网络编程.统计绘图六项技术. ...
- java 豆瓣_java 语言实现豆瓣电影信息查询
豆瓣上面有很多电影,有时候要查看个电影信息,去豆瓣搜下还是很方便的,但是如何通过接口的形式来查看豆瓣电影,这对于很多网站.app其实是非常实用的功能,这里笔者附上一个java实现的豆瓣电影信息获取的代 ...
最新文章
- easyui treegrid 获取新添加行inserted_18行JavaScript代码构建一个倒数计时器
- Webservice开发之xsd文件示例代码
- 7.12固定信息认证
- 运用shell,python自动下载linux系统运维
- (八)boost库之异常处理
- Java IO: PipedOutputStream
- sign check fail: check Sign and Data Fail!-错误处理
- python——asyncio模块实现协程、异步编程(二)
- 给窗口添加背景图的案例
- idea zookeeper插件使用_zookeeper的Java客户端操作
- 数字倒序Java_怎么用Java编写一个程序,将输入的数字重新倒叙排列?
- 数学建模安装matlab,数学建模神器——Matlab下载安装教程
- Mac版本Octane渲染器安装教程支持M1和英特尔全系列分享
- 第一章 批判性思维概念
- 华为y220t android版本升级,华为 Y220T 刷机详细图文教程
- 6. Excel 图表制作
- 英文经典老歌列表~~~~
- instrument之Time Profiler总结
- 如何治理 Electron 版本淘宝直播应用崩溃?
- 【上传vip专享资源,瓜分奖金池】第一期获奖名单
热门文章
- 减库存怎么处理 java_java减库存
- 网络安全体系与网络安全模型
- 发力数字化转型,容智信息携自研创新科技惊艳亮相2021世界人工智能大会
- 27岁从业软件测试5年的我被无情的辞退了
- 高通 qca-wifi 移植
- 关于小米路由器的局域网内相互ping设备IP的解决方法
- USDCNY--USDCNH 配对交易___境内及离岸人民币即期的协整关系及配对交易策略分析
- WEB前端开发工程师 学习第二天 文字文本
- 危化品柜颜色如何区分?
- 数码宝贝 皇家骑士团(奥米加兽、金甲龙兽、红莲骑士兽、杜纳斯兽、剑皇兽、究极V龙兽、阿尔法兽、颅骨兽、八足马兽、芳香兽、艾可萨兽、顽固兽、杰斯兽)