使用selenium实现豆瓣电影信息的自动化搜索

因为之前写了一段时间的python，但是因为某些其它的事情导致没写博客，所以趁着新任务还是有些时间做，赶紧把之前学习到的、了解到的东西整理一下，也是比较基础的东西，一是怕自己遗忘；二来则是给没用过selenium模块的朋友作些许参考。

首先我来解释一下python中的selenium模块。它本质上是一个用作web应用程序测试的框架，Selenium框架可以直接在浏览器中运行，就好比真实用户在浏览器中进行‘点击按钮’，‘文字输入’等操作。其运行的时候，就像是有个‘无形的手’在操纵着你的鼠标、键盘等。

接下来我将使用selenium模块在豆瓣电影页面进行某部电影的检索工作，先把代码贴出来，然后我会针对其中的某些地方进行讲解。

# -- coding: utf-8
from selenium import webdriver
import timeurl='https://www.douban.com/'
browser=webdriver.Chrome()
browser.get(url)#设置隐式等待浏览器加载豆瓣主界面内的frame等元素
browser.implicitly_wait(5)
#使用标签名称定位元素
browser.switch_to.frame(browser.find_elements_by_tag_name('iframe')[0])
#使用xpath解析html文件中的dom树，然后定位元素
bottom=browser.find_element_by_xpath('/html/body/div[1]/div[1]/ul[1]/li[2]')
#模拟点击 '密码登陆按钮' 选择密码登陆
bottom.click()#根据元素的id信息定位元素
input1=browser.find_element_by_id('username')
#your_account位置应该是自己的豆瓣账号
input1.send_keys('your_account') input1=browser.find_element_by_id('password')
#your_password位置应该是自己的豆瓣账号对应的密码信息
input1.send_keys('your_password') login_button=browser.find_element_by_class_name('account-form-field-submit ')
#登陆豆瓣，进行'按钮'的模拟点击
login_button.click()time.sleep(12)searchInput=browser.find_element_by_id('inp-query')
#检索‘秦时明月之沧海横流 (2020)’这部动漫的信息
searchInput.send_keys('秦时明月之沧海横流 (2020)')
searchButton=browser.find_element_by_class_name('inp-btn')
searchButton.click()
browser.quit()

其实代码中的注释解释地也比较清楚，在这段代码中selenium模块所完成的工作就是“打开豆瓣主页面—>输入豆瓣账号、密码信息进行豆瓣的登录—>搜索特定节目信息—>退出浏览器”，这些都是selenium模块自动完成的，全程不需要大家进行任何操作。

当然，大家也可以在此基础上进一步探索selenium模块使用，可以学习一下Webdriver模块的使用，比如‘控制浏览器操作’，‘鼠标事件’，‘键盘事件’等。如果后续有时间的话，我会继续补充这篇博客，大家有问题的话可以在评论区交流讨论！

使用selenium实现豆瓣电影信息的自动化搜索相关推荐

day02 requests请求库爬取豆瓣电影信息+selenium请求库
一. requests请求库爬取豆瓣电影信息 - 请求url http://movie.douban.com/top250 - 请求方式 GET - 请求头 user-agent cookies ...
day02:requests爬取豆瓣电影信息
一.requests爬取豆瓣电影信息 -请求url: https://movie.douban.com/top250 -请求方式: get -请求头: user-agent cookies二.sele ...
python爬取豆瓣电影信息_Python爬虫入门 | 爬取豆瓣电影信息
这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...
python爬虫爬取豆瓣电影信息城市_Python爬虫入门 | 2 爬取豆瓣电影信息
这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...
Python爬虫入门（爬取豆瓣电影信息小结）
Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...
Python3 爬取豆瓣电影信息
原文链接: Python3 爬取豆瓣电影信息上一篇: python3 爬取电影信息下一篇: neo4j 查询豆瓣api https://developers.douban.com/wiki/?t ...
python爬取豆瓣电影信息可行性分析_Python爬虫实现的根据分类爬取豆瓣电影信息功能示例...
本文实例讲述了Python爬虫实现的根据分类爬取豆瓣电影信息功能.分享给大家供大家参考,具体如下: 代码的入口:if __name__ == '__main__': main()#! /usr/bin ...
Python实现可视化界面多线程豆瓣电影信息爬虫，并绘制统计图分析结果
完整代码见链接:https://github.com/kuronekonano/python_scrapy_movie 实现时使用图形界面.多线程.文件操作.数据库编程.网络编程.统计绘图六项技术. ...
java 豆瓣_java 语言实现豆瓣电影信息查询
豆瓣上面有很多电影,有时候要查看个电影信息,去豆瓣搜下还是很方便的,但是如何通过接口的形式来查看豆瓣电影,这对于很多网站.app其实是非常实用的功能,这里笔者附上一个java实现的豆瓣电影信息获取的代 ...

使用selenium实现豆瓣电影信息的自动化搜索

使用selenium实现豆瓣电影信息的自动化搜索相关推荐

最新文章

热门文章