因为之前写了一段时间的python,但是因为某些其它的事情导致没写博客,所以趁着新任务还是有些时间做,赶紧把之前学习到的、了解到的东西整理一下,也是比较基础的东西,一是怕自己遗忘;二来则是给没用过selenium模块的朋友作些许参考。

首先我来解释一下python中的selenium模块。它本质上是一个用作web应用程序测试的框架,Selenium框架可以直接在浏览器中运行,就好比真实用户在浏览器中进行‘点击按钮’,‘文字输入’等操作。其运行的时候,就像是有个‘无形的手’在操纵着你的鼠标、键盘等。

接下来我将使用selenium模块在豆瓣电影页面进行某部电影的检索工作, 先把代码贴出来,然后我会针对其中的某些地方进行讲解。

# -- coding: utf-8
from selenium import webdriver
import timeurl='https://www.douban.com/'
browser=webdriver.Chrome()
browser.get(url)#设置隐式等待浏览器加载豆瓣主界面内的frame等元素
browser.implicitly_wait(5)
#使用标签名称定位元素
browser.switch_to.frame(browser.find_elements_by_tag_name('iframe')[0])
#使用xpath解析html文件中的dom树,然后定位元素
bottom=browser.find_element_by_xpath('/html/body/div[1]/div[1]/ul[1]/li[2]')
#模拟点击 '密码登陆按钮' 选择密码登陆
bottom.click()#根据元素的id信息定位元素
input1=browser.find_element_by_id('username')
#your_account位置应该是自己的豆瓣账号
input1.send_keys('your_account') input1=browser.find_element_by_id('password')
#your_password位置应该是自己的豆瓣账号对应的密码信息
input1.send_keys('your_password') login_button=browser.find_element_by_class_name('account-form-field-submit ')
#登陆豆瓣,进行'按钮'的模拟点击
login_button.click()time.sleep(12)searchInput=browser.find_element_by_id('inp-query')
#检索‘秦时明月之沧海横流 (2020)’这部动漫的信息
searchInput.send_keys('秦时明月之沧海横流 (2020)')
searchButton=browser.find_element_by_class_name('inp-btn')
searchButton.click()
browser.quit()

其实代码中的注释解释地也比较清楚,在这段代码中selenium模块所完成的工作就是“打开豆瓣主页面—>输入豆瓣账号、密码信息进行豆瓣的登录—>搜索特定节目信息—>退出浏览器”,这些都是selenium模块自动完成的,全程不需要大家进行任何操作。

当然,大家也可以在此基础上进一步探索selenium模块使用,可以学习一下Webdriver模块的使用,比如‘控制浏览器操作’,‘鼠标事件’,‘键盘事件’等。如果后续有时间的话,我会继续补充这篇博客,大家有问题的话可以在评论区交流讨论!

使用selenium实现豆瓣电影信息的自动化搜索相关推荐

  1. day02 requests请求库爬取豆瓣电影信息+selenium请求库

    一. requests请求库爬取豆瓣电影信息 - 请求url http://movie.douban.com/top250 - 请求方式 GET - 请求头 user-agent    cookies ...

  2. day02:requests爬取豆瓣电影信息

    一.requests爬取豆瓣电影信息 -请求url: https://movie.douban.com/top250 -请求方式: get -请求头: user-agent cookies二.sele ...

  3. python爬取豆瓣电影信息_Python爬虫入门 | 爬取豆瓣电影信息

    这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...

  4. python爬虫爬取豆瓣电影信息城市_Python爬虫入门 | 2 爬取豆瓣电影信息

    这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...

  5. Python爬虫入门(爬取豆瓣电影信息小结)

    Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...

  6. Python3 爬取豆瓣电影信息

    原文链接: Python3 爬取豆瓣电影信息 上一篇: python3 爬取电影信息 下一篇: neo4j 查询 豆瓣api https://developers.douban.com/wiki/?t ...

  7. python爬取豆瓣电影信息可行性分析_Python爬虫实现的根据分类爬取豆瓣电影信息功能示例...

    本文实例讲述了Python爬虫实现的根据分类爬取豆瓣电影信息功能.分享给大家供大家参考,具体如下: 代码的入口:if __name__ == '__main__': main()#! /usr/bin ...

  8. Python实现可视化界面多线程豆瓣电影信息爬虫,并绘制统计图分析结果

    完整代码见链接:https://github.com/kuronekonano/python_scrapy_movie 实现时使用图形界面.多线程.文件操作.数据库编程.网络编程.统计绘图六项技术. ...

  9. java 豆瓣_java 语言实现豆瓣电影信息查询

    豆瓣上面有很多电影,有时候要查看个电影信息,去豆瓣搜下还是很方便的,但是如何通过接口的形式来查看豆瓣电影,这对于很多网站.app其实是非常实用的功能,这里笔者附上一个java实现的豆瓣电影信息获取的代 ...

最新文章

  1. easyui treegrid 获取新添加行inserted_18行JavaScript代码构建一个倒数计时器
  2. Webservice开发之xsd文件示例代码
  3. 7.12固定信息认证
  4. 运用shell,python自动下载linux系统运维
  5. (八)boost库之异常处理
  6. Java IO: PipedOutputStream
  7. sign check fail: check Sign and Data Fail!-错误处理
  8. python——asyncio模块实现协程、异步编程(二)
  9. 给窗口添加背景图的案例
  10. idea zookeeper插件使用_zookeeper的Java客户端操作
  11. 数字倒序Java_怎么用Java编写一个程序,将输入的数字重新倒叙排列?
  12. 数学建模安装matlab,数学建模神器——Matlab下载安装教程
  13. Mac版本Octane渲染器安装教程支持M1和英特尔全系列分享
  14. 第一章 批判性思维概念
  15. 华为y220t android版本升级,华为 Y220T 刷机详细图文教程
  16. 6. Excel 图表制作
  17. 英文经典老歌列表~~~~
  18. instrument之Time Profiler总结
  19. 如何治理 Electron 版本淘宝直播应用崩溃?
  20. 【上传vip专享资源,瓜分奖金池】第一期获奖名单

热门文章

  1. 减库存怎么处理 java_java减库存
  2. 网络安全体系与网络安全模型
  3. 发力数字化转型,容智信息携自研创新科技惊艳亮相2021世界人工智能大会
  4. 27岁从业软件测试5年的我被无情的辞退了
  5. 高通 qca-wifi 移植
  6. 关于小米路由器的局域网内相互ping设备IP的解决方法
  7. USDCNY--USDCNH 配对交易___境内及离岸人民币即期的协整关系及配对交易策略分析
  8. WEB前端开发工程师 学习第二天 文字文本
  9. 危化品柜颜色如何区分?
  10. 数码宝贝 皇家骑士团(奥米加兽、金甲龙兽、红莲骑士兽、杜纳斯兽、剑皇兽、究极V龙兽、阿尔法兽、颅骨兽、八足马兽、芳香兽、艾可萨兽、顽固兽、杰斯兽)