python web自动化_Selenium+Python Web自动化
Selenium官方网站
http://selenium-python.readthedocs.io/
配置使用环境
下载相应的浏览器驱动, Firefox 是默认的
本文以 chrome 为主 ,放在scripts目录下
ChromeDriver 官方下载地址 : 所有版本的 ChromeDriver
文档参考
一份简单的测试 demo
1 #coding=utf-8
2 from selenium importwebdriver3 importos4 importtime5 #set little time stop and big time stop for viewing changes
6 little_time_stop = 1
7 big_time_stop = 2
8 #默认广告条数
9 ads_num_require = 8
10 #请求连接
11 req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
12 #打开浏览器
13
14 browser =webdriver.Chrome()15 #开始请求
16 17browser.get(req_url)17 #获取所有的广告
18
19 all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')20 #当前广告条数
21 ads_num_current =len(all_ads_li)22 print "Has been got %d ads" %(ads_num_current)23 #如果广告条数与默认不符
24 if ads_num_current <25 print number of ads is not enough current : require:>
27 #获取顶部连接
28 i =029 for ads_li inall_ads_li:30 time.sleep(big_time_stop)31 i = i+1
32 print "ads %d :" %i33 try:34 main = ads_li.find_element_by_css_selector('h3 a')35 except:36 print "\tError: ads %d cann't find" %(i)37 else:38 print "\tReady: visit ads %d" %(i)39 main.click()40 print "\tSucess: visit ads %d" %(i)41 time.sleep(little_time_stop)42 try:43 img_link = ads_li.find_element_by_class_name('e_biyi_img')44 except:45 print "\tError : no img in ads %d" %(i)46 else:47 print "\tReady : visit img_link %d" %(i)48 img_link.click()49 print "\tSuccess : visit img_link %d" %(i)50 time.sleep(little_time_stop)51 try:52 child_div = ads_li.find_element_by_class_name('e_biyi_childLink');53 except:54 print "\tError : no child link in ads %d" %(i)55 else:56 try:57 child_links = child_div.find_elements_by_css_selector('a')58 except:59 print "\tError : find child_links error"
60 else:61 num_links =len(child_links)62 print "\tSuccess : there are %d child_links" %(num_links)63 j =064 for child_a inchild_links:65 j = j + 1
66 print "\t\tReady : visit child link %d in ads %d" %(j, i)67 child_a.click()68 print "\t\tSuccess : visit child link %d in ads %d" %(j, i)69 time.sleep(little_time_stop)70 print "End and thanks for your using!"
71 #下面代码选择取消注释
72 #延时
73 #time.sleep(5)
74 #关闭当前窗口
75 #browser.close()
76 #关闭所有已经打开的窗口
77 #browser.quit()
定位操作
以下是所有定位操作的 API :
返回一个匹配元素, 即一个 WebElement 元素
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表
find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()
使用的时候需注意下面几点 :
python selenium 提供了两种对象 : WebDriver 和 WebElement
这两种对象都可以使用这些 API
这些 API 一旦执行失败(即查找不到), 就会抛出异常
因此必须使用 try: .. except: ... 机制避免错误的行为影响程序继续进行
WebDriver 调用以上 API 进行全局定位
WebElement 调用以上 API 可以进行层级定位, 即 查找当前元素的子元素
WebDriver 的使用
开始的时候必须要有初始化一个 WebDriver 实例, 即下面的 browser 用来对浏览器进行控制以及页面的访问
# 请求连接
req_url ="http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
# 打开浏览器
browser =webdriver.Chrome()
# 开始请求
browser.get(req_url)
接着, 就可以使用以上 API 进行当前页面的全局查找, 比如 :
# 获取所有的广告
all_ads_li =browser.find_elements_by_css_selector('#e_idea_pp li')
WebElement 的使用
使用 browser.find_element_by_xx() 得到的是一个 WebElement 实例
使用获得的实例调用上面的 API 即可进行层级查找
使用 browser.find_elements_by_xx() 得到的是一个元素是 WebElement 实例的 list
通过对 list 的遍历, 即可对各个实例进行相应的操作
WebDriver 的一些常用操作
browser.curren_url : 获取当前加载页面的 URL
browser.close() : 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭
browser.quit() : 关闭所有窗口并停止 ChromeDriver 的执行
browser.add_cookie(cookie_dict) : 为当前会话添加 cookie
browser.get_cookie(name) : 得到执行 cookie
browser.get_cookies() : 得到所有的 cookie
driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
browser.delete_all_cookies() : 删除当前会话的所有cookie
browser.delete_cookie(name) : 删除指定 cookie
browser.back() : 相当于浏览器的后退历史记录
browser.forward() : 相当于浏览器的前进历史记录
browser.execute_script(script, *args) : 同步执行 js 脚本
browser.execute_async_script(script, *args) : 异步执行 js 脚本
browser.get(url) : 在当前窗口加载 url
browser.refresh() : 刷新当前页面
browser.current_window_handle : 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口
browser.window_handles : 当前浏览器中的已经打开的所有窗口, 是一个 list
browser.switch_to_window(window_handle) : 切换 window_handle 指向的窗口
browser.title : 当前页面的 title
browser.name : 当前浏览器的名字
WebElement 的一些常用操作
webEle.clear() : 清楚元素的内容, 假如这个元素是一个文本元素
webEle.click() : 点击当前元素
webEle,is_displayed() : 当前元素是否可见
webEle.is_enabled() : 当前元素是否禁止, 比如经常会禁用一些元素的点击
webEle.is_selected() : 当前元素是否选中, 文本输入框的内容
webEle.send_keys(*value) : 向当前元素模拟键盘事件
webEle.submit() : 提交表单
webEle.tag_name : 当前元素的标签名
webEle.text : 当前元素的内容
webEle.get_attribute(name) : 获取当前元素执行属性的值
25>
python web自动化_Selenium+Python Web自动化相关推荐
- python 滚动条方法_selenium+python 自动化中界面滚动条操作方法
虽然webdriver提供了操作浏览器的前进和后退的方法,但对于浏览器滚动条并没有提供相应的操作方法,以下使用的方法: 借助JavaScript来控制浏览器的滚动条,webdriver提供了execu ...
- python浏览器自动化测试_Selenium+Python进行web自动化测试(Demo+API)
Selenium官方网站 http://selenium-python.readthedocs.io/ 配置使用环境 下载相应的浏览器驱动, Firefox 是默认的 本文以 chrome 为主 ,放 ...
- selenium python怎么读_selenium+Python中的面试总结
1. WebDriver原理 webDriver是按照client/server模式设计,client就是我们的测试代码,发送请求,server就是打开的浏览器来打开client发出的请求并做出响应. ...
- python自动评论_selenium+python 的微博自动转赞评功能实现
放假了,在家制作了一个selenium+python的微博自动转赞评程序. 程序分为四部分,依次是:登录+点赞+评论+转发,当点赞达到用户上限时去评论,评论至上限时去转发,出现验证码则退出程序.演示视 ...
- selenium python文档_selenium+python实现百度文库word文档抓取
更新这个代码最近又改了一点,另外和其他一些小程序一起放在了一个jupyter notebook里,现在挂在github上面.github现在对jupyter notebook的支持非常的好,甚至可以直 ...
- python鼠标碰撞_selenium + python 鼠标事件
十.鼠标事件 本章重点: ActionChains 类 context_click() 右击 double_click() 双击 drag_and_drop() 拖动 测试的产品中有一个操 ...
- python实时定位_selenium python 一些操作和定位收集
1.Select元素 1.打开百度-设置-搜索设置界面,如下图所示 2.箭头所指位置,就是 select 选项框,打开页面元素定位,下方红色框框区域,可以看到 select 标签属性: 3.选项有三个 ...
- python定位方法_selenium+python定位元素方法
C语言 · 最小乘积(基本型) 问题描述 给两组数,各n个. 请调整每组数的排列顺序,使得两组数据相同下标元素对应相乘,然后相加的和最小.要求程序输出这个最小值. 例如两组数分别为: ...
- python selenium 下拉列表_Selenium+Python之下拉菜单的定位
https://www.cnblogs.com/desperado0807/p/4839502.html 1.通过selenium.webdriver.support.ui的Select进行定位 下拉 ...
最新文章
- JspWriter与PrintWriter的关系
- android requestparams传入对象,Android xutils3上传文件使用示例
- AutoML:机器学习的下一波浪潮
- Codechef REBXOR HYSBZ - 4260(01字典树+区间异或最大)
- 智能算法!数据平台自动生成报表,智慧景区的可视化有什么不同
- 接收list对象_PyTorch入门视频笔记从数组、列表对象中创建Tensor
- UNIX环境高级编程——线程同步之条件变量以及属性
- 谷歌推出针对AI歧视的新课程!60分钟的ML公平自学训练模块 | 资源
- Java-JUC(六):创建线程的4种方式
- Fedora音视频解码的配置
- InDesign教程,如何更改字体和字体大小?
- Android 存储学习之在内部存储中读写文件
- 【开源】一个有趣的文字冒险游戏
- asp与ACCESS数据库的连接及基本操作
- 【Delta并联机器人Simscape仿真(正运动学、逆运动学)】
- 基础测绘数据分类标准
- 2020网站/APP/Webshell在线查毒 电脑软件查毒大全
- 要学的东西太多了怎么办
- App测试流程及测试点(个人整理版)-转
- 技术管理条线度量报告
热门文章
- 零基础可以学python吗-python零基础能学吗
- python推荐入门书籍-学python入门看什么书
- python安装包为什么这么小-python为什么要安装到c盘
- python3.6安装scrapy-python3.6 安装scrapy
- 财务大数据比赛有python吗-大数据工作内容有哪些?老男孩Python数据培训
- python在财务方面的应用-利用python开发财务工具
- python培训比较好的机构-上海有哪些可以系统学习python的培训机构?
- LeetCode Rotate Image(矩阵的旋转)
- AlarmManager与PendingIntent的联合使用(二)
- 安卓开发笔记(二十六):Splash实现首页快速开屏功能