[02 Selenium获取图片资源]Selenium
一. 以下是实现selenium获取图片资源的步骤+代码
//1.定义图片下载的路径集合
private static List<String> paths=new ArrayList<>();
//2.定义图片下载网址
private static final String PATH="https://www.139ys.com/";
//3.下载图片保存到指定路径
private static final String DIR="D:\\img\\";
//4.写一个获取图片类
private static void getImg(){//设置驱动System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");//创建驱动WebDriver driver=new ChromeDriver();//与将要爬取的网站建立连接driver.get(PATH);sleep(3);//获取图片资源List<WebElement> elements = driver.findElements(By.xpath("/html/body/div[2]/div/div[1]/div/div[2]/ul/li"));//循环遍历获取图片下载路径for (WebElement eles:elements) {WebElement a = eles.findElement(By.tagName("a"));paths.add( a.getAttribute("data-original"));}//关闭释放资源driver.close();driver.quit(); }
//5.写一个保存图片的类
private static void saveImg(String path){try {URL url=new URL(path); // 定义图片名称String img=System.currentTimeMillis()+".jpg";//定义·输入流InputStream is=new DataInputStream(url.openStream());//定义输出流OutputStream out=new FileOutputStream(new File(DIR+img)); // 定义每次读取长度int len=0;byte[] size=new byte[1024];//循环读写流while((len=is.read(size))!=-1){out.write(size,0,len);}//关闭is.close();out.close();} catch (Exception e) {e.printStackTrace();}}
//根据需要可以写一个sleep睡眠时间方法
//获取数据时设置休眠时间 public static void sleep(int s){try {Thread.sleep(s*1000L);} catch (InterruptedException e) {e.printStackTrace();} }
//最后调用方法,执行、
public static void main(String[] args) {getImg();for (String str:paths){System.out.println(str);saveImg(str);} }
这样就可以获取图片了
[02 Selenium获取图片资源]Selenium相关推荐
- 使用小技巧教你用Selenium获取鼠标指向的元素
有一个同学在Gne的群里面咨询如何通过Selenium获取当前鼠标指向的元素,在我讲了方法以后,他过了两天又来问: 那么,我今天就来写一篇文章,具体说说应该怎么操作. 这个方法的核心,是借助JavaS ...
- selenium 获取请求返回内容的解决方案
selenium 获取请求返回内容的解决方案 参考文章: (1)selenium 获取请求返回内容的解决方案 (2)https://www.cnblogs.com/zgq123456/articles ...
- python3读取网页_python3+selenium获取页面加载的所有静态资源文件链接操作
软件版本: python 3.7.2 selenium 3.141.0 pycharm 2018.3.5 具体实现流程如下,废话不多说,直接上代码: from selenium import webd ...
- python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法
一.selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 1. sele ...
- python+selenium获取cookie session_Python Selenium模拟登录成功后,使用此cookie、利用requests库进行get时,提示“非法登陆”。...
一. 步骤概述 a. 模拟登录学校选课系统(使用Selenium库登陆http://xk.suibe.edu.cn/xsxk/login.xk) b. 取得cookie后传入requests的sess ...
- python获取窗口句柄_Python+selenium 获取浏览器窗口坐标、句柄的方法
1.0 获取浏览器窗口坐标 python目录可找到Webdriver.py 文件定义了get_window_rect()函数,可获取窗口的坐标和大小(长宽),但出现"Command not ...
- php 遍历所有网站网址,使用selenium获取网址所加载所有资源url列表信息
抓取数据时,经常遇到有的数据是通过ajax异步调取的,如何通过selenium获取网址所加载的全部请求url地址了,即我们打开开发者工具里面network中记录的请求url列表,可以参考下面代码 # ...
- python selenium 获取元素下的元素个数_Python + Selenium,分分钟搭建 Web 自动化框架!(送自动化测试书籍)...
前言 在程序员的世界中,一切重复性的工作,都应该通过程序自动执行.「自动化测试」就是一个最好的例子.随着互联网应用开发周期越来越短,迭代速度越来越快,只会点点点,不懂开发的手工测试,已经无法满足如今的 ...
- selenium 获取不了标签文本的解决方法
selenium 获取不了标签文本的解决方法 参考文章: (1)selenium 获取不了标签文本的解决方法 (2)https://www.cnblogs.com/ppppying/p/7755064 ...
最新文章
- Vivado Hardware Manager的使用
- NFS 网络文件系统
- 红旗桌面版本最新应用方式和成绩解答100例-5
- Java ConcurrentHashMap Example and Iterator--转
- Angular7 ng-zorro-antd 制作右键菜单
- react.js 给标识ref,获取内容
- 一致性hash算法的应用研究学习
- cocos2d-x之物理世界(创建物理世界)
- UA STAT687 线性模型II 最小二乘理论1 普通最小二乘法
- PTX ISA 7.4 参考手册翻译
- html怎么画虚线空心圆,PS怎么画虚线圆圈 一个工具轻松搞定
- 是谁扼杀了你的梦想?
- 基于微信小程序的机房设备故障报修平台
- 接口技术实验三、响铃程序
- Devops持续化集成
- python获取当天日期
- 无线网卡出现windows仍在设置此设备的类配置(代码56)的问题
- Virtualbox虚拟分配空间扩展(适用于动态分配磁盘)
- 编译btccom版本的dogecoin钱包
- Ubuntu12.10安装FreeMind(Win下亿图替代品)