Java Selenium爬虫
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。
1、安装chrome浏览器
https://www.google.cn/chrome/
查看浏览器版本(关于Chrome):
2、下载驱动ChromeDriver.exe
驱动版本与chrome浏览器(大版本)相同即可。
https://registry.npmmirror.com/binary.html?path=chromedriver/
下载解压后,将ChromeDriver.exe随便放在一个好找的位置。
3、maven依赖
<dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>3.141.59</version></dependency>
4、测试代码
package com.study;import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");ChromeOptions options = new ChromeOptions();ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");// chrome.close();chrome.quit();}
}
5、代理
package com.study;import org.openqa.selenium.Proxy;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.remote.CapabilityType;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");Proxy proxy = new Proxy();proxy.setHttpProxy("http://192.168.111.201:8080");//代理地址ChromeOptions options = new ChromeOptions();options.setCapability(CapabilityType.PROXY, proxy);ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");//目标地址// chrome.close();chrome.quit();}
}
参考:
Java使用selenium入门_JoneClassMate的博客-CSDN博客
Java Selenium爬虫相关推荐
- 第三十六期:学 Java 网络爬虫,需要哪些基础知识?
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
- java + Selenium实现12306自动购票
为什么搞这个东西?[java + Selenium实现12306自动购票, 余票监测] 1.主要是12306是爬虫界的一个分水岭,所以我一直想玩12306[本次的实现并非真正意义上的破解12306实现 ...
- java+selenium+autoIt 实现下载(打印)功能
java+selenium+autoIt 实现下载(打印)功能 selenium是一个开源的自动化测试框架,它可以模拟用户对浏览器的操作,进行自动化的测试.但是,它不仅仅只能用来做测试. AutoIt ...
- InfoQ网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战系列(13)
InfoQ网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战系列(13) 文章目录 联系方式 概述 分析 配置好Xpath规则 selenium工具类 获取InfoQ文章列表 ...
- 用 Java 实现爬虫 (爬取本地html中的人物信息并可视化人物关系)
目录 爬虫简介 常用的工具框架 selenium + Jsoup Jsoup介绍 Jsoup的主要功能如下: HTML 相关知识 通过Jsoup元素获取 案例 爬取本地html中的角色信息 HtmlP ...
- python网络爬虫、Java 网络爬虫,哪个更好?
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
- 学 Java 网络爬虫,需要哪些基础知识?
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
- 掘金网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战(14)
掘金网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战(14) 文章目录 联系方式 概述 分析 配置好Xpath规则 selenium工具类 获取文章列表 获取文章详情数据 p ...
- 【java+selenium】网易云音乐刷累计听歌数
背景 应该是在去年的时候,刷知乎看到一个问题,大概是说怎么刷网易云音乐个人累计听歌数,然后有一个高赞回答,贴了一段js代码,直接在浏览器console执行就可以了.当时试了下,直接一下子刷了有好几万. ...
最新文章
- 关于java集合框架(三):Map概述与TreeMap
- html div剩下高度设置,使div填充剩余屏幕空间的高度
- 属于服务器端运行的程序_Telerik UI for ASP.NET MVC:为任何设备以两倍的速度构建功能丰富且响应迅速的web应用程序...
- 网站开发与服务器匹配,合格的网站开发员应当深入考虑站点框架搭建与SEO优化的关系...
- 肺结节圆形边界光滑_肺结节读片(16):再谈肺磨玻璃结节边界的CT形态特点
- oracle索引用不了,oracle使用索引与不使用索引的性能详析
- 二十七、oracle 异常
- 珍藏5年的5000款photoshop顶尖字体库,这回不用担心没有好的PS字体了!
- 姿态估计之2D人体姿态估计 - CPN(Cascaded Pyramid Network for Multi-Person Pose Estimation)
- 编译原理逆波兰式实验java_【实验三】—— 逆波兰式生成实验报告
- 三分频电路Verilog设计
- Mac下浏览器安装证书
- Java字母加数字组合比较大小
- excel拆分数据快捷操作
- 常用软件密码破解完全指南[转]
- css3中的渐变色效果
- Xendesktop配置高可用DDC
- 前亚马逊工程师:广告系统架构解密
- 适合问卷收益的10个精品项目
- 为啥一直是第54行空指针异常