Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。适用于自动化测试，js动态爬虫（破解反爬虫）等领域。

1、安装chrome浏览器

https://www.google.cn/chrome/

查看浏览器版本(关于Chrome)：

2、下载驱动ChromeDriver.exe

驱动版本与chrome浏览器(大版本)相同即可。

https://registry.npmmirror.com/binary.html?path=chromedriver/

下载解压后，将ChromeDriver.exe随便放在一个好找的位置。

3、maven依赖

        <dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>3.141.59</version></dependency>

4、测试代码

package com.study;import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");ChromeOptions options = new ChromeOptions();ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");// chrome.close();chrome.quit();}
}

5、代理

package com.study;import org.openqa.selenium.Proxy;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.remote.CapabilityType;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");Proxy proxy = new Proxy();proxy.setHttpProxy("http://192.168.111.201:8080");//代理地址ChromeOptions options = new ChromeOptions();options.setCapability(CapabilityType.PROXY, proxy);ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");//目标地址// chrome.close();chrome.quit();}
}

参考：

Java使用selenium入门_JoneClassMate的博客-CSDN博客

Java Selenium爬虫相关推荐

第三十六期:学 Java 网络爬虫，需要哪些基础知识？
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
java + Selenium实现12306自动购票
为什么搞这个东西?[java + Selenium实现12306自动购票, 余票监测] 1.主要是12306是爬虫界的一个分水岭,所以我一直想玩12306[本次的实现并非真正意义上的破解12306实现 ...
java+selenium+autoIt 实现下载（打印）功能
java+selenium+autoIt 实现下载(打印)功能 selenium是一个开源的自动化测试框架,它可以模拟用户对浏览器的操作,进行自动化的测试.但是,它不仅仅只能用来做测试. AutoIt ...
InfoQ网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战系列（13）
InfoQ网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战系列(13) 文章目录联系方式概述分析配置好Xpath规则 selenium工具类获取InfoQ文章列表 ...
用 Java 实现爬虫 (爬取本地html中的人物信息并可视化人物关系)
目录爬虫简介常用的工具框架 selenium + Jsoup Jsoup介绍 Jsoup的主要功能如下: HTML 相关知识通过Jsoup元素获取案例爬取本地html中的角色信息 HtmlP ...
python网络爬虫、Java 网络爬虫，哪个更好？
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
学 Java 网络爬虫，需要哪些基础知识？
说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...
掘金网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战（14）
掘金网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战(14) 文章目录联系方式概述分析配置好Xpath规则 selenium工具类获取文章列表获取文章详情数据 p ...
【java+selenium】网易云音乐刷累计听歌数
背景应该是在去年的时候,刷知乎看到一个问题,大概是说怎么刷网易云音乐个人累计听歌数,然后有一个高赞回答,贴了一段js代码,直接在浏览器console执行就可以了.当时试了下,直接一下子刷了有好几万. ...

Java Selenium爬虫