Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。

1、安装chrome浏览器

https://www.google.cn/chrome/

查看浏览器版本(关于Chrome):

2、下载驱动ChromeDriver.exe

驱动版本与chrome浏览器(大版本)相同即可。

https://registry.npmmirror.com/binary.html?path=chromedriver/

下载解压后,将ChromeDriver.exe随便放在一个好找的位置。

3、maven依赖

        <dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>3.141.59</version></dependency>

4、测试代码

package com.study;import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");ChromeOptions options = new ChromeOptions();ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");// chrome.close();chrome.quit();}
}

5、代理

package com.study;import org.openqa.selenium.Proxy;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.remote.CapabilityType;public class Selenium {public static void main(String[] args) {System.setProperty("webdriver.chrome.driver", "F:/chromedriver.exe");Proxy proxy = new Proxy();proxy.setHttpProxy("http://192.168.111.201:8080");//代理地址ChromeOptions options = new ChromeOptions();options.setCapability(CapabilityType.PROXY, proxy);ChromeDriver chrome = new ChromeDriver(options);chrome.get("https://www.baidu.com/");//目标地址// chrome.close();chrome.quit();}
}

参考:

Java使用selenium入门_JoneClassMate的博客-CSDN博客

Java Selenium爬虫相关推荐

  1. 第三十六期:学 Java 网络爬虫,需要哪些基础知识?

    说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...

  2. java + Selenium实现12306自动购票

    为什么搞这个东西?[java + Selenium实现12306自动购票, 余票监测] 1.主要是12306是爬虫界的一个分水岭,所以我一直想玩12306[本次的实现并非真正意义上的破解12306实现 ...

  3. java+selenium+autoIt 实现下载(打印)功能

    java+selenium+autoIt 实现下载(打印)功能 selenium是一个开源的自动化测试框架,它可以模拟用户对浏览器的操作,进行自动化的测试.但是,它不仅仅只能用来做测试. AutoIt ...

  4. InfoQ网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战系列(13)

    InfoQ网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战系列(13) 文章目录 联系方式 概述 分析 配置好Xpath规则 selenium工具类 获取InfoQ文章列表 ...

  5. 用 Java 实现爬虫 (爬取本地html中的人物信息并可视化人物关系)

    目录 爬虫简介 常用的工具框架 selenium + Jsoup Jsoup介绍 Jsoup的主要功能如下: HTML 相关知识 通过Jsoup元素获取 案例 爬取本地html中的角色信息 HtmlP ...

  6. python网络爬虫、Java 网络爬虫,哪个更好?

    说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...

  7. 学 Java 网络爬虫,需要哪些基础知识?

    说起网络爬虫,大家想起的估计都是 Python ,诚然爬虫已经是 Python 的代名词之一,相比 Java 来说就要逊色不少.有不少人都不知道 Java 可以做网络爬虫,其实 Java 也能做网络爬 ...

  8. 掘金网站作者的文章列表文章详情获取-Java网络爬虫系统性学习与实战(14)

    掘金网站作者的文章列表&文章详情获取-Java网络爬虫系统性学习与实战(14) 文章目录 联系方式 概述 分析 配置好Xpath规则 selenium工具类 获取文章列表 获取文章详情数据 p ...

  9. 【java+selenium】网易云音乐刷累计听歌数

    背景 应该是在去年的时候,刷知乎看到一个问题,大概是说怎么刷网易云音乐个人累计听歌数,然后有一个高赞回答,贴了一段js代码,直接在浏览器console执行就可以了.当时试了下,直接一下子刷了有好几万. ...

最新文章

  1. 关于java集合框架(三):Map概述与TreeMap
  2. html div剩下高度设置,使div填充剩余屏幕空间的高度
  3. 属于服务器端运行的程序_Telerik UI for ASP.NET MVC:为任何设备以两倍的速度构建功能丰富且响应迅速的web应用程序...
  4. 网站开发与服务器匹配,合格的网站开发员应当深入考虑站点框架搭建与SEO优化的关系...
  5. 肺结节圆形边界光滑_肺结节读片(16):再谈肺磨玻璃结节边界的CT形态特点
  6. oracle索引用不了,oracle使用索引与不使用索引的性能详析
  7. 二十七、oracle 异常
  8. 珍藏5年的5000款photoshop顶尖字体库,这回不用担心没有好的PS字体了!
  9. 姿态估计之2D人体姿态估计 - CPN(Cascaded Pyramid Network for Multi-Person Pose Estimation)
  10. 编译原理逆波兰式实验java_【实验三】—— 逆波兰式生成实验报告
  11. 三分频电路Verilog设计
  12. Mac下浏览器安装证书
  13. Java字母加数字组合比较大小
  14. excel拆分数据快捷操作
  15. 常用软件密码破解完全指南[转]
  16. css3中的渐变色效果
  17. Xendesktop配置高可用DDC
  18. 前亚马逊工程师:广告系统架构解密
  19. 适合问卷收益的10个精品项目
  20. 为啥一直是第54行空指针异常

热门文章

  1. 计算机仿真实验单摆,大学物理仿真实验--单摆及膨胀教材
  2. [转]如果你知道自己40岁的时候一定会被裁员,那你会做什么?
  3. 应广单片机入门之_按键点灯
  4. 应广单片机 PMS150G,PWM例程
  5. win10 校园宽带连接不上的解决办法(错误720、“以太网”没有有效的ip设置)...
  6. 全奖博士招生,英国考文垂大学
  7. 论述rfid与物联网关系
  8. 香魂一缕随风散,愁绪三更入梦遥
  9. 台积电全球员工薪酬中位数约 46 万,CEO 约 8991 万!
  10. 苹果手机使用百度地图定位失败的问题