1.首先下载HtmlUnit的jar包,导入。

package com.shu.htmlUnit;

import com.gargoylesoftware.htmlunit.BrowserVersion;

import com.gargoylesoftware.htmlunit.WebClient;

import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class HtmlUnit01 {

public static void main(String[] args) throws Exception{

String url = “http://www.baidu.com”;

String str;

//创建一个webClient,模拟浏览器

//WebClient webClient = new WebClient();

//使用FireFox读取网页

WebClient webClient = new WebClient(BrowserVersion.FIREFOX_38);

//使用Chrome读取网页

//WebClient webClient = new WebClient(BrowserVersion.CHROME);

//打开的话,就是执行javaScript/Css

webClient.getOptions().setJavaScriptEnabled(false);

webClient.getOptions().setCssEnabled(false);

//获取页面

HtmlPage page = webClient.getPage(url);

//获取页面的title

str = page.getTitleText();

System.out.println(“Title:——“+str);

//获取页面的XML代码

str = page.asXml();

System.out.println(“Xml:——“+str);

//获取页面的文本

str = page.asText();

System.out.println(“Text:——“+str);

//关闭webClient

webClient.close();

}

}

package com.shu.htmlUnit;

import java.io.IOException;

import java.net.MalformedURLException;

import com.gargoylesoftware.htmlunit.WebClient;

import com.gargoylesoftware.htmlunit.html.HtmlInput;

import com.gargoylesoftware.htmlunit.html.HtmlPage;

/**

* 找到页面中特定的元素

* @author xiangni123

*

*/

public class HtmlUnit02 {

public static void main(String[] args) throws Exception{

String url = “http://www.baidu.com”;

String str;

//创建一个webClient,模拟浏览器

WebClient webClient = new WebClient();

//打开的话,就是执行javaScript/Css

webClient.getOptions().setJavaScriptEnabled(false);

webClient.getOptions().setCssEnabled(false);

//获取页面

HtmlPage page = webClient.getPage(url);

//通过id获得“百度一下”按钮.(在此页面中改按钮的id为”su”)

HtmlInput btn = (HtmlInput)page.getHtmlElementById(“su”);

System.out.println(btn.getDefaultValue());

//关闭webClient

webClient.close();

}

}

package com.shu.htmlUnit;

import java.util.List;

import com.gargoylesoftware.htmlunit.BrowserVersion;

import com.gargoylesoftware.htmlunit.WebClient;

import com.gargoylesoftware.htmlunit.html.HtmlDivision;

import com.gargoylesoftware.htmlunit.html.HtmlInput;

import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class HtmlUnit03 {

public static void main(String[] args) throws Exception{

String url = “http://www.baidu.com”;

String str;

//创建一个webClient,模拟浏览器

WebClient webClient = new WebClient();

//打开的话,就是执行javaScript/Css

webClient.getOptions().setJavaScriptEnabled(false);

webClient.getOptions().setCssEnabled(false);

//获取页面

HtmlPage page = webClient.getPage(url);

//查找所有div

System.out.println(“查找所有div—————“);

List dList = (List) page.getByXPath(“//div”);

for(HtmlDivision d: dList){

System.out.println(d.toString());

}

//查找第一个div

System.out.println(“查找第一个div————–“);

HtmlDivision d = (HtmlDivision)dList.get(0);

System.out.println(d.toString());

//查找所有的input

System.out.println(“查找并获取特定的input”);

List> iList = page.getByXPath(“//input[@id=’su’]”);

HtmlInput input = (HtmlInput)iList.get(0);

System.out.println(input.toString());

//关闭webClient

webClient.close();

}

}

package com.shu.htmlUnit;

import java.util.List;

import com.gargoylesoftware.htmlunit.BrowserVersion;

import com.gargoylesoftware.htmlunit.WebClient;

import com.gargoylesoftware.htmlunit.html.HtmlDivision;

import com.gargoylesoftware.htmlunit.html.HtmlInput;

import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class HtmlUnit04 {

public static void main(String[] args) throws Exception{

String url = “http://www.baidu.com”;

String str;

//创建一个webClient,模拟浏览器

WebClient webClient = new WebClient();

//打开的话,就是执行javaScript/Css

webClient.getOptions().setJavaScriptEnabled(false);

webClient.getOptions().setCssEnabled(false);

//获取页面

HtmlPage page = webClient.getPage(url);

//获取搜索输入框并提交搜索内容

System.out.println(“获取搜索输入框并提交搜索内容————“);

HtmlInput input = (HtmlInput)page.getHtmlElementById(“kw”);

System.out.println(input.toString());

input.setValueAttribute(“传世”);

System.out.println(input.toString());

//获取搜索按钮并点击

System.out.println(“获取搜索按钮并点击——————-“);

HtmlInput btn = (HtmlInput)page.getHtmlElementById(“su”);

HtmlPage page2 = btn.click();

//输出新页面文本

System.out.println(“输出新页面文本———————-“);

System.out.println(page2.asText());

//关闭webClient

webClient.close();

}

}

html java简单示例,HtmlUnit的简单例子相关推荐

  1. python爬虫简单示例_最简单爬虫示例(入门级)

    [实例简介] [实例截图] [核心代码] from lxml import etree import requests def handle_request(url): heades = { 'Use ...

  2. 【PHP基础-1】PHP简介、语法及简单示例

    目录 1 PHP简介 1.1 什么是PHP 1.2 PHP文件 1.3 PHP作用 2 PHP语法 2.1 PHP语言标记 2.2 指令分隔符 2.3 注释语句 2.4 空白符号的处理 2.5 三种错 ...

  3. java avg_JPA 查询AVG简单示例

    JPA教程 - JPA查询AVG简单示例 JPQL中的聚合查询的语法与SQL的语法非常相似. 有五个支持的聚合函数AVG COUNT MIN MAX SUM 结果可以分组在GROUP BY子句中,并使 ...

  4. Java TCP 抓包简单示例

    Java TCP 抓包简单示例 由于目前网上没有一篇能真正方便读者操作的此类文章,本文对此通过示例做个简单介绍. 缘起 有一天本来在看头条,然后看到一则游戏的广告,看画面可能是我喜欢的建造类型(纪元1 ...

  5. java调c的接口_Java调用C接口的简单示例

    Java调用C接口的简单示例 正好需要用到Java调用dll里的C接口,想到自己做个简单的例子.我们可能需要自己生成dll文件,下边介绍一下,详细的步骤.主要参考https://blog.csdn.n ...

  6. java读取ACCESS数据库的简单示例

    java读取ACCESS数据库的简单示例  虽然简单,对初学者来说,如果没有一段可以成功执行的代码供参考,还真难调试  先用ACCESS建一个数据库 DB1.MDB,里面有一表"table1 ...

  7. java播放声音类和一个简单示例

    java播放声音类和一个简单示例 播放声音的类 复制代码 代码如下:  import java.io.File; import java.io.IOException; import javax.so ...

  8. java中的mapper是什么_Java使用ObjectMapper的简单示例

    一.什么是ObjectMapper? ObjectMapper类是Jackson库的主要类,它提供一些功能将数据集或对象转换的实现. 它将使用JsonParser和JsonGenerator实例来实现 ...

  9. Java Kafka 简单示例

    Java Kafka 简单示例 简介     Java kafka 简单代码示例 maven依赖配置 <!-- kafka --> <dependency><groupI ...

最新文章

  1. emoji 乱码_这个自制emoji的网站,让你成为永远不输的斗图王者
  2. 自动化工具之二:win32gui
  3. Win 10操作系统环境下python3.7 实现sklearn 安装
  4. 《工作细胞》电影观后感
  5. 删边(normal)
  6. protobuf 数据解析的2种方法
  7. 微软推出了一款能帮你“做题”的数学应用
  8. 华为彭松:基于C.A.F模型构建联接竞争力,创造新增长
  9. 万字长文精华之数据中台构建五步法
  10. ETCD for java_etcd-java使用
  11. 【Flutter】Dart中的匿名函数、闭包
  12. webpack+vue动态加载组件尝试
  13. CS231N课程笔记学习一——图像分类
  14. TechSmith SnagIt 9 中文破解版v9.1.0
  15. java csv tab分隔,CSV格式与tab制表符分割的格式文件相互转换,支持管道操作
  16. PAT 乙级真题题解 java实现
  17. 用英雄联盟的方式讲解JavaScript设计模式
  18. ffmpeg解析出的视频参数PAR,DAR,SAR的意义
  19. TFTLCD原理与驱动与指令介绍
  20. Golang创建DLL

热门文章

  1. python嵌套列表法实现树_在python中创建递归迭代嵌套列表的“数据树”路径
  2. c语言case后接printf,C编程中switch。case 问题
  3. dll中使用dialogbox_玩游戏丢失dll文件别着急 认识这些就妥了
  4. 如何做一个跨平台的游戏App?
  5. lua 5.3 英文手册
  6. HDU 2588 GCD
  7. 远程服务器存储之JSON
  8. Host aggregate分区
  9. LeetCode(171)——Excel表列序号(JavaScript)
  10. wt在matlab中什么意思,new wt.是什么意思