Jsoup抓取到页面A标签中的href路径
博客地址:博客地址
直接上代码,注释很全乎
public static void main(String[] args)throws Exception{//抓取的网址String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html";//编码格式的转换Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);//根据class获取到 页面的 元素内容Elements tables = document.getElementsByClass("provincetr");//根据td标签来划分Elements td = tables.select("td");for(int j=0;j<td.size();j++){//获取到标签中的内容String text = td.get(j).text();System.out.println(text);//获取A标签的href 网址 select 获取到当前A标签 attr href 获取到地址String s = td.get(j).select("a").attr("href");System.out.println(s);}}
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>
需要引入以上jar包
也可以去这个网址下载,
输出的时候会抓到 "" 空字符串,大家自己判断下就好了
Jsoup抓取到页面A标签中的href路径相关推荐
- 【HTML学习笔记】link标签中的href路径
在index.html中引用外部css样式,需要索引css文件路径,但是css文件可能在不同目录下,需要根据具体情况写路径. [情况1]css文件在同一个目录下,直接写文件名即可<link re ...
- html: a标签中的href的作用
原文路径:https://blog.csdn.net/u010297791/article/details/52784879 a标签的最重要功能是实现超链接和锚点. 一.Js的几种调用方法 1.a h ...
- A标签中通过href和onclick传递的this对象实现思路
想传递当前对象给一个函数,于是就将这个URL写成"JavaScript:shoControlSidebar(this)",可是结果发现这并不可行,接下来为大家详细介绍下解决方法 在 ...
- 浏览器对HTML5中track标签中src属性路径vtt文件错误,Unsafe attempt to load URL vtt
一.出现的错误 这是我运行之后在浏览器中看不到想要的效果(没有字幕),然后查看控制台,发现有一个浏览器的拦截错误 二.寻找原因 下面这是我写的 html 文件,想要给 video 视频添加字幕 < ...
- 使用Jsoup技术获取`阿里拍卖`中法院拍卖的所有拍卖品
文章目录 前言 最终效果 效果演示 爬取所有记录 根据条件爬取 项目仓库 项目前准备 技术选型 开发工具 用到的jar包 爬取所有数据 页面分析 第一步:获取所有省份列表 代码实现 进入主页 解析页面 ...
- Java正则获取a标签href_正则表达式,同时获取a标签里的href,text 的值
string pattern = @"]+href=\s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^> ...
- vue项目,webpack中配置src路径别名及使用
默认会有'@'别名,指向src目录,还可以添加自定义别名等等. 使用方法 使用别名一般就三种情况:在js中用,在css中用,在html文档内用 js中用,最简单: import {getName} f ...
- 转:MSDN Visual系列:MOSS企业级搜索之一——在搜索中心里创建自定义搜索页面和标签选项卡...
MSDN Visual系列:MOSS企业级搜索之一--在搜索中心里创建自定义搜索页面和标签选项卡 原文:http://msdn2.microsoft.com/en-us/library/bb42885 ...
- Html A标签中 href 和 onclick用法、区别、优先级别
http://gocom.primeton.com/blog21307_27051.htm 我以前在写<A>的href和onclick一直很随意,后来出过几次问题,以后才开始重视这个问题: ...
最新文章
- 2019.01-02 总结
- 高通量测序技术和序列拼接算法探析
- 使用 PHP 构建的 Web 应用如何避免 XSS 攻击
- OpenCV入门系列(4):显示一张图片和一个视频
- android xml 文件里面的宽度Match_Parent 被 替换成了wrap_content
- python3 list 列表 倒序
- 全国哀悼日,怎么让网站变灰色???
- python定义数组是带指针_在cython中声明numpy数组和c指针
- 命令提示符中的几个重要的命令
- html点击按钮动态添加input文本框
- 开店软件透彻分析推荐
- php实现我的购物以及订单,实现简单的php购物车代码
- 计算机组成原理第五章考试题,计算机组成原理第五章部分课后题答案(唐朔飞版).doc...
- 【博客1】缤果Qt串口网络蓝牙调试助手V3.1.0.9(高级篇)
- html css纯写桌球运动轨迹,纯JS实现椭圆轨迹运动的代码
- python小欢喜(八)俄罗斯方块 (3) 组合对象的旋转
- 尺度不变特征转换(Scale-invariant feature transform 或 SIFT)
- Windows系统下安装Cadence Sigrity 2022.1
- 企业文件分享/共享有哪些安全方式
- (C语言)用‘*’打印平行四边形