java网络爬虫0基础_简单的java爬虫程序(入门)
首先做好准备工作:
了解正则表达式中基本的Select的用法:
此处引用楼主查到的资料
http://www.tuicool.com/articles/ZnyMvu
第一个爬虫:无验证码的简单爬虫
楼主是中南财经政法大学的,就拿本校教务处作为例子,我们的目的是获取教务通知中的标题和超链接
网址:http://jwc.zuel.edu.cn/
要获取的目的信息
首先查看网页源码,楼主用的是谷歌,F12就可以看到源码。
前端源码
接下来重点!!!!PO出JAVA源码
//你要爬的网页地址
String url="http://jwc.zuel.edu.cn/";
//核心代码,链接到该网页
Connection connection=Jsoup.connect(url); Document Content=connection.get();
//获取指定位置的信息,该Demo中是新闻标题和时间 Elements links=Content.select("[class=Article_Title]"); Elements Date=Content.select("[class=Article_PublishDate]");
//首先显示了8个新闻,用一个for循环 for(int i=0;i<8;i++) {
//得到所需字符串
String webContent=links.select("a").get(i).text();
String webDate=Date.get(i).text();
//得到超链接的代码比较特殊 这里进行标注
String herf=links.select("a").get(i).attr("abs:href");
System.out.println(herf);
str[i2]=webContent; str[i2+1]=webDate;
strings[i]=herf;
}
for(int m=0;m<16;m++)
{
System.out.println(str[m]);
System.out.println(str[++m]);
}
下面是结果图(改一改就可以应用到JSP和微信中也是可以,是不是很棒!):
20160909125113149.png
java网络爬虫0基础_简单的java爬虫程序(入门)相关推荐
- java xmlrpc2.0 实现_简单的java xmlrpc
简单的 XMLRPC java---XmlRpcClient package com.company; import org.apache.xmlrpc.XmlRpcClient; import ...
- java监听com口_简单了解Java接口+事件监听机制
1.接口: 定义方法: public interface interName //extends interName2, interName3...可继承多个接口 在接口里只能定义常量和抽象方法. p ...
- java带参数的构造方法_简单了解JAVA构造方法
构造方法作用就是对类进行初始化. 如果你没有定议任何构造方法的形式,程式会为你取一个不带任何参数的构造函数,那么你产生类的对像时只能用不带参数的方法.下面小编和大家来一起学习一下吧. 怎么写 java ...
- java中的el表达式_简单介绍Java中的EL表达式(图)
EL全名为Expression Language,这篇文章主要给大家介绍EL表达式的主要作用及内容简介,感兴趣的朋友一起看看 JSP页面中支持使用EL表达式,EL全名为Expression Langu ...
- qq纵横四海源码_【0基础】纵横中文网python爬虫实战
原文在此~ [0基础]纵横中文网python爬虫实战mp.weixin.qq.com 大家好,我是你们的机房老哥! 在粉丝群的日常交流中,爬虫是比较常见的话题.python最强大的功能之一也是爬虫. ...
- java网络编程作业基于UDP简单聊天窗口,图形化界面,包含客户端和服务端
//郑州轻工业大学 //题号:实验四 第二题 //题目:使用基于UDP的网络编程方法,完成客户端和服务器间的聊天功能.要求图形界面. java网络编程作业 基于UDP简单聊天窗口,图形化界面,包含客户 ...
- JavaSE入门0基础笔记 第二章Java基础语法
JavaSE入门0基础笔记 第二章Java基础语法 1.运算符 1.1算术运算符 1.1.1运算符和表达式 1.1.2 算术运算符 1.1.3字符的"+"操作 1.1.4 字符串中 ...
- oracle 孙帅_求个大佬指点一下,0基础想自学一下java,哪怕入个门,该如何开始?...
干货预警! 这可能是全知乎最全面.最实用的java教程精华帖了,其它地方都学不到的. -- 这是小千2020年最新整理的一套零基础Java学习路线,本路线融入了最新的全套Java学习视频教程,包含了基 ...
- JAVA基础——最简单的多重循环程序
Java 循环语句之多重循环 循环体中包含循环语句的结构称为多重循环.三种循环语句可以自身嵌套,也可以相互嵌套,最常见的就是二重循环.在二重循环中,外层循环每执行一次,内层循环要执行一圈. 如下所示: ...
最新文章
- Oracle 11g必须开启的服务及服务详细介绍
- Qt学习之路_1(安装及首次体验)
- 008_tracker.conf配置详情
- OpenCV下的角点获取
- How does ABAP check table work
- matlab impyramid图像金字塔
- Spring Cloud面试题
- WPE(Winsock Packet Editor)
- c md5加密 和java不一样_C#的MD5加密为什么和JAVA的加密出来的结果不一样?
- 机器人工程毕业设计☞开题报告
- PMP 考点 第五章 项目范围管理
- 电脑系统时间服务器地址,电脑时间同步服务器ip地址
- 接口常见安全漏洞说明
- FreeNOS--项目的README
- 华硕启动vmware 虚拟机,显示Intel VT-x但Intel VT-x处于禁用状态 ,开始vt
- 华为OD机试 - 德州扑克(Java JS Python)
- 计算机基础知识是一级吗,计算机二级和初级的区别 初级是一级吗
- 洛谷B2095 白细胞计数(sort排序)
- Unity小游戏——3D坦克大战
- VSFTPD配置方法手册
热门文章
- php与管理信息系统的开发,php工资和管理信息系统的开发与设计
- 汽车零部件行业MES解决方案
- 计算机集成制造系统erp,企业资源计划(ERP)和计算机集成制造系统(CIMS)
- 学计算机大学累不累_美国理工届性价比最高大学,被誉为南方MIT,学计算机的“风水宝地”!...
- python爬虫,扒上万条猫眼邪不压正影评------转载+排雷
- 带宽的单位为什么是Hz而不是bps?
- 什么是指针以及如何动态申请空间
- remote call
- 成功运营网站要注意的三个方面
- Win2000服务器设置全攻略电子书