首先做好准备工作:

了解正则表达式中基本的Select的用法:

此处引用楼主查到的资料

http://www.tuicool.com/articles/ZnyMvu

第一个爬虫:无验证码的简单爬虫

楼主是中南财经政法大学的,就拿本校教务处作为例子,我们的目的是获取教务通知中的标题和超链接

网址:http://jwc.zuel.edu.cn/

要获取的目的信息

首先查看网页源码,楼主用的是谷歌,F12就可以看到源码。

前端源码

接下来重点!!!!PO出JAVA源码

//你要爬的网页地址

String url="http://jwc.zuel.edu.cn/";

//核心代码,链接到该网页

Connection connection=Jsoup.connect(url); Document Content=connection.get();

//获取指定位置的信息,该Demo中是新闻标题和时间 Elements links=Content.select("[class=Article_Title]"); Elements Date=Content.select("[class=Article_PublishDate]");

//首先显示了8个新闻,用一个for循环 for(int i=0;i<8;i++) {

//得到所需字符串

String webContent=links.select("a").get(i).text();

String webDate=Date.get(i).text();

//得到超链接的代码比较特殊 这里进行标注

String herf=links.select("a").get(i).attr("abs:href");

System.out.println(herf);

str[i2]=webContent; str[i2+1]=webDate;

strings[i]=herf;

}

for(int m=0;m<16;m++)

{

System.out.println(str[m]);

System.out.println(str[++m]);

}

下面是结果图(改一改就可以应用到JSP和微信中也是可以,是不是很棒!):

20160909125113149.png

java网络爬虫0基础_简单的java爬虫程序(入门)相关推荐

  1. java xmlrpc2.0 实现_简单的java xmlrpc

     简单的 XMLRPC java---XmlRpcClient package com.company; import org.apache.xmlrpc.XmlRpcClient; import ...

  2. java监听com口_简单了解Java接口+事件监听机制

    1.接口: 定义方法: public interface interName //extends interName2, interName3...可继承多个接口 在接口里只能定义常量和抽象方法. p ...

  3. java带参数的构造方法_简单了解JAVA构造方法

    构造方法作用就是对类进行初始化. 如果你没有定议任何构造方法的形式,程式会为你取一个不带任何参数的构造函数,那么你产生类的对像时只能用不带参数的方法.下面小编和大家来一起学习一下吧. 怎么写 java ...

  4. java中的el表达式_简单介绍Java中的EL表达式(图)

    EL全名为Expression Language,这篇文章主要给大家介绍EL表达式的主要作用及内容简介,感兴趣的朋友一起看看 JSP页面中支持使用EL表达式,EL全名为Expression Langu ...

  5. qq纵横四海源码_【0基础】纵横中文网python爬虫实战

    原文在此~ [0基础]纵横中文网python爬虫实战​mp.weixin.qq.com 大家好,我是你们的机房老哥! 在粉丝群的日常交流中,爬虫是比较常见的话题.python最强大的功能之一也是爬虫. ...

  6. java网络编程作业基于UDP简单聊天窗口,图形化界面,包含客户端和服务端

    //郑州轻工业大学 //题号:实验四 第二题 //题目:使用基于UDP的网络编程方法,完成客户端和服务器间的聊天功能.要求图形界面. java网络编程作业 基于UDP简单聊天窗口,图形化界面,包含客户 ...

  7. JavaSE入门0基础笔记 第二章Java基础语法

    JavaSE入门0基础笔记 第二章Java基础语法 1.运算符 1.1算术运算符 1.1.1运算符和表达式 1.1.2 算术运算符 1.1.3字符的"+"操作 1.1.4 字符串中 ...

  8. oracle 孙帅_求个大佬指点一下,0基础想自学一下java,哪怕入个门,该如何开始?...

    干货预警! 这可能是全知乎最全面.最实用的java教程精华帖了,其它地方都学不到的. -- 这是小千2020年最新整理的一套零基础Java学习路线,本路线融入了最新的全套Java学习视频教程,包含了基 ...

  9. JAVA基础——最简单的多重循环程序

    Java 循环语句之多重循环 循环体中包含循环语句的结构称为多重循环.三种循环语句可以自身嵌套,也可以相互嵌套,最常见的就是二重循环.在二重循环中,外层循环每执行一次,内层循环要执行一圈. 如下所示: ...

最新文章

  1. Oracle 11g必须开启的服务及服务详细介绍
  2. Qt学习之路_1(安装及首次体验)
  3. 008_tracker.conf配置详情
  4. OpenCV下的角点获取
  5. How does ABAP check table work
  6. matlab impyramid图像金字塔
  7. Spring Cloud面试题
  8. WPE(Winsock Packet Editor)
  9. c md5加密 和java不一样_C#的MD5加密为什么和JAVA的加密出来的结果不一样?
  10. 机器人工程毕业设计☞开题报告
  11. PMP 考点 第五章 项目范围管理
  12. 电脑系统时间服务器地址,电脑时间同步服务器ip地址
  13. 接口常见安全漏洞说明
  14. FreeNOS--项目的README
  15. 华硕启动vmware 虚拟机,显示Intel VT-x但Intel VT-x处于禁用状态 ,开始vt
  16. 华为OD机试 - 德州扑克(Java JS Python)
  17. 计算机基础知识是一级吗,计算机二级和初级的区别 初级是一级吗
  18. 洛谷B2095 白细胞计数(sort排序)
  19. Unity小游戏——3D坦克大战
  20. VSFTPD配置方法手册

热门文章

  1. php与管理信息系统的开发,php工资和管理信息系统的开发与设计
  2. 汽车零部件行业MES解决方案
  3. 计算机集成制造系统erp,企业资源计划(ERP)和计算机集成制造系统(CIMS)
  4. 学计算机大学累不累_美国理工届性价比最高大学,被誉为南方MIT,学计算机的“风水宝地”!...
  5. python爬虫,扒上万条猫眼邪不压正影评------转载+排雷
  6. 带宽的单位为什么是Hz而不是bps?
  7. 什么是指针以及如何动态申请空间
  8. remote call
  9. 成功运营网站要注意的三个方面
  10. Win2000服务器设置全攻略电子书