当前位置:我的异常网» HTML/CSS » Java 读取网页Html资料

Java 读取网页Html资料

www.myexceptions.net  网友分享于:2013-10-27  浏览:13次

Java 读取网页Html文件

import java.net.*;

import java.io.*;

public class urlconnection

{

public static void main(String[] args)

{

StringBuffer document = new StringBuffer();

try

{

URL url = new URL("http://www.163.com");

URLConnection conn = url.openConnection();

BufferedReader reader = new BufferedReader(new InputStreamReader(conn.getInputStream()));

String line = null;

while ((line = reader.readLine()) != null)

document.append(line + " ");

reader.close();

}

catch (MalformedURLException e)

{

e.printStackTrace();

}

catch (IOException e)

{

e.printStackTrace();

}

System.out.println(document.toString());

}

}

==========================================================

方法二:

==========================================================

import java.net.*;

import java.io.*;

public class useSourceViewer

{

public static void main (String[] args)

{

if (args.length > 0)

{

try

{

URL u = new URL(args[0]);

InputStream in = u.openStream( );

in = new BufferedInputStream(in);

Reader r = new InputStreamReader(in);

int c;

while ((c = r.read( )) != -1)

{

System.out.print((char) c);

}

Object o = u.getContent( );

System.out.println("I got a " + o.getClass().getName( ));

}

catch (MalformedURLException e)

{

System.err.println(args[0] + " is not a parseable URL");

}

catch (IOException e)

{

System.err.println(e);

}

}

}

}

文章评论

java抓取网页css,Java 读取网页Html资料相关推荐

  1. java 抓取百度新闻,java中使用jdom生成百度新闻抓取的xm

    百度新闻开放,详细见 plaincopy to clipboardprint? 自己用java写了个使用jdom生成百度要求的 xml文件 的实例,生成供百度搜索引擎抓取新闻 package com. ...

  2. java 抓取网页乱码_java抓取网页乱码问题的处理

    今天同事做了一个我们感觉很牛B的彩票预测程序,采用的是遗传算法实现,于是我"剽"来学习先,但是部署到我电脑上以后,就有问题了: 1.用她的抓取程序得到的网页内容出现乱码,导致数据无 ...

  3. java抓取网页内容

    今天做项目时用到java抓取网页内容,本以为很简单的一件事但是还是让我蛋疼了一会,网上资料一大堆但是都是通过url抓取网页内容,但是我要的是读取本地的html页面内容的方法,网上找不到怎么办我瞬间了! ...

  4. java抓取网站数据

    java 抓取网站数据 假设你需要获取51job 人才网上java 人才的需求数量,首先你需要分析51job 网站的搜索这 一块是怎么运作的,通过解析网页的源代码,我们发现了以下一些信息: 1. 搜索 ...

  5. Java抓取起点小说输出到本地文件夹和数据库

    Java抓取起点小说输出到本地文件夹和数据库 目录 项目结构 所需插件 项目代码 输出结果 目录 项目结构 第一次写网络爬虫,参考了别人的,也自己理解了用法 所需插件 因为使用了mevan,直接上po ...

  6. php抓取html元素内容 采集网页

    网页抓取就像搜索引擎一个可以去自动抓取其它服务器上的内容了,下面我整理的几个php常用做法,大家一起来看看. 抓取某一个网页中的内容,需要对DOM树进行解析,找到指定节点后,再抓取我们需要的内容,过程 ...

  7. Web Scraper 翻页——抓取分页器翻页的网页(Web Scraper 高级用法)| 简易数据分析 12

    这是简易数据分析系列的第 12 篇文章. 前面几篇文章我们介绍了 Web Scraper 应对各种翻页的解决方法,比如说修改网页链接加载数据.点击"更多按钮"加载数据和下拉自动加载 ...

  8. 20套各种风格影视动画公司响应式企业模电影上映影讯网站模板电影软件网页CSS模板html5网页静态模板Bootstrap扁平化网站源码css3手机seo自适响应

    20套各种风格影视动画公司响应式企业模电影上映影讯网站模板电影软件网页CSS模板html5网页静态模板Bootstrap扁平化网站源码css3手机seo自适响应. 不仅仅是首页,二级页面,三级页面,登 ...

  9. java抓取网页标题内容_[Java教程]java 网页页面抓取标题和正文

    [Java教程]java 网页页面抓取标题和正文 0 2014-07-10 09:01:30 import java.io.BufferedReader;import java.io.IOExcept ...

最新文章

  1. 以太坊Geth的dev模式的使用过程
  2. 2K17能力值上90的11位球员,你怎么看?
  3. 多元函数概念思维导图_高等数学 多元函数微分学 知识技巧思维导图 [21考研上岸之旅]...
  4. c语言ns流程图1 2,请各位大神帮个忙,画个NS流程图,,急!!!
  5. Mysql ERROR 1418 (HY000): This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA
  6. 蓝桥杯2016年第七届C/C++省赛B组第一题-煤球数目
  7. 基于java的教学评价系统的设计与实现
  8. w7计算机快捷键设置方法,win7快捷键设置,windows常用24个快捷键
  9. 渐渐热起来的网盘搜索工具
  10. Python 树状图怎么画
  11. 如何提升会员收入?从这道面试题谈谈框架思维。
  12. 网页首页浏览量计数器
  13. 软件工程应用与实践(1)——项目简介,小组分工
  14. Matlab中属性 get 方法的使用
  15. 操作系统64位和32位的区别。
  16. TortoiseSVN安装最新版,设置中文;并修改比对工具为BeyondCompare
  17. python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析
  18. Eclipse在导入项目时显示 “Invalid Project Description”时的处理方法
  19. ai作文批改_AI批改作文到底靠不靠谱
  20. 冬季要小心冷风引发过敏

热门文章

  1. Hadoop MapReduce V2——找出每个月气温最高的2天
  2. 左神算法:将单链表的每K个节点之间逆序(Java版)
  3. 左神算法:用一个栈实现另一个栈的排序(Java版)
  4. DevOps运维开发一体化 - 公开课笔记
  5. 【Java TreeMap】测试TreeMap的使用、Comparabe自定义类的自定义排序方式
  6. Spring5参考指南: Resources
  7. Effective Java之考虑用序列化代理代理序列化实例(七十八)
  8. 计算机组成原理 -- 概念点整理
  9. 从选秀策略看市场测试
  10. 测试点分析:1048 数字加密 (20分)_16行代码AC