全栈工程师开发手册 (作者:栾鹏)
java教程全解

java获取网页网页源代码

测试代码

public static void main(String[] args) {System.out.println(getwebcode("http://blog.csdn.net/luanpeng825485697?viewmode=contents","UTF-8"));}

发送申请,获取响应网页源代码函数实现,输入参数为网址和解码器类型

//获取网页源代码public static String  getwebcode(String urlpath,String encoder) {StringBuilder sb=new StringBuilder();InputStream in = null;   try {// 建立输入输出流URL url = new URL(urlpath); in = url.openStream();        // 从 URL 拷贝到输出流byte[] buffer = new byte[4096];int bytes_read;while((bytes_read = in.read(buffer)) != -1){sb.append(new String(buffer,encoder));}}// 捕获异常,输出报错信息catch (Exception e) {System.err.println(e);System.err.println("Usage: java GetURL <URL> [<filename>]");}finally {  // 保证关闭输入流和输出流try { in.close();  } catch (Exception e) {}}return sb.toString();}

java获取响应网页源代码相关推荐

  1. java 流的方式抓取网页 但是显示不全_用java抓取网页源代码时总是无法获取完整的源代码信息,求指导...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 无论是用urlconnection还是httpurlconnection都只能获得一部分网页源代码(即有的标签内容在网页上右键-查看源代码能看到,但是用下 ...

  2. java jsp 获得网页源代码三种方式

    一.GetURL.java import java.io.*; import java.net.*; public class GetURL {public static void main(Stri ...

  3. Python 爬虫入门(1)获取豆瓣网页源代码

    import urllib.request    #引入第三方模块 url = "http://www.douban.com"   #每一个网页都有一个唯一的名称标识 通常称为UR ...

  4. Java爬取网页源代码解析

    1.搜索词的地址采用模拟地址方法(通过分析搜索引擎的参数得到,如百度),然后将搜索词加到模拟的地址中. 2.函数的输入参数是模拟地址. String query = URLEncoder.encode ...

  5. c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...

    1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...

  6. js技术要点---JS 获取网页源代码

    JS 获取网页源代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html& ...

  7. JS 获取网页源代码

    <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <hea ...

  8. Python爬虫获取网页源代码出现乱码

    发现用python用requests在百度中获得的代码有乱码 import requests # 0.通过如下代码,会发现获取的网页源代码出现乱码 url = 'https://www.baidu.c ...

  9. python爬虫获取的网页数据为什么要加[0-python3爬虫爬取网页思路及常见问题(原创)...

    学习爬虫有一段时间了,对遇到的一些问题进行一下总结. 爬虫流程可大致分为:请求网页(request),获取响应(response),解析(parse),保存(save). 下面分别说下这几个过程中可以 ...

最新文章

  1. transform.Normalize()用法后面参数为什么用(0.5,0.5,0.5)(0.5,0.5,0.5)
  2. 计算机网络中数据的传递过程
  3. C++学习笔记-----不要在构造函数和析构函数中调用虚函数
  4. oracle 11g-R2安装
  5. (一)卷积网络之基础要点
  6. 发明喂饭机器人_人类又懒出新高度,老美发明自动喂饭机器人,“君子”动嘴不动手...
  7. matlab时域采样与频域采样,实验二:时域采样与频域采样.doc
  8. IP地址物理位置查询
  9. 最小二乘法曲线拟合以及Matlab实现
  10. 爬取QQ空间说说日志、好友个人信息并进行加密
  11. php 公众号管理系统源码,SmartWx微信公众号管理系统 v2.0
  12. 南京工业大学计算机学院考研真题,南京工业大学考研真题汇总
  13. Tomcat 启动速度慢,一直转圈的原因
  14. 恭喜元宇宙产业委秘书长何超、执行秘书长武艳芳成为南京河西CBD发展大使
  15. 按照计算机名共享打印机,添加网络共享打印机
  16. C语言编写数独小游戏
  17. 【windows密码查看】在windows系统中保存的windows凭据如何方便地查看?network_password_recovery
  18. MySQL between and语句包括两端
  19. jsp+ssh2+mysql实现的CRM客户关系管理系统
  20. FAT、FAT32和exFAT文件系统

热门文章

  1. python必备入门代码-python基础入门这一篇就够
  2. java sql注入正则表达式_php防止sql注入示例分析和几种常见攻击正则表达式
  3. Easy Code,IntelliJ IDEA中代码一键生成
  4. 【Spring笔记】依赖注入
  5. 域控下更改服务器密码策略,修改windows-2008-域控服务器密码策略
  6. Cache 和 Buffer 有什么区别?
  7. sql 纵向求和_sql 行列转换 求和平均值等
  8. NYOJ266 - 字符串逆序输出
  9. larveral 直接拷贝安装_做一个能引导所有系统的安装盘
  10. python语言源程序文件类型_Python语言源程序文件的文件类型是__________。