网络爬虫+模拟浏览器(获取有权限网站资源):

获取URL

下载资源

分析

处理

public class http {

public static void main(String[]args) throws Exception

{

//http+s更安全

//URL.openStream()打开于URL的连接,并返回一个InputStream用于从连接中读取数据

//获取URL

URL url=new URL("https://www.jd.com");

//下载资源

InputStream is = url.openStream();

BufferedReader br=new BufferedReader(new InputStreamReader(is,"UTF-8"));;

String msg=null;

while((msg=br.readLine())!=null)

{

System.out.println(msg);

}

br.close();

}

}

获取有权限网络资源:

public class http {

public static void main(String[]args) throws Exception

{

//.openConnectio,,返回一个URLConnection实例表示由所引用的远程对象的连接URL

//URLConnection的子类有HttpURLConnection和JarURLConnection

URL url=new URL("https://www.jd.com");

//下载资源

HttpURLConnection conn=(HttpURLConnection)url.openConnection();

conn.setRequestMethod("GET");//模拟浏览器得get请求

conn.setRequestProperty( "User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763");

BufferedReader br=new BufferedReader(new InputStreamReader(conn.getInputStream(),"UTF-8"));

String msg=null;

while((msg=br.readLine())!=null)

{

System.out.println(msg);

}

br.close();

}

}

java 浏览器 爬虫_java 网络编程-爬虫+模拟浏览器相关推荐

  1. java nio 客户端_Java网络编程:Netty框架学习(二)---Java NIO,实现简单的服务端客户端消息传输...

    概述 上篇中已经讲到Java中的NIO类库,Java中也称New IO,类库的目标就是要让Java支持非阻塞IO,基于这个原因,更多的人喜欢称Java NIO为非阻塞IO(Non-Block IO), ...

  2. java nio 海子_java 网络编程入门-NIO

    这篇来讲解java网络编程之后高性能模型.NIO,有些书成为Non-blocking IO 非阻塞IO,这个是相对于BIO来说的.还有一种说法,New IO,顾名思义新的IO,这个是相对于旧版io的定 ...

  3. java tcp 登录_java 网络编程-TCP-双向登录

    TCP:模拟登录 :双向 服务器端 public class tcp { public static void main(String[]args) throws IOException { Syst ...

  4. Python小姿势 - # Python网络爬虫之如何通过selenium模拟浏览器登录微博

    Python网络爬虫之如何通过selenium模拟浏览器登录微博 微博登录接口很混乱,需要我们通过selenium来模拟浏览器登录. 首先我们需要安装selenium,通过pip安装: ``` pip ...

  5. 《爬虫与网络编程基础》学习

    <爬虫与网络编程基础>学习 任务1:计算机网络基础 Step1-2 Step 3:关于XML格式的学习 XML文件格式 XML文件的常见操作 1.构建xml格式文件 2. 保存XML文件 ...

  6. AI:一个20年程序猿的学习资料大全—BAT等面试资料/NECCS大赛资料/一二级建造师/网络编程爬虫等/公务员——只有你不想要的,没有你找不到的

    AI:一个20年程序猿的学习资料大全--前端/后端/架构师/运维各种很多教程资料--只有你不想要的,没有你找不到的 AI:一个20年程序猿的学习资料大全-结构分析软件/办公软件/电气制造控制/高级语言 ...

  7. Java网络编程,模拟QQ群聊功能

    Java网络编程,模拟QQ群聊功能 一.网络编程知识点简介: 1.C/S架构:Client客户端/Server服务器: 涉及到的应用:桌面的应用软件,QQ,王者荣耀 涉及到的技术:Socket网络编程 ...

  8. java 编程原理_Java网络编程 -- 网络编程基础原理

    Hello,今天记录下 Java网络编程 --> 网络编程基础原理. 一起学习,一起进步.继续沉淀,慢慢强大.希望这文章对您有帮助.若有写的不好的地方,欢迎评论给建议哈! 初写博客不久,我是杨展 ...

  9. Java学习——Day14:网络编程

    7.1 网络编程概述 Java是 Internet 上的语言,它从语言级上提供了对网络应用程 序的支持,程序员能够很容易开发常见的网络应用程序. Java提供的网络类库,可以实现无痛的网络连接,联网的 ...

最新文章

  1. python -- plt图表
  2. 二分图HK算法[数论+二分图最大独立集]:Lightoj1356
  3. JVM字节码之整型入栈指令(iconst、bipush、sipush、ldc)
  4. Hadoop源代码eclipse编译指南
  5. win10操作系统vscode如何配置c++开发环境
  6. sharepoint2013保存当前输入的列表
  7. [云炬ThinkPython阅读笔记]2.9 术语表
  8. 基于selenium实现12306的登录操作(图形验证码识别)
  9. 【HDU 1735】字数统计(贪心,有缺陷的一道题)
  10. 使用kafka解决zookeeper is not a recognized option when executing kafka-console-consumer.sh报错
  11. Klevgrand Tines for Mac(电钢琴模拟插件)
  12. Tomcat Server
  13. JAVA对接SAP接口使用sapjco3的见解
  14. codesmith mysql 注释_代码生成工具:CodeSmith 安装、改造适配Mysql 字段注释、DLL修改 及批量生成实体类代码...
  15. excel合并两列内容_EXCEL数据合并、批量添加内容知识,高手嫌弃,新手太需要...
  16. L1-009 N个数求和 (20 分)(C语言)(测试点3和测试点5)
  17. git的一套全流程上手(不包括报错(我忘了有哪些报错了)以及其解决方案(篇幅问题))...
  18. 收发电子邮件属于计算机在方面的应用( ),收发电子邮件属于计算机在( )方面的应用...
  19. 计算机本科毕业论文要求,计算机科学与技术学院本科毕业设计(论文)规范(试行)...
  20. 【03】品优购电商项目:00-品优购项目代码规范

热门文章

  1. 利用URL拼接爬取获取有道翻译内容
  2. javaweb实现验证码功能
  3. tcp四次挥手,为什么是四次?
  4. Python 并行分布式框架 Celery
  5. Java加密与解密的艺术~AES-GCM-NoPadding实现
  6. oracle查看锁表进程,杀掉锁表进程
  7. 证书体系: PFX 文件格式解析
  8. axure怎么做5秒倒计时_罗胖60秒:怎么做一个课程?
  9. linux以太网连接树莓派,如何在没有Internet的情况下直接连接到树莓派
  10. python tkinter下载器_下载小说还要去找网站?Python使用tkinter打造一个小说下载器...