一.实现思路

1、使用Java.net.URL对象,绑定网络上某一个网页的地址

2、通过java.net.URL对象的openConnection()方法获得一个HttpConnection对象

3、通过HttpConnection对象的getInputStream()方法获得该网络文件的输入流对象InputStream

4、循环读取流中的每一行数据,并由Pattern对象编译的正则表达式区配每一行字符,取得email地址

package cn.hyj;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
//和网络相关的操作
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class Test {/**
* @param args
*/public static void main(String[] args) throws IOException {
//1.1 创建一个url对象
URL url = new URL("https://www.douban.com/group/topic/8845032/");
//1.2 打开连接
URLConnection conn = url.openConnection();
//1.3 设置连接网络超时时间 单位为毫秒
conn.setConnectTimeout(1000 * 10);
//1.4 通过流 操作读取指定网络地址中的文件
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line = null;
//1.5 匹配email的正则
String regex = "[a-zA-Z0-9_-]+@\\w+\\.[a-z]+(\\.[a-z]+)?";
//1.6 使用模式的compile()方法生成模式对象
Pattern p = Pattern.compile(regex);
//1.
while((line = bufr.readLine()) != null) {
Matcher m = p.matcher(line);
while(m.find()) {
System.out.println(m.group());// 获得匹配的email
}
}
}}

Java小程序--抓取emai相关推荐

  1. 微信小程序抓取网页数据

    效果图:左边为自己写的,右边为12306小程序 主要代码: 获取cookie: RequestTask: wx.request({url: 'https://kyfw.12306.cn/otn/lef ...

  2. 别人家的程序员是如何使用 Java 进行 Web 抓取的?

    Web抓取非常有用,它可以收集信息供多种用途使用,如数据分析.统计.提供第三方信息,还可以给深神经网络和深度学习提供数据. Web抓取是什么? 有一种非常广泛的误解,人们似乎把Web抓取和Web爬虫当 ...

  3. 别人家的程序员是如何使用 Java 进行 Web 抓取的? 1

    Web抓取非常有用,它可以收集信息供多种用途使用,如数据分析.统计.提供第三方信息,还可以给深神经网络和深度学习提供数据. Web抓取是什么? 有一种非常广泛的误解,人们似乎把Web抓取和Web爬虫当 ...

  4. java抓取网页标题内容_[Java教程]java 网页页面抓取标题和正文

    [Java教程]java 网页页面抓取标题和正文 0 2014-07-10 09:01:30 import java.io.BufferedReader;import java.io.IOExcept ...

  5. java 获取文件所在的文件夹_带你0基础编写一个Java小程序,领略Java程序从编写到编译再到运行的全流程...

    在学习Java之前我们需要先认识下什么是计算机语言?计算机语言又有哪些分类?在了解这些后对我们理解学习帮助是很大的. 要知道计算机语言是人与计算机之间进行信息交流沟通的一种特殊语言,又分为机械语言.汇 ...

  6. Fiddler 微信小程序抓包

    前言 刚刚在进行微信小程序抓包时, 我通过手机WiFi代理怎么也抓不到包.百度了一圈总结三点 小程序无法抓包原因 : 安卓系统 7.0 以下版本,不管微信任意版本,都会信任系统提供的证书 安卓系统 7 ...

  7. 微信小程序抓包教程:Burpsuite版 附所需工具

    身为一名码农,抓包肯定是一项必备技能.工作中遇到很多次需要对小程序进行抓包排查问题.下面分享一下我的抓包方式,使用的是电脑版小程序抓包,跟手机的方式都差不多的. 一.环境 微信版本:3.6.0.18 ...

  8. java爬虫 京东_教您使用java爬虫gecco抓取JD全部商品信息(一)

    #教您使用java爬虫gecco抓取JD全部商品信息(一) ##gecco爬虫 如果对gecco还没有了解可以参看一下gecco的github首页.gecco爬虫十分的简单易用,JD全部商品信息的抓取 ...

  9. 使用 Fiddler 进行小程序抓包

    为什么是 Fiddler 理由很简单:因为大多数测试同学都是用 Fiddler.虽然不同的抓包工具功能都大同小异,但就像开发者统一开发工具能够提高团队协作的效率一样,开发和测试之间统一工具也能提高大家 ...

  10. 微信小程序抓包方法汇总

    前言 ios端和mac用户可以忽略以下内容,本文针对于windows端和android端的微信无法抓取小程序数据包提出相关解决方案. 分析 Android7. 0及以上的系统中,每个应用可以定义自己的 ...

最新文章

  1. Wpf消息循环之消息传递
  2. 基于Hadoop的58同城离线计算平台设计与实践
  3. NLP命名实体识别(NER)代码实践
  4. linux管理磁盘和文件系统
  5. 阿里云发布大数据产品ODPS 6小时处理100PB数据
  6. 《自己动手做交互系统》——导读
  7. Squid 代理服务器 编译源码 伪造HTTP_X_FORWARDED_FOR 请求头
  8. 每个线程只对一个数据操作就不会出现线程安全问题-------------成员变量,用来计算累加的和...
  9. vim下如何去掉windows编辑的文件中的^M
  10. Sharepoint 自定义搜索
  11. java 链表插入排序,insertion Sort List (链表的插入排序) leecode java
  12. java生命游戏并行_Java架构--线程的发展历史
  13. 基于Matlab的数字图像gui界面设计
  14. gui框架 java_现在选择哪个Java GUI框架
  15. 怎么将多个文本文件合并为一个文本文件
  16. 这世界没有能够预测未来的魔法水晶球
  17. Canal.deployer 启动报错说CHARACTER SET 'utf8' COLLATE 'utf8_unico', expect null,rkdown编辑器
  18. 设置和取消Word文档打开密码的三种方法
  19. Flink Interval Join使用以及源码解析
  20. [React]网易云音乐Web PC端

热门文章

  1. 【mcuclub】红外测温-MLX90614
  2. java项目第12期-淘客系统源码(安卓+IOS+java后端)【毕业设计】
  3. 计算机驱动空间的c盘不足怎么办,c盘空间不足
  4. 电商经验!补单防止骗子退款技巧
  5. android平板太卡要怎么办,怎么解决平板电脑卡顿的问题?
  6. 数据挖掘--风电机组异常数据识别与清洗
  7. 发送邮件被退回,提示: Helo command rejected: Invalid name 错误
  8. android 恢复出厂设置 时间,安卓恢复出厂设置
  9. 甘超波:NLP潜意识和意识
  10. 网页视频加速播放方法(不用下载插件,不用安装浏览器)