java爬取网页上qq号,邮箱号等

直接拷贝代码执行即可(前提是能连上网络)

结果输出在控制台

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class GetMail {
public static void main(String[] args) throws Exception {
//getMails();
getMails_url();
}

public static void getMails_url() throws Exception {
URL url = new URL("https://");//这里就是要爬取的网页
URLConnection conn = url.openConnection();
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line = null;
String maileRes = "[\u4E00-\u9FA5]+";//这里存放需要设定的规则

//匹配邮箱:"\\w+@\\w+(\\.\\w+)+"
//匹配汉字:"[\u4E00-\u9FA5]+";
//匹配QQ号:"[1-9][0-9]{4,14}"
//qq邮箱:"(.)+@(.)+(\\.[a-z]+){1,}";
Pattern p = Pattern.compile(maileRes);

while((line=bufr.readLine())!=null) {
Matcher m = p.matcher(line);
while(m.find()) {
System.out.println(m.group());
}

}
}

java爬取网页上qq号,邮箱号等相关推荐

  1. 使用java爬取网页上的数据

    要爬的网页:https://list.jd.com/list.html?cat=9987,653,655&page=1&sort=sort_rank_asc&trans=1&a ...

  2. Java 爬取网页图片并下载

    Java 爬取网页图片并下载 源码; package a; import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup. ...

  3. python爬取网页版QQ空间,生成词云图、柱状图、折线图(附源码)

    python爬取网页版QQ空间,生成词云图.柱状图.折线图 最近python课程学完了,琢磨着用python点什么东西,经过一番搜索,盯上了QQ空间,拿走不谢,欢迎点赞收藏,记得github给个sta ...

  4. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  5. 【用Java爬取网页图片——爬虫爬取数据】

    用Java爬取网页图片--爬虫爬取数据 1.在创建项目中导入jsoup 2.创建一个保存下载图片的路径 3.使用URL读取网页路径,jsoup读取网页内容 4.利用属性标签获取图片连接块 5.因为该路 ...

  6. python java 爬数据_如何用java爬虫爬取网页上的数据

    当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...

  7. java 爬取网页数据 多页爬取 jsoup 和 httpClient 实现

    预览结果视图 目录 预览结果视图 介绍 代码 依赖 爬取网页数据代码 解析代码 解析介绍 完整代码 介绍 1.爬取通过org.jsoup 和HttpClients实现 2.爬取多页内容的时候进行循环, ...

  8. (第一个java爬虫)java爬取网页文本并抽取中英文关键词

    问题引入 对于给定的任意一个网址,爬取这个网页上的所有文本信息,并抽取出文本的中文和英文关键词 搭建环境 首先需要具备eclipse开发环境.然后导入jsoup包,用来爬取网页,再到这个网址http: ...

  9. java爬取网页数据_利用Python做数据分析—对前程无忧数据类岗位进行分析

    引言 随着时代的发展,我国在各行各业都需要大量的人才引进,处于近几年最热门的行业也称"最火行业":大数据.数据分析.数据挖掘.机器学习.人工智能,这五门行业各有不同又互有穿插.近几 ...

  10. Java 爬虫:是时候 Get 新技能了,使用 Java 爬取网页信息

    如果你想利用自己的技术做出一点有意思的产品来,那么爬虫.算法和 AI 等技术可能是一个不错的突破口.今天,我们就来介绍下使用 Java 爬取页面信息的几种思路. 说起爬虫,自从 Python 兴起之后 ...

最新文章

  1. python使用fpdf生成数据报告pdf文件
  2. WSDL中文版——详解
  3. Logstash 安装及简单实用(同步MySql数据到Elasticsearch)
  4. plantuml语法_PlantUML实践 | 思维导图
  5. 剑指offer之数组中的逆序对
  6. Spring学习笔记之基础、IOC、DI(1)
  7. spring过滤器、拦截器
  8. 计算机论文中期考核报告,(硕士学位论文中期考核报告范文.doc
  9. Unity Shader - shader forge - #pragma only_renderers 和 exclude_renderers - 导致像素全黑
  10. TWS耳机什么值得买?入耳式蓝牙耳机排行榜10强!
  11. android图片压缩的两个开源库
  12. 关于博客封面的提取与处理
  13. ROS2原始数据类型与接口
  14. 企业和团队如何创建高效实用的知识管理体系
  15. 腾讯云代理商:腾讯云数据库成功落地国信证券 承载日均亿级交易额
  16. 关于PN532 读取二代证UUID____记录自己亲自实验成功!!!
  17. DB2开启db2advis
  18. 中国地质大学(北京) 研究生 数学课《机器学习》期末考试 考试范围+考试题目+参考答案 2022秋
  19. Android Studio的Build Output出现乱码怎么办?莫韵乐与bug的奇妙冒险
  20. Android实现手写板功能

热门文章

  1. Python GUI学习感想
  2. 蓝桥杯算法训练——调和数列问题
  3. Vitis开发笔记:使用分区工具Gparted将SD卡分为BOOT和RoofFS
  4. 竹子买车商学院,知名汽车人钟志,销售实战培训
  5. 云端卫士助力运营商实现DDoS安全业务的统一运营
  6. 2020 HDU多校联合训练
  7. 如何用WGDI进行共线性分析(上)
  8. linux中怎么卸载桌面图标,如何从Ubuntu 18.04桌面上删除垃圾桶图标
  9. 算法学习:最小公倍数求法()
  10. 等保测评机构是什么意思?是什么性质的单位?