java爬取网页上qq号,邮箱号等
java爬取网页上qq号,邮箱号等
直接拷贝代码执行即可(前提是能连上网络)
结果输出在控制台
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GetMail {
public static void main(String[] args) throws Exception {
//getMails();
getMails_url();
}
public static void getMails_url() throws Exception {
URL url = new URL("https://");//这里就是要爬取的网页
URLConnection conn = url.openConnection();
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line = null;
String maileRes = "[\u4E00-\u9FA5]+";//这里存放需要设定的规则
//匹配邮箱:"\\w+@\\w+(\\.\\w+)+"
//匹配汉字:"[\u4E00-\u9FA5]+";
//匹配QQ号:"[1-9][0-9]{4,14}"
//qq邮箱:"(.)+@(.)+(\\.[a-z]+){1,}";
Pattern p = Pattern.compile(maileRes);
while((line=bufr.readLine())!=null) {
Matcher m = p.matcher(line);
while(m.find()) {
System.out.println(m.group());
}
}
}
java爬取网页上qq号,邮箱号等相关推荐
- 使用java爬取网页上的数据
要爬的网页:https://list.jd.com/list.html?cat=9987,653,655&page=1&sort=sort_rank_asc&trans=1&a ...
- Java 爬取网页图片并下载
Java 爬取网页图片并下载 源码; package a; import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup. ...
- python爬取网页版QQ空间,生成词云图、柱状图、折线图(附源码)
python爬取网页版QQ空间,生成词云图.柱状图.折线图 最近python课程学完了,琢磨着用python点什么东西,经过一番搜索,盯上了QQ空间,拿走不谢,欢迎点赞收藏,记得github给个sta ...
- Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索
Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...
- 【用Java爬取网页图片——爬虫爬取数据】
用Java爬取网页图片--爬虫爬取数据 1.在创建项目中导入jsoup 2.创建一个保存下载图片的路径 3.使用URL读取网页路径,jsoup读取网页内容 4.利用属性标签获取图片连接块 5.因为该路 ...
- python java 爬数据_如何用java爬虫爬取网页上的数据
当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...
- java 爬取网页数据 多页爬取 jsoup 和 httpClient 实现
预览结果视图 目录 预览结果视图 介绍 代码 依赖 爬取网页数据代码 解析代码 解析介绍 完整代码 介绍 1.爬取通过org.jsoup 和HttpClients实现 2.爬取多页内容的时候进行循环, ...
- (第一个java爬虫)java爬取网页文本并抽取中英文关键词
问题引入 对于给定的任意一个网址,爬取这个网页上的所有文本信息,并抽取出文本的中文和英文关键词 搭建环境 首先需要具备eclipse开发环境.然后导入jsoup包,用来爬取网页,再到这个网址http: ...
- java爬取网页数据_利用Python做数据分析—对前程无忧数据类岗位进行分析
引言 随着时代的发展,我国在各行各业都需要大量的人才引进,处于近几年最热门的行业也称"最火行业":大数据.数据分析.数据挖掘.机器学习.人工智能,这五门行业各有不同又互有穿插.近几 ...
- Java 爬虫:是时候 Get 新技能了,使用 Java 爬取网页信息
如果你想利用自己的技术做出一点有意思的产品来,那么爬虫.算法和 AI 等技术可能是一个不错的突破口.今天,我们就来介绍下使用 Java 爬取页面信息的几种思路. 说起爬虫,自从 Python 兴起之后 ...
最新文章
- python使用fpdf生成数据报告pdf文件
- WSDL中文版——详解
- Logstash 安装及简单实用(同步MySql数据到Elasticsearch)
- plantuml语法_PlantUML实践 | 思维导图
- 剑指offer之数组中的逆序对
- Spring学习笔记之基础、IOC、DI(1)
- spring过滤器、拦截器
- 计算机论文中期考核报告,(硕士学位论文中期考核报告范文.doc
- Unity Shader - shader forge - #pragma only_renderers 和 exclude_renderers - 导致像素全黑
- TWS耳机什么值得买?入耳式蓝牙耳机排行榜10强!
- android图片压缩的两个开源库
- 关于博客封面的提取与处理
- ROS2原始数据类型与接口
- 企业和团队如何创建高效实用的知识管理体系
- 腾讯云代理商:腾讯云数据库成功落地国信证券 承载日均亿级交易额
- 关于PN532 读取二代证UUID____记录自己亲自实验成功!!!
- DB2开启db2advis
- 中国地质大学(北京) 研究生 数学课《机器学习》期末考试 考试范围+考试题目+参考答案 2022秋
- Android Studio的Build Output出现乱码怎么办?莫韵乐与bug的奇妙冒险
- Android实现手写板功能