java实现爬取文本中的手机号、邮箱以及电话号码
public static void main(String[] args) {String index = "手机号信息:13333333333 15555555555 18888888888" +"邮箱信息:12@qq.com s123@163.com sdjkaxh@pci.com.cn 400-100-3233" +"电话号码: 021-1584654 0215412111 0214511111";//爬取电话号码,邮箱以及手机号String regex = "(0\\d{2,6}-?\\d{5,20})|(\\w{1,30}@[0-9a-zA-Z]{2,20}(\\.[0-9a-zA-Z]{2,20}){1,2})" +"|(1[3-9]\\d{9})|(400-?\\d{3,9}-?\\d{3,9})";//将爬取规则编译成匹配对象Pattern pattern = Pattern.compile(regex);//获取一个容器来存取匹配对象Matcher matcher = pattern.matcher(index);//开始匹配while (matcher.find()){String re = matcher.group();System.out.println(re);}}
java实现爬取文本中的手机号、邮箱以及电话号码相关推荐
- Java实现利用正则表达式校验手机号码,邮箱,电话号码
需求: 校验手机号码,邮箱,电话号码 实现代码: package apilambda.d6_regex;import java.util.Scanner;public class RegexTest2 ...
- 使用MySQL或Java对查询结果中的手机号、身份证号等进行脱敏处理
为了保障客户数据的隐私,系统或者APP往往需要对手机号进行脱敏处理,因为前端仅仅是为了展示. 那什么是脱敏处理呢?就是把用户的一些敏感信息(如身份证号.邮箱.手机号等)进行加密(模糊处理). 举例:假 ...
- java poi 读取Excel中的手机号或电话号码,手机号变成1.8312345678E10格式数据的解决方法
[现象] 共有2行数据 [张三1, 1.8312345678E10, 张三2, 1.8312345679E10] [解决方法] v.add(row.getCell(1)+""); ...
- python爬取文本中的成语_python正则表达式抓取成语网站
#anthor jiqunpeng #time 20121124 import urllib import re def getHtml(url): #从URL中读取html内容 page = url ...
- python爬取文本中的成语_python爬虫的简单项目之爬取成语
from selenium import webdriver from idiom import DbHandle option = webdriver.ChromeOptions() option. ...
- app中使用用户名/邮箱/手机号登录的思路分析
摘要:app中使用用户名/邮箱/手机号登录的思路分析 1.客户端 客户端需要传递2个参数 account 代表:用户名/邮箱/手机号 password 代表:密码这里问题来了,那么如何判断识别用户输入 ...
- 教你如何使用Java代码从网页中爬取数据到数据库中——网络爬虫精华篇
文章目录 1:网络爬虫介绍 2:HttpClients类介绍 2.1 HttpGet参数问题 2.2 HttpPost参数问题 2.3 连接池技术问题 3:Jsoup介绍 4:动手实践如何抓取网页上数 ...
- Jsoup简单例子——爬取网页内的邮箱
一.前言 Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API, 可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据 ...
- Jsoup简单例子2.0——多线程爬取网页内的邮箱
上一篇文章讲了利用Jsoup爬取贴吧帖子里的邮箱,虽然爬取成功了,但我对效率有所追求.10页的帖子爬取了两百多个邮箱,最快用时8秒,一般需要9秒.在思考了一下怎么提升效率后,决定采用多线程的方式爬取网 ...
最新文章
- 戴尔服务器重装系统优盘启动不了怎么办,U盘重装系统,开机按F12选择USB启动项无法进入PE系统怎么办?...
- Graphviz之DT:手把手教你使用可视化工具Graphviz将dot文件转为结构图的pdf文件
- java添加文字水印插件_java之io添加文字水印
- devstack安装OpenStack Pike版本 (OVS+VLAN)
- outlook错配置账户到exchange后的删除办法
- layui时间日期控件使用
- php负载均衡慕课网,Nginx实现负载均衡
- 比较两个数的大小,自定义比较两个整数的大小的方法
- 点击按钮刷新_Chrome扩展推荐:抢票太累?后台监视网页,页面自动刷新和提醒...
- 天津盈克斯机器人科技_坐标天津,适合亲子游的科技馆,亮点是机器人展区
- Windows服务器安全策略配置——简单实用
- 【论文笔记】EagerMOT:3D Multi-Object Tracking via Sensor Fusion
- eclipse不自动弹出提示(alt+/快捷键失效)
- 智能路由和SD-WAN孰优孰劣
- 武汉卫星地图商用级别19级 来自百度卫星地图
- [Android]安卓上传下载文件
- sqlmap基础使用手册 ─=≡Σ(((つ•̀ω•́)つ 知己知彼百战百胜 web安全
- 大连理工大学网络综合实验三:交换机端口配置与生成树协议配置
- Apache Ranger 是什么?
- Matplotlib中的“plt”和“ax”,设置大小刻度,设置实线和虚线方格线