public static void main(String[] args) {String index = "手机号信息:13333333333 15555555555 18888888888" +"邮箱信息:12@qq.com  s123@163.com sdjkaxh@pci.com.cn 400-100-3233" +"电话号码: 021-1584654 0215412111 0214511111";//爬取电话号码,邮箱以及手机号String regex = "(0\\d{2,6}-?\\d{5,20})|(\\w{1,30}@[0-9a-zA-Z]{2,20}(\\.[0-9a-zA-Z]{2,20}){1,2})" +"|(1[3-9]\\d{9})|(400-?\\d{3,9}-?\\d{3,9})";//将爬取规则编译成匹配对象Pattern pattern = Pattern.compile(regex);//获取一个容器来存取匹配对象Matcher matcher = pattern.matcher(index);//开始匹配while (matcher.find()){String re = matcher.group();System.out.println(re);}}

java实现爬取文本中的手机号、邮箱以及电话号码相关推荐

  1. Java实现利用正则表达式校验手机号码,邮箱,电话号码

    需求: 校验手机号码,邮箱,电话号码 实现代码: package apilambda.d6_regex;import java.util.Scanner;public class RegexTest2 ...

  2. 使用MySQL或Java对查询结果中的手机号、身份证号等进行脱敏处理

    为了保障客户数据的隐私,系统或者APP往往需要对手机号进行脱敏处理,因为前端仅仅是为了展示. 那什么是脱敏处理呢?就是把用户的一些敏感信息(如身份证号.邮箱.手机号等)进行加密(模糊处理). 举例:假 ...

  3. java poi 读取Excel中的手机号或电话号码,手机号变成1.8312345678E10格式数据的解决方法

    [现象] 共有2行数据 [张三1, 1.8312345678E10, 张三2, 1.8312345679E10] [解决方法] v.add(row.getCell(1)+""); ...

  4. python爬取文本中的成语_python正则表达式抓取成语网站

    #anthor jiqunpeng #time 20121124 import urllib import re def getHtml(url): #从URL中读取html内容 page = url ...

  5. python爬取文本中的成语_python爬虫的简单项目之爬取成语

    from selenium import webdriver from idiom import DbHandle option = webdriver.ChromeOptions() option. ...

  6. app中使用用户名/邮箱/手机号登录的思路分析

    摘要:app中使用用户名/邮箱/手机号登录的思路分析 1.客户端 客户端需要传递2个参数 account 代表:用户名/邮箱/手机号 password 代表:密码这里问题来了,那么如何判断识别用户输入 ...

  7. 教你如何使用Java代码从网页中爬取数据到数据库中——网络爬虫精华篇

    文章目录 1:网络爬虫介绍 2:HttpClients类介绍 2.1 HttpGet参数问题 2.2 HttpPost参数问题 2.3 连接池技术问题 3:Jsoup介绍 4:动手实践如何抓取网页上数 ...

  8. Jsoup简单例子——爬取网页内的邮箱

    一.前言 Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API, 可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据 ...

  9. Jsoup简单例子2.0——多线程爬取网页内的邮箱

    上一篇文章讲了利用Jsoup爬取贴吧帖子里的邮箱,虽然爬取成功了,但我对效率有所追求.10页的帖子爬取了两百多个邮箱,最快用时8秒,一般需要9秒.在思考了一下怎么提升效率后,决定采用多线程的方式爬取网 ...

最新文章

  1. 戴尔服务器重装系统优盘启动不了怎么办,U盘重装系统,开机按F12选择USB启动项无法进入PE系统怎么办?...
  2. Graphviz之DT:手把手教你使用可视化工具Graphviz将dot文件转为结构图的pdf文件
  3. java添加文字水印插件_java之io添加文字水印
  4. devstack安装OpenStack Pike版本 (OVS+VLAN)
  5. outlook错配置账户到exchange后的删除办法
  6. layui时间日期控件使用
  7. php负载均衡慕课网,Nginx实现负载均衡
  8. 比较两个数的大小,自定义比较两个整数的大小的方法
  9. 点击按钮刷新_Chrome扩展推荐:抢票太累?后台监视网页,页面自动刷新和提醒...
  10. 天津盈克斯机器人科技_坐标天津,适合亲子游的科技馆,亮点是机器人展区
  11. Windows服务器安全策略配置——简单实用
  12. 【论文笔记】EagerMOT:3D Multi-Object Tracking via Sensor Fusion
  13. eclipse不自动弹出提示(alt+/快捷键失效)
  14. 智能路由和SD-WAN孰优孰劣
  15. 武汉卫星地图商用级别19级 来自百度卫星地图
  16. [Android]安卓上传下载文件
  17. sqlmap基础使用手册 ─=≡Σ(((つ•̀ω•́)つ 知己知彼百战百胜 web安全
  18. 大连理工大学网络综合实验三:交换机端口配置与生成树协议配置
  19. Apache Ranger 是什么?
  20. Matplotlib中的“plt”和“ax”,设置大小刻度,设置实线和虚线方格线

热门文章

  1. ISO 8601时间格式时间创建
  2. Linux使用nvida-smi查看GPU类型
  3. Outlook邮箱开源许可-android
  4. Battery Historian
  5. 面试可能遇到java基础知识
  6. 实现微信公众号微信头像上传
  7. 企业邮箱管理员如何管理邮箱
  8. 微信公众号中,怎么插入代码块?(微信公众号中,代码块怎么排版?)
  9. LRC歌词制作LRC歌词制作
  10. 微信文件传输助手文件存储位置问题