原创博文,欢迎转载,转载时请务必附上博文链接,感谢您的尊重。

正则表达式定义了字符串的模式;
正则表达式可以用来搜索、编辑或处理文本;
正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。

正文

使用正则表达式需要引入 java.util.regex 包,我们就从这里入手讲解:

java.util.regex 包主要包括以下三个类:

  • Pattern 类:
    pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

  • Matcher 类:
    Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

  • PatternSyntaxException:
    PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

以下实例中演示了正则表达式的使用:

/* import java.util.regex.*; */
public void RegexExample() {String input = "I am Jimmy from mp.csdn.net";String regex = ".*csdn.*";// 方式1:String 的 matches 方法boolean flag1 = input.matches(regex);// 方式2:Pattern 对象的 matches 方法boolean flag2 = Pattern.matches(regex, input);// 方式3: Matcher 对象的 matches 方法Pattern p = Pattern.compile(regex);Matcher m = p.matcher(input);boolean flag3 = m.matches();System.out.println("字符串中是否包含了'csdn'子字符串? " + flag1 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag2 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag3 );
}
输出结果:字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true

从上面的代码中,你会看到一个现象:

  • 3种方式的底层实现其实是一样的,只是封装的成度不一样,实际也确实如此;
  • 明白方式3,更有助于理解正则的执行过程;

matches 和 lookingAt 方法

matches() 和 lookingAt() 方法都用来尝试匹配一个输入序列模式。不同的是 matches() 要求整个序列都匹配,而 lookingAt() 不要求;
lookingAt() 方法虽然不需要整句都匹配,但是需要从第一个字符开始匹配;
这两个方法经常在输入字符串的开始使用。

public void matchAndLookingExample() {String REGEX = "foo";String INPUT = "foooooooooo";String INPUT2 = "ooooofoooooo";Pattern pattern = Pattern.compile(REGEX);Matcher matcher = pattern.matcher(INPUT);Matcher matcher2 = pattern.matcher(INPUT2);System.out.println("lookingAt(): "+matcher.lookingAt());System.out.println("matches(): "+matcher.matches());System.out.println("lookingAt(): "+matcher2.lookingAt());
}
输出结果:lookingAt(): true   // 开头匹配matches(): false // 不是整个序列都匹配lookingAt(): false  // 开头不匹配

正则表达式语法

在其他语言中,\\ 表示:我想要在正则表达式中插入一个普通的(字面上的)反斜杠,请不要给它任何特殊的意义。

在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。

所以,在其他的语言中(如Perl),一个反斜杠 \ 就足以具有转义的作用,而在 Java 中正则表达式中则需要有两个反斜杠才能被解析为其他语言中的转义作用。也可以简单的理解在 Java 的正则表达式中,两个 \\ 代表其他语言中的一个 \,这也就是为什么表示一位数字的正则表达式是 \\d,而表示一个普通的反斜杠是 \\\\。

字符 说明
^ 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与"\n"或"\r"之后的位置匹配。
$ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与"\n"或"\r"之前的位置匹配。
* 零次或多次匹配前面的字符或子表达式。例如,zo* 匹配"z"和"zoo"。* 等效于 {0,}。
+ 一次或多次匹配前面的字符或子表达式。例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹配。+ 等效于 {1,}。
? 零次或一次匹配前面的字符或子表达式。例如,"do(es)?“匹配"do"或"does"中的"do”。? 等效于 {0,1}。
{n} n 是非负整数。正好匹配 n 次。例如,"o{2}"与"Bob"中的"o"不匹配,但与"food"中的两个"o"匹配。
{n,} n 是非负整数。至少匹配 n 次。例如,"o{2,}“不匹配"Bob"中的"o”,而匹配"foooood"中的所有 o。"o{1,}“等效于"o+”。"o{0,}“等效于"o*”。
{n,m} m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的头三个 o。‘o{0,1}’ 等效于 ‘o?’。注意:您不能将空格插入逗号和数字之间。
x y
[xyz] 字符集。匹配包含的任一字符。例如,"[abc]“匹配"plain"中的"a”。
[ ^xyz] 反向字符集。匹配未包含的任何字符。例如,"[^abc]“匹配"plain"中"p”,“l”,“i”,“n”。
[a-z] 字符范围。匹配指定范围内的任何字符。例如,"[a-z]"匹配"a"到"z"范围内的任何小写字母。
\d 数字字符匹配。等效于 [0-9]。
\D 非数字字符匹配。等效于 [ ^0-9]。
\w 匹配任何字类字符,包括下划线。与"[A-Za-z0-9_]"等效。
\W 与任何非单词字符匹配。与"[ ^A-Za-z0-9_]"等效。

常用的正则表达式

说明 正则表达式
一、校验数字的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
数字 ^ [0-9]*$
n位的数字 ^\d{n}$
至少n位的数字 ^\d{n,}$
m-n位的数字 ^\d{m,n}$
非零开头的最多带两位小数的数字 ^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数 ^(-)?\d+(.\d{1,2})?$
有1~3位小数的正实数 ^ [0-9]+(.[0-9]{1,3})?$
非负整数 ^\d+$
非正整数 ^((-\d+)
二、校验字符的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
汉字 ^ [\u4e00-\u9fa5]{0,}$
英文和数字 ^ [A-Za-z0-9]+$
长度为3-20的所有字符 ^.{3,20}$
由26个英文字母组成的字符串 ^ [A-Za-z]+$
由数字、26个英文字母或者下划线组成的字符串 ^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线 ^ [\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号 ^ [\u4E00-\u9FA5A-Za-z0-9]+$
可以输入含有^%&’,;=?$"等字符 [^%&’,;=?$\x22]+
禁止输入含有~的字符 [^~\x22]+
三、特殊需求表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
Email地址 ^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
域名 [a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL [a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码 ^(13[0-9]
电话号码 ^((\d{3,4}-)
身份证号(15位、18位数字) ^\d{15}
短身份证号码(数字、字母x结尾) ^([0-9]){7,18}(x
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线) ^ [a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线) ^ [a-zA-Z]\w{5,17}$
日期格式 ^\d{4}-\d{1,2}-\d{1,2}
中国邮政编码 [1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
腾讯QQ号 [1-9][0-9]{4,} (腾讯QQ号从10000开始)
IP地址 \d+.\d+.\d+.\d+ (提取IP地址时有用)
中文字符的正则表达式 [\u4e00-\u9fa5]

我是IT无知君,您的点赞、评论和关注,是我继续创作的不懈动力。
学无止境,气有浩然,让我们一起加油,乘风破浪,江湖有缘再见!!

Java 正则表达式:语法讲解和常用表达式汇总相关推荐

  1. (转)JAVA正则表达式语法大全

    [正则表达式]文本框输入内容控制 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$ 只能输入数字:"^[0-9]*$". 只能输入n位的数字:"^\d{n ...

  2. java正则表达式语法

    java正则表达式语法 这里简单总结一下我对java里的正则表达式一部分语法的学习 一. 普通字符 字母.数字.汉字.下划线,以及其他没有特殊含义的字符都可作为正则表达式匹配他们本身.例如正则表达式& ...

  3. Android 代码混淆语法讲解及常用模板(转)

    转载请注明原博客地址  Android 代码混淆语法讲解及常用模板 前言 混淆对于每一个开发者来说都不陌生,对于大多数 APP 而言,在上线之前,通常会进行代码混淆,加固,防止自己的 APP 被别人轻 ...

  4. java正则表达式语法(java正整数正则表达式)

    java正则表达式 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明: "^The": 开头一定要有"The"字符串; "of de ...

  5. 初学者必备——三大类18条Java正则表达式语法

    关于Java中的正则表达式语法,既然是基础知识,那我们就从概念说起了.   概念与作用   正则表达式是一串字符,它描述了一个文本模式,利用它可以方便地处理文本,包括文本的查找.替换.验证.切分等. ...

  6. java 正则表达式语法_Java 正则表达式基础语法

    基础符号 首尾匹配^:匹配输入字符串开始的位置 $:匹配输入字符串结尾的位置 例:"^hello$"含义为该字符串开头必须为h,结尾必须为oprivate static void ...

  7. Idea JAVA开发工具快速上手-常用快捷键汇总

    前言: 之前一直使用Eclipse 系列开发IDE工具,由于eclipse是开源的所以,一般情况,eclipse基本上每一个java入门者的首选开发工具,其次 Myeclipse.不过现在越来越多的人 ...

  8. java语言代码大全_Java常用语言汇总

    Java有哪些常用语?不介绍Java 常用语,对Java 的总体介绍就是不完整的.尽管促使Java 诞生的源动力是可移植性和安全性,但在Java 语言终成型的过程中,其他一些因素也起了重要的作用.接下 ...

  9. java事件大全_Java sctipt常用事件汇总介绍

    描述 鼠标单击事件 ondblclick 鼠标双击事件 onmouseover 鼠标移入事件 onmouseout 鼠标移出事件 onmousemove 鼠标移动事件 onmousedown 鼠标按下 ...

最新文章

  1. Subsonic设置--新手上路
  2. 使用chpasswd命令批量修改系统用户密码
  3. 字符级Seq2Seq-英语粤语翻译的简单实现
  4. ActionForm
  5. 如何表达清楚一个程序:模块化设计
  6. mysql迁移数据目录,这个坑你遇到过吗?
  7. Ruby代码块、迭代子和过程对象
  8. 编译调试Apache HTTP Server
  9. Python中的self和init
  10. 硬件设计基础:32种EMC标准电路
  11. 学习笔记 Tianmao 篇 recyclerView 辅助的RecycleAdapterImpl类(适配自定义care 一型 使用了frecso SimpleDraweeView)
  12. 如何直接修改html文件,如何修改HTML的文件?
  13. 计算机系统基础书记,【盘点】开学第一周:学风浓 教风严 校风正
  14. python程序设计机械工业出版社课后答案-Python 3程序设计基础
  15. 迎新:Apache IoTDB 喜迎 2 位新 Committer
  16. fig-tlo_PHP-FIG的替代方案:各种愿景的利弊
  17. vm虚拟机中搭建Linux
  18. ASO如何迅速提升一个核心关键词排名,aso关键词排名怎么优化
  19. 适用于异构芯片(CPU,ASIC,DSP,FPGA,GPU)的软件并行技术
  20. java zip4j,Java引入zip4j解压缩处理

热门文章

  1. Win10 环境下安装Ubuntu 18.04过程记录
  2. JAVA Email——利用java完成发送电子邮件(包括附件)
  3. Linux 下查看进程内的线程情况 ps, top 命令
  4. 修饰器模式(day04)
  5. EHCI主机控制器--主机控制器初始化
  6. Hook:如何高效双向链接不同类型的信息资源?
  7. 13-Javaweb-JSPmvc模式 JDBC事务 反射补充
  8. PlayMaker — 动作
  9. OpenCV4.3 Java 编程入门:图像直方图
  10. python导入twisted模块_Python twisted ImportError:无法导入名称unicod