关于Java正则和转义中\和\\和\\\\的理解
一、作为Java的转义字符
1.在Java中,反斜杠(\)是一个特殊的字符,被称为转义字符,它的作用是用来转义后面一个字符。转义后的字符通常用于表示一个不可见的字符或具有特殊含义的字符,例如换行(\n)、回车符(\r)、制表符(\t)。
2.在Java中以下字符都有特殊意义,无法直接表示
单引号:char c = 'a'; 表示字符类型的数据时需要使用单引号将字符左右括起来。所以要表示字符'则需要使用\'
双引号:String str = "abc"; 表示字符串类型的数据时需要使用双引号将字符串左右括起来。要表示字符串"则需要\"
反斜杠:String regex = "你好\n\t阿"; 在Java代码中\表示转义字符,所以如果要表示字面意思的\,则需要使用\\
所以用反斜杠加上本身字符来进行表示。
二、在正则表达式中
2.1Java中正则表达式的\
\表示将下一字符标记为特殊字符。如\d表示数字字符匹配,等效于 [0-9]。\w表示匹配任何字类字符(字母数字下划线),注意包括下划线。与"[A-Za-z0-9_]"等效。
在其他语言中,\\ 表示:我想要在正则表达式中插入一个普通的(字面上的)反斜杠,请不要给它任何特殊的意义。
在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。
在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。
在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。
\\中的第一个\表示java的转义字符\由编译器解析,第二个\是正则表达式\由正则表达式引擎解析。
所以,在其他的语言中(如Perl),一个反斜杠 \ 就足以具有转义的作用,而在 Java 中正则表达式中则需要有两个反斜杠才能被解析为其他语言中的转义作用。也可以简单的理解在 Java 的正则表达式中,两个 \\ 代表其他语言中的一个 \,这也就是为什么表示一位数字的正则表达式是 \\d,而表示一个普通的反斜杠是 \\\\。
所以Java正则表达式中匹配一个普通的反斜杠是\\\\。
所以如果在[]内表示一个],要写两个\,即[\\]]。
例如,我要在前面不是0-9,也不是) ] }三个反括号的后面位置中,匹配 - 的后面是数字或者正括号( [ { 的 - 前面的位置,须写成:
(?<![0-9)}\\]])(?=-[0-9({\\[]) 。
若在该位置加0,可写成String s = str.replaceAll("(?<![0-9)}\\]])(?=-[0-9({\\[]) ","0");
2.2说明:
字符 | 说明 |
---|---|
^ | 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与"\n"或"\r"之后的位置匹配。 |
$ | 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与"\n"或"\r"之前的位置匹配。 |
* | 零次或多次匹配前面的字符或子表达式。例如,zo* 匹配"z"和"zoo"。* 等效于 {0,}。 |
+ | 一次或多次匹配前面的字符或子表达式。例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹配。+ 等效于 {1,}。 |
? | 零次或一次匹配前面的字符或子表达式。例如,"do(es)?“匹配"do"或"does"中的"do”。? 等效于 {0,1}。 |
{n} | n 是非负整数。正好匹配 n 次。例如,"o{2}"与"Bob"中的"o"不匹配,但与"food"中的两个"o"匹配。 |
{n,} | n 是非负整数。至少匹配 n 次。例如,"o{2,}“不匹配"Bob"中的"o”,而匹配"foooood"中的所有 o。"o{1,}“等效于"o+”。"o{0,}“等效于"o*”。 |
{n,m} | m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的头三个 o。‘o{0,1}’ 等效于 ‘o?’。注意:您不能将空格插入逗号和数字之间。 |
x | y |
[xyz] | 字符集。匹配包含的任一字符。例如,"[abc]“匹配"plain"中的"a”。 |
[ ^xyz] | 反向字符集。匹配未包含的任何字符。例如,"[^abc]“匹配"plain"中"p”,“l”,“i”,“n”。 |
[a-z] | 字符范围。匹配指定范围内的任何字符。例如,"[a-z]"匹配"a"到"z"范围内的任何小写字母。 |
\d | 数字字符匹配。等效于 [0-9]。 |
\D | 非数字字符匹配。等效于 [ ^0-9]。 |
\w | 匹配任何字类字符,包括下划线。与"[A-Za-z0-9_]"等效。 |
\W | 与任何非单词字符匹配。与"[ ^A-Za-z0-9_]"等效。 |
2.3Java正则表达式的使用方法
使用正则表达式需要引入 java.util.regex 包,我们就从这里入手讲解:
java.util.regex 包主要包括以下三个类:
Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
PatternSyntaxException:
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
以下实例中演示了正则表达式的使用:
/* import java.util.regex.*; */
public void RegexExample() {String input = "I am Jimmy from mp.csdn.net";String regex = ".*csdn.*";// 方式1:String 的 matches 方法boolean flag1 = input.matches(regex);// 方式2:Pattern 对象的 matches 方法boolean flag2 = Pattern.matches(regex, input);// 方式3: Matcher 对象的 matches 方法Pattern p = Pattern.compile(regex);Matcher m = p.matcher(input);boolean flag3 = m.matches();System.out.println("字符串中是否包含了'csdn'子字符串? " + flag1 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag2 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag3 );
}
输出结果:字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true
从上面的代码中,你会看到一个现象:
- 3种方式的底层实现其实是一样的,只是封装的成度不一样,实际也确实如此;
- 明白方式3,更有助于理解正则的执行过程;
matches 和 lookingAt 方法
matches() 和 lookingAt() 方法都用来尝试匹配一个输入序列模式。不同的是 matches() 要求整个序列都匹配,而 lookingAt() 不要求;
lookingAt() 方法虽然不需要整句都匹配,但是需要从第一个字符开始匹配;
这两个方法经常在输入字符串的开始使用。
public void matchAndLookingExample() {String REGEX = "foo";String INPUT = "foooooooooo";String INPUT2 = "ooooofoooooo";Pattern pattern = Pattern.compile(REGEX);Matcher matcher = pattern.matcher(INPUT);Matcher matcher2 = pattern.matcher(INPUT2);System.out.println("lookingAt(): "+matcher.lookingAt());System.out.println("matches(): "+matcher.matches());System.out.println("lookingAt(): "+matcher2.lookingAt());
}
输出结果:lookingAt(): true // 开头匹配matches(): false // 不是整个序列都匹配lookingAt(): false // 开头不匹配
三、常用的正则表达式
说明 | 正则表达式 |
---|---|
一、校验数字的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ | |
数字 | ^ [0-9]*$ |
n位的数字 | ^\d{n}$ |
至少n位的数字 | ^\d{n,}$ |
m-n位的数字 | ^\d{m,n}$ |
非零开头的最多带两位小数的数字 | ^([1-9][0-9]*)+(.[0-9]{1,2})?$ |
带1-2位小数的正数或负数 | ^(-)?\d+(.\d{1,2})?$ |
有1~3位小数的正实数 | ^ [0-9]+(.[0-9]{1,3})?$ |
非负整数 | ^\d+$ |
非正整数 | ^((-\d+) |
二、校验字符的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ | |
汉字 | ^ [\u4e00-\u9fa5]{0,}$ |
英文和数字 | ^ [A-Za-z0-9]+$ |
长度为3-20的所有字符 | ^.{3,20}$ |
由26个英文字母组成的字符串 | ^ [A-Za-z]+$ |
由数字、26个英文字母或者下划线组成的字符串 | ^\w+$ 或 ^\w{3,20}$ |
中文、英文、数字包括下划线 | ^ [\u4E00-\u9FA5A-Za-z0-9_]+$ |
中文、英文、数字但不包括下划线等符号 | ^ [\u4E00-\u9FA5A-Za-z0-9]+$ |
可以输入含有^%&’,;=?$"等字符 | [^%&’,;=?$\x22]+ |
禁止输入含有~的字符 | [^~\x22]+ |
三、特殊需求表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ | |
Email地址 | ^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$ |
域名 | [a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? |
InternetURL | [a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$ |
手机号码 | ^(13[0-9] |
电话号码 | ^((\d{3,4}-) |
身份证号(15位、18位数字) | ^\d{15} |
短身份证号码(数字、字母x结尾) | ^([0-9]){7,18}(x |
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线) | ^ [a-zA-Z][a-zA-Z0-9_]{4,15}$ |
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线) | ^ [a-zA-Z]\w{5,17}$ |
日期格式 | ^\d{4}-\d{1,2}-\d{1,2} |
中国邮政编码 | [1-9]\d{5}(?!\d) (中国邮政编码为6位数字) |
腾讯QQ号 | [1-9][0-9]{4,} (腾讯QQ号从10000开始) |
IP地址 | \d+.\d+.\d+.\d+ (提取IP地址时有用) |
中文字符的正则表达式 | [\u4e00-\u9fa5] |
四、常用正则表达式归纳
(转载+ 部分原创)
关于Java正则和转义中\和\\和\\\\的理解相关推荐
- java正则校验企业中征码
延续上一篇,此则文为java版本校验企业中征码. 校验规则在上一篇中已经提过.所以话不多说,直接上代码. //校验中征码public static boolean checkZZM(String va ...
- java 正则 u2E80_java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍
假如现在有一个需求,要你用java语言来匹配出一个文本里面的所有(英文半角)标点符号,你会怎么写呢?我想大多数人应该是把这些符号都罗列出来, 如: !"#$%&'()*+,-./:; ...
- java 正则替换cdata_XML中配置正则表达式的写法
在做WEB表单时,为了增加用户体验,表单验证通常是必不可少的.而这样的效果通常也是通过正则表达式实现. 如果在往前考虑一步,假如用户自己也能根据需要修改这些正则表达式,那就更加人性化了. 在做管理系统 ...
- java 正则 空格_Java中关于空格的正则表达式
public class Test { public static void main(String[] args) { String s = "GET /index ...
- JAVA正则提取字符串中的日期
在我们解析字符串的时候,有这么一个需求,需要提取字符中的日期,例如:"开奖日期:2021年3月28日 兑奖截止日期:2021年5月26日" 输入样例: 开奖日期:2021年3月28 ...
- java正则提取字符串中的符号汉字数字字母
提取字符串中的符号 /*** 提取字符串中的所有符号* @param str* @return*/public static String getSymbol (String str) {String ...
- java 正则车牌_Android中手机号、车牌号正则表达式大全
手机号 手机名称有GSM:表示只支持中国联通或者中国移动2G号段(130.131.132.134.135.136.137.138.139.145.147.150.151.152.155.156.157 ...
- Node的异步与java的异步_node中异步IO的理解
解释性语言和编译型语言的区别: 计算器不能直接的理解高级语言,只能理解机器语言,所以必须把高级语言翻译为机器语言,翻译的方式有两种,一个是编译,一个是解释. 解释性语言的程序不需要编译,它是在运行程序 ...
- 中文字符匹配java_java正则匹配HTML中a标签里的中文字符示例
java正则匹配HTML中a标签里的中文字符示例 发布于 2020-8-12| 复制链接 摘记: 本文实例讲述了java正则匹配HTML中a标签里的中文字符.分享给大家供大家参考,具体如下:今天群里一 ...
最新文章
- 吴忠强:刷LeetCode的正确姿势!
- 安卓JNI使用C++类
- web第6次作业position
- Python 学习笔记(1)
- python getcwd_Python os.getcwd()方法
- Struts1的实现原理
- 【转】博客美化(6)为你的博文自动添加目录
- 2月1日:成都力争3年建237个养老院全覆盖社区养老
- 根据pdf转换成tif图片
- 1人30天44587行代码,分享舍得网开发过程
- 联想Y720安装双系统详解win10+ubuntu14.04+gtx1060显卡驱动
- 数据库操作(DML,DCL,DQL)
- 解决笔记本键盘禁用失败问题
- 随興8作者雨落下無痕
- 【字符集】解决docker 容器中中文乱码问题
- Qt在Win下调用系统的软键盘,区分win7\win8\win10
- Android 5.0 CardView 应用
- ElasticSearch的安装以及与springboot的集成
- 2022-2027年中国石榴石行业发展前景及投资战略咨询报告
- 彩虹网盘外链程序源码V5.1