最近,我收到了Packt出版的Anubhava Srivastava提供的免费书籍“ Java 9 Regular Expressions” 。 这本书是一个很好的教程,它向任何想学习正则表达式并从头开始的人介绍。 那些知道如何使用正则表达式的人可能仍然很有趣,以重申其知识并加深诸如零长度断言,反向引用之类的复杂特征。

在本文中,我将重点介绍特定于Java 9且在早期版本的JDK中不可用的正则表达式功能。 虽然没有很多。

Java 9正则表达式模块

Java 9中的JDK分为多个模块。 可以理所当然地期望为正则表达式处理包和类提供一个新模块。 其实没有。 模块java.base是默认模块,默认情况下所有其他模块都依赖该模块,因此,导出的包的类在Java应用程序中始终可用。 此模块导出正则表达式包java.util.regex 。 这使开发过程更加简单:如果我们想在代码中使用正则表达式,则无需显式地“要求”模块。 似乎正则表达式对于Java是如此重要,以至于它包含在基本模块中。

正则表达式类

java.util.regex包含这些类

  • MatchResult
  • Matcher
  • Pattern
  • PatternSyntaxException

更改API的唯一类是Matcher

类匹配器的变化

Matcher类添加了五个新方法。 其中四个是现有方法的重载版本。 这些是:

  • appendReplacement
  • appendTail​
  • replaceAll​
  • replaceFirst​
  • results​

前四个存在于较早的版本中,并且参数的类型仅发生变化(毕竟这就是重载的意思)。

appendReplacement / Tail

对于appendReplacementappendTail ,唯一的区别是该参数还可以是StringBuilder ,而不仅仅是StringBuffer 。 考虑到StringBuilder是Java 1.5中引入的,就像13年前一样,没有人可以说这是一个不明智的行为。

有趣的是,API JDK的当前在线版本如何记录StringBuilder参数的appendReplacement行为。 较旧的StringBuffer变量方法显式记录了替换字符串可能包含将由相应组替换的命名引用。 StringBuilder论据版本错过了这一点。 该文档似乎像复制/粘贴然后进行编辑。 文本将“ buffer”替换为“ builder”等,并删除记录命名参考功能的文本。

我使用Java 9 build160尝试了该功能,对于这两个方法版本,结果是相同的。 这并不奇怪,因为这两种方法的源代码是相同的,除了参数类型之外,在JDK中都是简单的复制/粘贴。

似乎可以使用

@Testpublic void testAppendReplacement() {Pattern p = Pattern.compile("cat(?<plural>z?s?)");//Pattern p = Pattern.compile("cat(z?s?)");Matcher m = p.matcher("one catz two cats in the yard");StringBuilder sb = new StringBuilder();while (m.find()) {m.appendReplacement(sb, "dog${plural}");//m.appendReplacement(sb, "dog$001");}m.appendTail(sb);String result = sb.toString();assertEquals("one dogz two dogs in the yard", result);}

注释行或每行上方的行。 但是,文档仅涉及编号参考。

replaceAll / First

这也是一种“旧的”方法,用一些新的字符串替换匹配的组。 旧版本和新版本之间的唯一区别是替换字符串的提供方式。 在老版本的字符串被赋予作为String调用方法之前计算。 在新版本中,字符串作为Function<MatchResult,String> 。 将为每个匹配结果调用此函数,并且可以动态计算替换字符串。

知道Function类是3年前才在Java 8中引入的,因此在正则表达式中对它的新使用可能有点破绽。 或者,也许……也许我们应该将其视为一个提示,即从现在开始十年,当Fuction类已经13岁时,我们仍将拥有Java 9?

让我们更深入地研究这两种方法。 (实际上只用于replaceAll因为replaceFirst相同,只不过它只替换第一个匹配的组。)当这种用法很有价值时,我尝试创建一些并非绝对复杂的示例。

第一个示例来自JDK文档:

@Testpublic void demoReplaceAllFunction() {Pattern pattern = Pattern.compile("dog");Matcher matcher = pattern.matcher("zzzdogzzzdogzzz");String result = matcher.replaceAll(mr -> mr.group().toUpperCase());assertEquals("zzzDOGzzzDOGzzz", result);}

它不太复杂,并显示了功能。 使用lambda表达式绝对足够。 我无法想象一种简单的方法将常量字符串文字“ dog”大写。 也许只写“ DOG”。 好吧,我只是在开玩笑。 但是实际上这个例子太简单了。 对于文档来说是可以的,更复杂的事情会使读者分心于所记录方法的功能。 确实:不要期望JavaDoc中的复杂示例更少。 它描述了如何使用API​​,而不是描述了为何以这种方式创建API。

但是现在我们现在将看一些更复杂的例子。 我们要在字符串中用数字1、2、3等替换#字符。 该字符串包含编号的项目,如果我们在该字符串中插入一个新项目,我们不想手动重新编号。 有时我们将两个项目组合在一起,在这种情况下,我们编写## ,然后只想跳过下一个#的序列号。 由于我们已经进行了单元测试,因此代码比我可以用语言更好地描述了功能:

@Testpublic void countSampleReplaceAllFunction() {AtomicInteger counter = new AtomicInteger(0);Pattern pattern = Pattern.compile("#+");Matcher matcher = pattern.matcher("# first item\n" +"# second item\n" +"## third and fourth\n" +"## item 5 and 6\n" +"# item 7");String result = matcher.replaceAll(mr -> "" + counter.addAndGet(mr.group().length()));assertEquals("1 first item\n" +"2 second item\n" +"4 third and fourth\n" +"6 item 5 and 6\n" +"7 item 7", result);}

传递给replaceAll的lambda表达式获取计数器并计算下一个值。 如果我们使用一个#那么如果我们使用两个,它将增加1,然后将其添加到计数器,依此类推。 因为lambda表达式不能在周围环境中更改变量的值(变量必须有效地为final),所以计数器不能为intInteger变量。 我们需要一个具有int值并且可以更改的对象。 即使我们不使用AtomicInteger的原子功能,它也是如此。

下一个示例更进一步,并进行了一些数学计算。 它将字符串中的任何浮点格式的数字替换为其正弦值。 这样,由于sin(pi)甚至与pi都不接近,因此它可以纠正我们的句子,此处无法精确表示。 它几乎接近零:

@Testpublic void calculateSampleReplaceAllFunction() {Pattern pattern = Pattern.compile("\\d+(?:\\.\\d+)?(?:[Ee][+-]?\\d{1,2})?");Matcher matcher = pattern.matcher("The sin(pi) is 3.1415926");String result = matcher.replaceAll(mr -> "" + (Math.sin(Double.parseDouble(mr.group()))));assertEquals("The sin(pi) is 5.3589793170057245E-8", result);}

我们还将对此计算进行一些操作,以演示列表中的最后一个方法,它是Matcher类中的一个全新方法。

流结果()

新方法results()返回匹配结果流。 更精确地说,它返回MatchResult对象的Stream 。 在下面的示例中,我们使用它从字符串中收集任何浮点格式的数字,并以逗号分隔打印其正弦值:

@Testpublic void resultsTest() {Pattern pattern = Pattern.compile("\\d+(?:\\.\\d+)?(?:[Ee][+-]?\\d{1,2})?");Matcher matcher = pattern.matcher("Pi is around 3.1415926 and not 3.2 even in Indiana");String result = String.join(",",matcher.results().map(mr -> "" + (Math.sin(Double.parseDouble(mr.group())))).collect(Collectors.toList()));assertEquals("5.3589793170057245E-8,-0.058374143427580086", result);}

摘要

Java 9 JDK中引入的新正则表达式方法与现有的方法没有本质上的区别。 它们整洁方便,在某些情况下可以简化编程。 在早期版本中没有没有引入的任何内容。 这只是Java缓慢而深思熟虑地对JDK进行此类更改的方式。 毕竟,这就是我们爱Java的原因,不是吗?

可以从以下要点中找到并下载IDE中的整个代码副本粘贴

翻译自: https://www.javacodegeeks.com/2017/08/new-regex-features-java-9.html

Java 9中的新Regex功能相关推荐

  1. java中regex_Java 9中的新Regex功能

    java中regex 最近,我收到了Packt出版的Anubhava Srivastava提供的免费书籍" Java 9 Regular Expressions" . 这本书是一个 ...

  2. Java 11中的新功能和API详解系列1

    Java 11中的新功能和API详解系列1 2018.9.27 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载. JDK 11在语言语法方面有一个小改动,增加了相当数量的新API,以及 ...

  3. 【译】使用示例带你提前了解 Java 9 中的新特性

    Java 作为 Android 的基础编程语言,每一次迭代也是备受安卓开发人员的关注.这不,Oracle 公司在今年即将发布 Java 9 正式版,一些新的特性和改进很是值得期待. 周末时间,拜读了国 ...

  4. java结束程序是什么语句,在Java程序中,每条功能执行语句的最后都必须用结束。...

    在Java程序中,每条功能执行语句的最后都必须用结束. 答: 分号 热继电器可以实现短路保护和过载保护 答:× 皮亚杰用表示通过作用或者操控物体和事件来发现其特点从而获取知识的人 答:建构者 品行包括 ...

  5. android pie_Android Pie中的新安全功能,以及为什么对它们感到兴奋

    android pie by Onur Tuna 通过Onur Tuna Android Pie中的新安全功能,以及为什么对它们感到兴奋 (The new security features in A ...

  6. java jdk12_JDK 12:Java 12中的新功能

    java jdk12 基于Java SE(标准版)12的Java开发套件12的生产版本现已发布. Oracle可以为Linux,Windows和MacOS提供JDK 12构建. [ Java JDK ...

  7. Java 9中的5个功能将改变您开发软件的方式(还有2个不会)

    有望在Java 9中发布的最令人兴奋的功能是什么? 不要对Java 9的相对沉默近来分散注意力.JDK提交者正在努力准备下一个版本,该版本预计将在2015年12月完成,而功能将在几个月后完成 .此后, ...

  8. Java 8中的新BigInteger方法

    对JDK 8中的新功能的关注理所当然地主要集中在新的语言功能和语法上. 但是,对库和API进行了一些不错的添加,在本文中,我介绍了BigInteger类中添加的四个新方法: longValueExac ...

  9. Java 8中的5个功能将改变您的编码方式

    Java 8在JVM和语言级别都包含了一些非常令人兴奋的功能. 虽然最初为该发行版设想的某些功能已扩大范围或已推出到第9版,但实际上有数十个新功能. 许多新添加的内容在编译器,JVM或帮助系统级别都进 ...

最新文章

  1. C语言实现,设计一个将所有奇数移动到偶数之前的算法
  2. 神经学家探寻:机器如何拥有意识!如何避免机器人伤害我们!
  3. Beetle在Tcp通讯中使用Protobuf
  4. 【133】常见问题解答
  5. Scala print语句格式打印
  6. ma5626如何进入web配置_如何给Dnsmasq提供一个Web配置界面?
  7. 《剑指offer》第九题(用两个栈实现队列)
  8. android studio 引入arr的问题
  9. linux rm命令详解
  10. oracle精确匹配时间,Oracle时间精确到时、分、秒处理方法
  11. 企业邮件系统的发展和变化
  12. 小程序学习笔记(6)-菜谱小程序的制作
  13. DELMIA软件物流仿真:带曲线转角输送带输送物料的仿真操作方法
  14. 【TypeScript系列教程13】String 字符串对象的基本使用
  15. Python问题:NotImplementedError: The confidence keyword argument is only available if OpenCV is install
  16. 高精度红外测温仪单片机开发
  17. check 和nocheck
  18. 用友开发者中心全新升级,YonBuilder移动开发入门指南
  19. 中国互联网微博生死局及商业价值分析
  20. 「Python入门」Python代码规范(风格)

热门文章

  1. 单点登录终极方案之 CAS 应用及原理
  2. 你喜欢什么样的课堂?
  3. 1-10 之间的整数相加,得到累加值大于 20 的当前数
  4. 优秀学生专栏——孙振涛
  5. 三大框架题目整合考试题(含详解)
  6. 斐波那契查找+思路分析
  7. java实现验证码3秒刷新一次
  8. java速学_5分钟快速入门Java,不看真的可惜了
  9. webpack打包器小结(1)
  10. IDEA集成maven流程图详细介绍