利用正则表达式提取文章中的所有英文单词

1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象
Pattern pattern = Pattern.compile("[a-zA-Z]+");//“+”:表示可以有一对多
Pattern pattern = Pattern.compile("[0-9]+");//“+”:表示可以有一对多 1997

2.创建一个匹配器对象
//理解:就是matcher 匹配器pattern(模式/样式),到content文本中去匹配
//找到就返回true,否则就返回false
Matcher matcher = pattern.matcher(content);

3、开始循环匹配
while (matcher.find()){
//匹配内容,文本,放到m.group(0)
System.out.println(“找到:”+matcher.group(0));
}

 public static void main(String[] args){String content ="1995年,互联网的蓬勃发展给了Oak机会。业界为了使死板、" +"单调的静态网页能够“灵活”起来,急需一种软件技术来开发一种程序," +"这种程序可以通过网络传播并且能够跨平台运行。于是,世界各大IT企业为此纷纷投" +"入了大量的人力、物力和财力。这个时候," +"Sun公司想起了那个被搁置起来很久的Oak,并且重新审视了那个用软件编写的试验平台," +"由于它是按照嵌入式系统硬件平台体系结构进行编写的,所以非常小," +"特别适用于网络上的传输系统,而Oak也是一种精简的语言,程序非常小,适合在网络上传输。" +"Sun公司首先推出了可以嵌入网页并且可以随同网页在网络上传输的Applet(Applet是一种将" +"小程序嵌入到网页中进行执行的技术),并将Oak更名为Java(在申请注册商标时,发现Oak已" +"经被人使用了,再想了一系列名字之后,最终,使用了提议者在喝一杯Java咖啡时无意提到的" +"Java词语)。5月23日,Sun公司在Sun world会议上正式发布Java和HotJava浏览器。" +"IBM、Apple、DEC、Adobe、HP、Oracle、Netscape和微软等各大公司都纷纷停止了" +"自己的相关开发项目,竞相购买了Java使用许可证,并为自己的产品开发了相应的Java平台。";//提取文章中的所有英文单词//1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象Pattern pattern = Pattern.compile("[a-zA-Z]+");//“+”:表示可以有一对多// Pattern pattern = Pattern.compile("[0-9]+");//“+”:表示可以有一对多 1997//2.创建一个匹配器对象//理解:就是matcher 匹配器pattern(模式/样式),到content文本中去匹配//找到就返回true,否则就返回falseMatcher  matcher =  pattern.matcher(content);//3、开始循环匹配while (matcher.find()){//匹配内容,文本,放到m.group(0)System.out.println("找到:"+matcher.group(0));}}

结果:

01. 利用正则表达式提取文章中的所有英文单词相关推荐

  1. 利用正则表达式提取网页中Table内的数据

    利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...

  2. python从文件中提取特定文本_python利用正则表达式提取文本中特定内容

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...

  3. java利用正则表达式提取字符串中的整数和小数部分

    最近开发遇到一个新的东西,就是前端传过来一个字符串,需要将里面的数字提取出来,倒腾了一天,最后还是没有倒腾出来,最后还是借鉴大佬的方法.记录一下. 首先是前端传来的字符串"小明通过扫码向你付 ...

  4. qt中利用正则表达式提取字符串中的浮点数和整数

    当我们需要从一个字符串中提取数字时,可以用正则表达式来操作 QString str = "你的金额是: 0.22示范33^%zd卡兹克44是13.5x的5&ss"; QRe ...

  5. 使用正则表达式提取文件中满足条件的内容

    最近遇到需要处理一个很大文件的情况,需求是提取满足以`(ASCII 十进制 96)开头'结束的字符串,例如xxxxx`abcdedg'. 尝试在shell脚本中用正则表达式提取.有点曲折,后来通过py ...

  6. Python利用正则表达式提取var自定义变量的值

    目标解析HTML文件中的var自定义变量的值 本文主要利用正则表达式提取页面中的var $render_datab 变量的值,$render_datab变量的值是一个json字符串. 目录 1.导入依 ...

  7. 正则表达式提取markdown中图片链接(提取图片链接作为文章首图)

    网上搜使用正则表达式提取md中的图片链接作为文章首图 没找到好用的 只好自己写了一个 最大缺点 要自己去除括号 只能获取最后一个的url 以后有空再搞 let url = markdown.repla ...

  8. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  9. 如何利用python提取字符串中的数字

    目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...

最新文章

  1. windows 7架设OpenSSH服务器实践
  2. Leetcode动态规划 不同路径
  3. bzoj 1084 DP
  4. python读取html中body_python批量获取html内body内容的实例
  5. 信息学奥赛一本通(1405:质数的和与积)
  6. 腾讯云对象存储 python_GitHub - fushall1104/cos-python3-sdk: 腾讯云对象存储服务(cos)Python3.5版本SDK...
  7. 推荐95个极富创意的单页网站设计实例欣赏
  8. MFC1、动态创建CButton
  9. Maven学习(四)-----Maven中央存储库
  10. 刚刚,百度AI公布最新进展:Apollo2.0,新课程,设全球研究院
  11. 《『若水新闻』客户端开发教程》——16.添加广告
  12. 车间调度问题总结笔记一
  13. 计算机创新课堂教案,1 1.1计算机概述1.2计算机系统课堂教学教案
  14. python 卡方分布函数_推断统计分析(二):python验证三大抽样分布
  15. 前后端接口对接--根据关键字查询搜索
  16. 《一个人的朝圣》的读后感作文3100字
  17. python数据分析怎么画_跟小白学Python数据分析——绘制维恩图
  18. 用HBuilder插入图片、动态图、音乐、视频、上传文件
  19. Codeforces1324D Pair of Topics (思维 + 二分)
  20. 数据库查数据 索引

热门文章

  1. ARM Linux控制CDS5516
  2. 10.Report\1.SinglePinNetReport
  3. dns劫持 tplink_解决路由器DNS劫持的两种方法
  4. 手写数字识别--Android Studio 加载tensorflow模型
  5. openFeign夺命连环9问,这谁受得了?
  6. 设计模式连环炮-要做规范化产品线的老厂长!
  7. c语言switch不可以用枚举,76-枚举类型用在switch中
  8. 2014最佳开源教程
  9. RV32I基础整数指令集
  10. el-table纵向和横向都有滚动条的时候,右下角会出现白色方块区域