01. 利用正则表达式提取文章中的所有英文单词
利用正则表达式提取文章中的所有英文单词
1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象
Pattern pattern = Pattern.compile("[a-zA-Z]+");//“+”:表示可以有一对多
Pattern pattern = Pattern.compile("[0-9]+");//“+”:表示可以有一对多 1997
2.创建一个匹配器对象
//理解:就是matcher 匹配器pattern(模式/样式),到content文本中去匹配
//找到就返回true,否则就返回false
Matcher matcher = pattern.matcher(content);
3、开始循环匹配
while (matcher.find()){
//匹配内容,文本,放到m.group(0)
System.out.println(“找到:”+matcher.group(0));
}
public static void main(String[] args){String content ="1995年,互联网的蓬勃发展给了Oak机会。业界为了使死板、" +"单调的静态网页能够“灵活”起来,急需一种软件技术来开发一种程序," +"这种程序可以通过网络传播并且能够跨平台运行。于是,世界各大IT企业为此纷纷投" +"入了大量的人力、物力和财力。这个时候," +"Sun公司想起了那个被搁置起来很久的Oak,并且重新审视了那个用软件编写的试验平台," +"由于它是按照嵌入式系统硬件平台体系结构进行编写的,所以非常小," +"特别适用于网络上的传输系统,而Oak也是一种精简的语言,程序非常小,适合在网络上传输。" +"Sun公司首先推出了可以嵌入网页并且可以随同网页在网络上传输的Applet(Applet是一种将" +"小程序嵌入到网页中进行执行的技术),并将Oak更名为Java(在申请注册商标时,发现Oak已" +"经被人使用了,再想了一系列名字之后,最终,使用了提议者在喝一杯Java咖啡时无意提到的" +"Java词语)。5月23日,Sun公司在Sun world会议上正式发布Java和HotJava浏览器。" +"IBM、Apple、DEC、Adobe、HP、Oracle、Netscape和微软等各大公司都纷纷停止了" +"自己的相关开发项目,竞相购买了Java使用许可证,并为自己的产品开发了相应的Java平台。";//提取文章中的所有英文单词//1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象Pattern pattern = Pattern.compile("[a-zA-Z]+");//“+”:表示可以有一对多// Pattern pattern = Pattern.compile("[0-9]+");//“+”:表示可以有一对多 1997//2.创建一个匹配器对象//理解:就是matcher 匹配器pattern(模式/样式),到content文本中去匹配//找到就返回true,否则就返回falseMatcher matcher = pattern.matcher(content);//3、开始循环匹配while (matcher.find()){//匹配内容,文本,放到m.group(0)System.out.println("找到:"+matcher.group(0));}}
结果:
01. 利用正则表达式提取文章中的所有英文单词相关推荐
- 利用正则表达式提取网页中Table内的数据
利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...
- python从文件中提取特定文本_python利用正则表达式提取文本中特定内容
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
- java利用正则表达式提取字符串中的整数和小数部分
最近开发遇到一个新的东西,就是前端传过来一个字符串,需要将里面的数字提取出来,倒腾了一天,最后还是没有倒腾出来,最后还是借鉴大佬的方法.记录一下. 首先是前端传来的字符串"小明通过扫码向你付 ...
- qt中利用正则表达式提取字符串中的浮点数和整数
当我们需要从一个字符串中提取数字时,可以用正则表达式来操作 QString str = "你的金额是: 0.22示范33^%zd卡兹克44是13.5x的5&ss"; QRe ...
- 使用正则表达式提取文件中满足条件的内容
最近遇到需要处理一个很大文件的情况,需求是提取满足以`(ASCII 十进制 96)开头'结束的字符串,例如xxxxx`abcdedg'. 尝试在shell脚本中用正则表达式提取.有点曲折,后来通过py ...
- Python利用正则表达式提取var自定义变量的值
目标解析HTML文件中的var自定义变量的值 本文主要利用正则表达式提取页面中的var $render_datab 变量的值,$render_datab变量的值是一个json字符串. 目录 1.导入依 ...
- 正则表达式提取markdown中图片链接(提取图片链接作为文章首图)
网上搜使用正则表达式提取md中的图片链接作为文章首图 没找到好用的 只好自己写了一个 最大缺点 要自己去除括号 只能获取最后一个的url 以后有空再搞 let url = markdown.repla ...
- python 替换array中的值_利用Python提取视频中的字幕(文字识别)
我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...
- 如何利用python提取字符串中的数字
目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...
最新文章
- windows 7架设OpenSSH服务器实践
- Leetcode动态规划 不同路径
- bzoj 1084 DP
- python读取html中body_python批量获取html内body内容的实例
- 信息学奥赛一本通(1405:质数的和与积)
- 腾讯云对象存储 python_GitHub - fushall1104/cos-python3-sdk: 腾讯云对象存储服务(cos)Python3.5版本SDK...
- 推荐95个极富创意的单页网站设计实例欣赏
- MFC1、动态创建CButton
- Maven学习(四)-----Maven中央存储库
- 刚刚,百度AI公布最新进展:Apollo2.0,新课程,设全球研究院
- 《『若水新闻』客户端开发教程》——16.添加广告
- 车间调度问题总结笔记一
- 计算机创新课堂教案,1 1.1计算机概述1.2计算机系统课堂教学教案
- python 卡方分布函数_推断统计分析(二):python验证三大抽样分布
- 前后端接口对接--根据关键字查询搜索
- 《一个人的朝圣》的读后感作文3100字
- python数据分析怎么画_跟小白学Python数据分析——绘制维恩图
- 用HBuilder插入图片、动态图、音乐、视频、上传文件
- Codeforces1324D Pair of Topics (思维 + 二分)
- 数据库查数据 索引