python自然语言处理--第一篇(匹配字符串)
#匹配字符串
#使用re模块实现正则表达式
import re
text_string = '正则表达式。又称规则表达式。计算机科学的一个概念。正则表达式通常被用来检索。替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如。在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。'
#regex='检索'
regex='概念'
p_string = text_string.split('。')
for line in p_string:if re.search(regex,line) is not None:print(line)
结果如下所示:
Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 17:00:18) [MSC v.1900 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>>
====================== RESTART: E:/Natural Language.py ======================
正则表达式通常被用来检索
>>>
====================== RESTART: E:/Natural Language.py ======================
计算机科学的一个概念
正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的
>>>
例2、匹配任意一个字符串
import re
text_string = '正则表达式。又称规则表达式。计算机科学的一个概念。机器学习。正则表达式通常被用来检索。替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如。在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。'
regex='机.'
p_string = text_string.split('。')
for line in p_string:if re.search(regex,line) is not None:print(line)
结果如下
>>>
====================== RESTART: E:/Natural Language.py ======================
计算机科学的一个概念
机器学习
>>>
例3、匹配起始和结尾字符串
import re
text_string = '正则表达式。又称规则表达式。计算机科学的一个概念。机器学习。正则表达式通常被用来检索。替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如。在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。'
regex='^正则表达式'
p_string = text_string.split('。')
for line in p_string:if re.search(regex,line) is not None:print(line)
结果如下:
>>>
====================== RESTART: E:/Natural Language.py ======================
正则表达式
正则表达式通常被用来检索
正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的
>>>
例4、使用中括号匹配多个字符串
import re
text_string = ['[重要的]今年第七号台风23日登陆广东东部沿海地区','上海发布车库销售监管通知:违规者暂停网签资格','[紧要的]中国对印度连发强硬信息,印度急切需要结束对峙']
regex='^\[[重紧]..\]'
for line in text_string:if re.search(regex,line) is not None:print(line)
结果如下:
>>>
====================== RESTART: E:/Natural Language.py ======================
[重要的]今年第七号台风23日登陆广东东部沿海地区
[紧要的]中国对印度连发强硬信息,印度急切需要结束对峙
>>>
python自然语言处理--第一篇(匹配字符串)相关推荐
- Python开发【第一篇】:目录
本系列博文改编自武沛齐老师的原创博文,主要包含 Python基础.前端开发.Web框架.缓存以及队列等内容 ,用于学习记录成长!!! Python开发[第一篇]:目录 Python开发[第二篇]:初 ...
- python协程详解_彻底搞懂python协程-第一篇(关键词1-4)
任何复杂的概念或系统都不是凭空出现的,我们完全可以找到它的演化历程,寻根究底终会发现,其都是在一系列并不那么复杂的简单组件上发展演化而来! by 落花僧 本文通过一系列关键概念,逐步递进理解协程. 0 ...
- python django开发工具_利用pyCharm编辑器创建Django项目开发环境-python开发工具第一篇...
[前置说明] 1.django环境与python对应关系: Django version Python versions 1.11 2.7, 3.4, 3.5, 3.6, 3.7 (added in ...
- python列表心得_Python学习心得(第一篇:字符串、列表等)
一.字符串的应用 1.复数表示:z=a+bj 实部为z.real, 虚数为z.imag.模为abs(z), 在交互模式中,最后一个打印出来的表示会赋值给变量_. 2.字符串写时候新起一行前行末尾要加 ...
- python 学习笔记第一篇---下载网页内所有图片
第一步:打开网址,进入开发者模式,选中 Network,选择 Img 然后刷新页面,静静等待页面加载 等待页面加载完成,你可以看到这边有很多图片的资源 随便点开一个图片选择 Headers 可以看到 ...
- Python自然语言处理 第一章 课后习题答案
前言:从今天开始正式学习自然语言处理,同时还有统计学习方法和机器学习.希望能够一直坚持下去. (以下答案非标准答案,如有错误请积极回复.谢谢理解.) 正文 在开始之前首先引入nltk和nltk.boo ...
- Python自然语言处理第一章 - 语言处理与Python
我的运行环境 python 3.5.2 nltk 3.2.1 nltk-data numpy:科学计算库 matplotlib:数据可视化的2D会图库 因为python.nltk版本不同,所以一些内容 ...
- Python笔记_第一篇_面向过程_第一部分_9.Ubuntu基础操作
第一部分 Ubuntu简介 Ubuntu(乌班图)是一个机遇Debian的以桌面应用为主的Linux操作系统,据说其名称来自非洲南部祖鲁语或科萨语的"Ubuntu"一词,意思是 ...
- 嵩天python笔记_第一篇python笔记
缩进: 它属于语法的一部分 体现代码之间的层次和所属关系,也是唯一的表示形式 一般用四个空格 注释: 单行注释:以 # 开头,其后内容为注释 多行注释:以=='''== (三个单引号),开头和结尾 中 ...
最新文章
- Mysql使用存储过程与函数进行批量插入数据
- 两个变量实现查找坏环c语言,C/C++编程笔记:C语言编程知识要点总结!大一C语言知识点(全)...
- php wmi,window_Win7系统中的wmi控件是什么?有什么用?, wmi控件是什么Windows - phpStudy...
- ssis 有条件拆分_SSIS条件拆分概述
- 10大国外IT网站(转)
- Java GC 原理
- eclipse导出war包放入服务器中
- 设计模式-------建造者模式(生成器模式)
- 数据结构之双向链表----Python
- java入门简单小项目_JAVA入门_java项目接入Mysql8.0
- 将Python对象转换成字典
- 键盘上所有特殊符号的英文读法
- html+css实现星系图
- openssl 1.0.2k-fips 升级到 openssl-3.0.3
- 淘宝美工设计需要掌握什么技能 ?小白如何快速学会美工设计?
- 引用bootstrap的两种方法
- Zookeeper 的基本使用
- 十二星座匹配对象_十二星座配对图片,十二星座情侣配对
- TYUT太原理工大学2022“mao gai”必背
- 关于架构、架构师和技术团队的一些事情
热门文章
- 计算机云同步,Cupcloud(电脑云同步软件)
- 怎么用计算机发出弹奏的声音,计算机发出刺耳的声音怎么了?[详细介绍]
- 知乎万人点赞推荐的五款APP,小众却实用,你用过其中几款
- java seqlist_java编程中SeqListString list=new SeqListString(number);需要符号?什么意思?...
- hyper linux v增强_Hyper-V增强会话模式 – 推酷
- python樱花武汉_武汉加油!武大本科生用Python敲出樱花绽放,满屏春天太浪漫
- JDK自带的jvisualvm在安装插件时报代无法连接Java VisualVM插件中心
- 【转载】《触不可及》影评——不要以善之名行凶
- 华为云隐私号码申请教程
- BotVS趋势交易策略-RSI