c++ 崩溃 正则表达式regex_C++正则表达式regex初探及踩的坑
前言
前段时间开发的过程需要对字符串匹配过滤操作,这就涉及到了正则表达的功能。这篇文章是个人对c++正则表达式程序库regex使用的笔记,如有不正确的地方欢迎指正。
Regex库简介
Regex是从c++ 11开始有的。
c++正则表达式提供了以下几个主要功能:
Math:将整个输入与正则表达式进行比对。
Search:查找是否与正则表达式匹配的子串。
Tokenize:根据正则表达式进行切分取得想要的目标子字符串。
Replace:替换与正则表达式匹配的子字符串(一个或多个)。
Regex库使用
匹配判断
首先先看一个简单的例子
#include
#include
int main(int argc, char *argv[])
{
try {
std::regex pattern("t_[^_]*_[^_]*_.*");
bool match = regex_match("t_123_345_456", pattern);
if (match) {
std::cout<< "match" <<:endl>
} else {
std::cout << "not match" << std::endl;
}
}
catch (const std::regex_error &e) {
std::cout << "regex_error: what(): " << e.what() << std::endl;
}
return 0;
}
代码执行结果:
match
下面来说下基本使用方法。首先声明一个正则表达式:
std::regex pattern("t_[^_]*_[^_]*_.*");
然后调用匹配方法:
regex_match("t_123_345_456", pattern);
如果有正则表达式有异常或匹配出现异常会抛出regex_error的异常,该异常派生自std::runtime_error.
regex支持多种正则表达式语法,包括:ECMAScript、basic(POSIX的BRE)、extended(POSIX的ERE)、awk、grep、egrep。默认使用的是ECMAScript。你也可以自己指定语法,如:
std::regex pattern("t_[^_]*_[^_]*_.*", std::regex_constants::grep);
获取匹配内容
如果你想获取匹配的内容则需要使用std::smatch,看下面一段代码:
#include
#include
int main(int argc, char *argv[])
{
try
{
std::regex pattern("t_[^_]*_[^_]*_.*");
std::smatch m;
bool match = regex_match(std::string("t_123_345_456"), m, pattern);
std::cout << "m.empty():" << m.empty() << std::endl;
std::cout << "m.size():" << m.size() << std::endl;
if (match) {
std::cout << "match" << std::endl;
std::cout << "m.str():" << m.str() << std::endl;
std::cout << "m.position():" << m.position() << std::endl;
std::cout << "m.length():" << m.length() << std::endl;
} else {
std::cout << "not match" << std::endl;
}
}
catch (const std::regex_error &e)
{
std::cout << "regex_error: what(): " << e.what() << std::endl;
}
return 0;
}
执行结果:
m.empty():0
m.size():1
match
m.str():t_123_345_456
m.position():0
m.length():13
regex_match会将匹配结果放到regex_match里,头文件里是这样定义的:
typedef match_results cmatch;
typedef match_results<:const_iterator> smatch;
可以看到头文件里声明了两个特例模板,一个是针对c-string,另一个是c+±string。因为我使用的是smatch,所以第二个例子里调用regex_match的时候第一个参数是构造了个string对象。
从程序执行结果来看,返回的是匹配整个字符串信息,包括匹配到的字符串、开始位置、长度等信息。
获取匹配的子串
如果我只想获取匹配的某个子字符串应该怎么处理呢。先看下面的例子:
#include
#include
int main(int argc, char *argv[])
{
try
{
std::regex pattern("t_([^_]*)_([^_]*)_(.*)");
std::smatch m;
bool match = regex_match(std::string("t_123_345_456"), m, pattern);
std::cout << "m.empty():" << m.empty() << std::endl;
std::cout << "m.size():" << m.size() << std::endl;
if (match) {
std::cout << "match" << std::endl;
std::cout << "m.str():" << m.str() << std::endl;
std::cout << "m.position():" << m.position() << std::endl;
std::cout << "m.length():" << m.length() << std::endl;
for (int i=0; i < m.size(); ++i) {
std::cout << " m[" << i << "].str():" << m[i].str() << std::endl;
std::cout << " m[" << i << "].position():" << m.position(i) << std::endl;
std::cout << " m[" << i << "].length():" << m.length(i) << std::endl;
}
} else {
std::cout << "not match" << std::endl;
}
}
catch (const std::regex_error &e)
{
std::cout << "regex_error: what(): " << e.what() << " code:" << e.code() << std::endl;
}
return 0;
}
程序执行输出:
m.empty():0
m.size():4
match
m.str():t_123_345_456
m.position():0
m.length():13
m[0].str():t_123_345_456
m[0].position():0
m[0].length():13
m[1].str():123
m[1].position():2
m[1].length():3
m[2].str():345
m[2].position():6
m[2].length():3
m[3].str():456
m[3].position():10
m[3].length():3
这里用到分组的概念,用()进行分组,需要哪部分将相应的规则用()包含起来。
代码里的正则表达式:
"t_([^_]*)_([^_]*)_(.*)"
我例子里是对三组数子感兴趣,所以正则表达式里会匹配到三个子串。
从结果可以看到smatch第一个元素是整个字符串的匹配信息,从第二个元素开始是你所需要的分组对应的子串。
巨坑
当我使用gcc-4.8.5对代码进行编译时,没有报错,但是当正则表达式里包含[]时在执行的时候会抛出异常:
code:4
what:regex_error
一直怀疑自己的正则表达式写错了,后来发现gcc-4.9.0以下版本虽然有regex头文件,但是GCC很不厚道的没有实现,语法完全支持,但是库还没跟上,所以编译的时候是没有问题的,但是一运行就会直接抛出异常。
花了好多时间安装升级到4.9.0后能够正常运行,就是上面例子的结果。坑了好久!
c++ 崩溃 正则表达式regex_C++正则表达式regex初探及踩的坑相关推荐
- 一款免费好用的正则表达式工具:Regex Match Tracer
推荐分享:一款免费好用的正则表达式工具:Regex Match Tracer v2.1.5 free version 下载地址:Regex Match Tracer
- 剑指 Offer 19. 正则表达式匹配 regex_match() regex()
一. 题目: 剑指 Offer 19. 正则表达式匹配 请实现一个函数用来匹配包含'. '和''的正则表达式.模式中的字符'.'表示任意一个字符,而''表示它前面的字符可以出现任意次(含0次).在本题 ...
- python正则表达式_Python正则表达式简记和re库!
正则表达式是定义搜索模式的字符序列.通常这种模式被字符串搜索算法用于字符串上的"查找"或"查找和替换"操作,或者用于输入验证. 1. 正则表达式的语法 . 表示 ...
- java正则表达式 ppt_Java正则表达式演示
//正则表达式 regular expression regex //空白符有:' ','\t','\n','\n','\r','\h';'\s'等于[\t\n\r\f];'\S'=[^\t\n\r\ ...
- 【正则表达式】正则表达式引发的惨案 回溯 超时 cpu 100
1.概述 转载:正则表达式引发的惨案 导读:正则表达式是程序员经常使用的工具之一.本文作者通过一个正则表达式的陷阱,先深入剖析了出现问题的原因,后给出怎么处理这类问题的方法.最后还给出了一些检测常见正 ...
- 正则表达式python_Python正则表达式
正则表达式python We live in an information age where large volumes of data abound and the ability to extr ...
- java jui 正则表达式_正则表达式-Gorilla City-51CTO博客
正则表达式,简称为regex,是文本模式的描述方法.例如,\d是一个正则表达式,表示一位数字字符,即任何一位0到9的数字. 使用步骤 python中所有正则表达式的函数都在re模块中. ▎python ...
- 正则表达式:JAVA正则表达式运用
目录: 一.正则表达式简介 二.正则表达式符号的含义以及简单的例子 1.正则表达式符号含义 2.正则表达式符号对语言的支持 3.正则表达式一些特定的例子 3.1正则表达式应用--替换指定内容到行尾 3 ...
- 深入正则表达式(0):正则表达式概述
正则表达式简介 正则表达式(regular expression,在代码中常简写为regex.regexp或RE),又称正规表示式.正規表示法.正規運算式.規則運算式.常規表示法,是计算机科学的一个概 ...
最新文章
- [umeditor] 多图片一次上传功能
- 在RichTextEditor组件中使用自定义右键。
- Java黑皮书课后题第5章:*5.14(计算最大公约数)下面是求两个整数n1和n2的最大公约数的程序清单5-9的另一种解法:...提示用户输入两个正整数,然后显示最大公约数
- 华为鸿蒙系统学习笔记4-方舟编译器源码下载及安装
- java 创建日程到期提醒_晓日程 微信日历加桌面日历,规划时间,掌握未来
- LeetCode简单题目(#172 #189 #190 #191 #198 #202)-6道(序列、数字)
- c语言数组元素前移后移,如何将一个数组的元素循环左移?
- XShell+XFtp无限制版本
- matlab 波形仿真,MATLAB仿真波形的处理
- 官方VM tools下载地址
- 计算机基础之二进制详解(二)
- linux运行mentohust,Linux中用mentohust设置联网环境
- 使用 Raspberry Pi 和 CUPS 设置打印服务器
- [Gym 102135][B - Freebie]2017-2018 8th BSUIR Open Programming Contest
- Word论文写作公式居中、编号右对齐设置
- 不是运算容错,而是高温降频率,软件劣化老硬件
- 生态系统名词解释笔记
- iOS - 技术储备列表
- java 控制台实现文本查看,行数可调,回车翻页
- html获取鼠标的当前位置
热门文章
- 高中信息技术教资科目三总结
- Android uiautomatorviewer无法启动
- 最好用的三款电脑端epub阅读器
- Tic-Tac-Toe:基于Minimax算法的人机对弈程序(python实现)
- python解非线性规划问题_Python+Gurobi+Pulp解决线性规划问题
- 如何将谷歌卫星地图转成80坐标并测量面积
- 如何把多个pdf文件合并成一个pdf
- 精选七条关于人工智能的经典语录
- 中国电信最快apn里面的服务器,电信4g网速最快的apn接入点(电信4g承载系统哪个快)...
- 利用ps制作油画风格的照片