前言

前段时间开发的过程需要对字符串匹配过滤操作,这就涉及到了正则表达的功能。这篇文章是个人对c++正则表达式程序库regex使用的笔记,如有不正确的地方欢迎指正。

Regex库简介

Regex是从c++ 11开始有的。

c++正则表达式提供了以下几个主要功能:

Math:将整个输入与正则表达式进行比对。

Search:查找是否与正则表达式匹配的子串。

Tokenize:根据正则表达式进行切分取得想要的目标子字符串。

Replace:替换与正则表达式匹配的子字符串(一个或多个)。

Regex库使用

匹配判断

首先先看一个简单的例子

#include

#include

int main(int argc, char *argv[])

{

try {

std::regex pattern("t_[^_]*_[^_]*_.*");

bool match = regex_match("t_123_345_456", pattern);

if (match) {

std::cout<< "match" <<:endl>

} else {

std::cout << "not match" << std::endl;

}

}

catch (const std::regex_error &e) {

std::cout << "regex_error: what(): " << e.what() << std::endl;

}

return 0;

}

代码执行结果:

match

下面来说下基本使用方法。首先声明一个正则表达式:

std::regex pattern("t_[^_]*_[^_]*_.*");

然后调用匹配方法:

regex_match("t_123_345_456", pattern);

如果有正则表达式有异常或匹配出现异常会抛出regex_error的异常,该异常派生自std::runtime_error.

regex支持多种正则表达式语法,包括:ECMAScript、basic(POSIX的BRE)、extended(POSIX的ERE)、awk、grep、egrep。默认使用的是ECMAScript。你也可以自己指定语法,如:

std::regex pattern("t_[^_]*_[^_]*_.*", std::regex_constants::grep);

获取匹配内容

如果你想获取匹配的内容则需要使用std::smatch,看下面一段代码:

#include

#include

int main(int argc, char *argv[])

{

try

{

std::regex pattern("t_[^_]*_[^_]*_.*");

std::smatch m;

bool match = regex_match(std::string("t_123_345_456"), m, pattern);

std::cout << "m.empty():" << m.empty() << std::endl;

std::cout << "m.size():" << m.size() << std::endl;

if (match) {

std::cout << "match" << std::endl;

std::cout << "m.str():" << m.str() << std::endl;

std::cout << "m.position():" << m.position() << std::endl;

std::cout << "m.length():" << m.length() << std::endl;

} else {

std::cout << "not match" << std::endl;

}

}

catch (const std::regex_error &e)

{

std::cout << "regex_error: what(): " << e.what() << std::endl;

}

return 0;

}

执行结果:

m.empty():0

m.size():1

match

m.str():t_123_345_456

m.position():0

m.length():13

regex_match会将匹配结果放到regex_match里,头文件里是这样定义的:

typedef match_results cmatch;

typedef match_results<:const_iterator> smatch;

可以看到头文件里声明了两个特例模板,一个是针对c-string,另一个是c+±string。因为我使用的是smatch,所以第二个例子里调用regex_match的时候第一个参数是构造了个string对象。

从程序执行结果来看,返回的是匹配整个字符串信息,包括匹配到的字符串、开始位置、长度等信息。

获取匹配的子串

如果我只想获取匹配的某个子字符串应该怎么处理呢。先看下面的例子:

#include

#include

int main(int argc, char *argv[])

{

try

{

std::regex pattern("t_([^_]*)_([^_]*)_(.*)");

std::smatch m;

bool match = regex_match(std::string("t_123_345_456"), m, pattern);

std::cout << "m.empty():" << m.empty() << std::endl;

std::cout << "m.size():" << m.size() << std::endl;

if (match) {

std::cout << "match" << std::endl;

std::cout << "m.str():" << m.str() << std::endl;

std::cout << "m.position():" << m.position() << std::endl;

std::cout << "m.length():" << m.length() << std::endl;

for (int i=0; i < m.size(); ++i) {

std::cout << " m[" << i << "].str():" << m[i].str() << std::endl;

std::cout << " m[" << i << "].position():" << m.position(i) << std::endl;

std::cout << " m[" << i << "].length():" << m.length(i) << std::endl;

}

} else {

std::cout << "not match" << std::endl;

}

}

catch (const std::regex_error &e)

{

std::cout << "regex_error: what(): " << e.what() << " code:" << e.code() << std::endl;

}

return 0;

}

程序执行输出:

m.empty():0

m.size():4

match

m.str():t_123_345_456

m.position():0

m.length():13

m[0].str():t_123_345_456

m[0].position():0

m[0].length():13

m[1].str():123

m[1].position():2

m[1].length():3

m[2].str():345

m[2].position():6

m[2].length():3

m[3].str():456

m[3].position():10

m[3].length():3

这里用到分组的概念,用()进行分组,需要哪部分将相应的规则用()包含起来。

代码里的正则表达式:

"t_([^_]*)_([^_]*)_(.*)"

我例子里是对三组数子感兴趣,所以正则表达式里会匹配到三个子串。

从结果可以看到smatch第一个元素是整个字符串的匹配信息,从第二个元素开始是你所需要的分组对应的子串。

巨坑

当我使用gcc-4.8.5对代码进行编译时,没有报错,但是当正则表达式里包含[]时在执行的时候会抛出异常:

code:4

what:regex_error

一直怀疑自己的正则表达式写错了,后来发现gcc-4.9.0以下版本虽然有regex头文件,但是GCC很不厚道的没有实现,语法完全支持,但是库还没跟上,所以编译的时候是没有问题的,但是一运行就会直接抛出异常。

花了好多时间安装升级到4.9.0后能够正常运行,就是上面例子的结果。坑了好久!

c++ 崩溃 正则表达式regex_C++正则表达式regex初探及踩的坑相关推荐

  1. 一款免费好用的正则表达式工具:Regex Match Tracer

    推荐分享:一款免费好用的正则表达式工具:Regex Match Tracer  v2.1.5  free version 下载地址:Regex Match Tracer

  2. 剑指 Offer 19. 正则表达式匹配 regex_match() regex()

    一. 题目: 剑指 Offer 19. 正则表达式匹配 请实现一个函数用来匹配包含'. '和''的正则表达式.模式中的字符'.'表示任意一个字符,而''表示它前面的字符可以出现任意次(含0次).在本题 ...

  3. python正则表达式_Python正则表达式简记和re库!

    正则表达式是定义搜索模式的字符序列.通常这种模式被字符串搜索算法用于字符串上的"查找"或"查找和替换"操作,或者用于输入验证. 1. 正则表达式的语法 . 表示 ...

  4. java正则表达式 ppt_Java正则表达式演示

    //正则表达式 regular expression regex //空白符有:' ','\t','\n','\n','\r','\h';'\s'等于[\t\n\r\f];'\S'=[^\t\n\r\ ...

  5. 【正则表达式】正则表达式引发的惨案 回溯 超时 cpu 100

    1.概述 转载:正则表达式引发的惨案 导读:正则表达式是程序员经常使用的工具之一.本文作者通过一个正则表达式的陷阱,先深入剖析了出现问题的原因,后给出怎么处理这类问题的方法.最后还给出了一些检测常见正 ...

  6. 正则表达式python_Python正则表达式

    正则表达式python We live in an information age where large volumes of data abound and the ability to extr ...

  7. java jui 正则表达式_正则表达式-Gorilla City-51CTO博客

    正则表达式,简称为regex,是文本模式的描述方法.例如,\d是一个正则表达式,表示一位数字字符,即任何一位0到9的数字. 使用步骤 python中所有正则表达式的函数都在re模块中. ▎python ...

  8. 正则表达式:JAVA正则表达式运用

    目录: 一.正则表达式简介 二.正则表达式符号的含义以及简单的例子 1.正则表达式符号含义 2.正则表达式符号对语言的支持 3.正则表达式一些特定的例子 3.1正则表达式应用--替换指定内容到行尾 3 ...

  9. 深入正则表达式(0):正则表达式概述

    正则表达式简介 正则表达式(regular expression,在代码中常简写为regex.regexp或RE),又称正规表示式.正規表示法.正規運算式.規則運算式.常規表示法,是计算机科学的一个概 ...

最新文章

  1. [umeditor] 多图片一次上传功能
  2. 在RichTextEditor组件中使用自定义右键。
  3. Java黑皮书课后题第5章:*5.14(计算最大公约数)下面是求两个整数n1和n2的最大公约数的程序清单5-9的另一种解法:...提示用户输入两个正整数,然后显示最大公约数
  4. 华为鸿蒙系统学习笔记4-方舟编译器源码下载及安装
  5. java 创建日程到期提醒_晓日程 微信日历加桌面日历,规划时间,掌握未来
  6. LeetCode简单题目(#172 #189 #190 #191 #198 #202)-6道(序列、数字)
  7. c语言数组元素前移后移,如何将一个数组的元素循环左移?
  8. XShell+XFtp无限制版本
  9. matlab 波形仿真,MATLAB仿真波形的处理
  10. 官方VM tools下载地址
  11. 计算机基础之二进制详解(二)
  12. linux运行mentohust,Linux中用mentohust设置联网环境
  13. 使用 Raspberry Pi 和 CUPS 设置打印服务器
  14. [Gym 102135][B - Freebie]2017-2018 8th BSUIR Open Programming Contest
  15. Word论文写作公式居中、编号右对齐设置
  16. 不是运算容错,而是高温降频率,软件劣化老硬件
  17. 生态系统名词解释笔记
  18. iOS - 技术储备列表
  19. java 控制台实现文本查看,行数可调,回车翻页
  20. html获取鼠标的当前位置

热门文章

  1. 高中信息技术教资科目三总结
  2. Android uiautomatorviewer无法启动
  3. 最好用的三款电脑端epub阅读器
  4. Tic-Tac-Toe:基于Minimax算法的人机对弈程序(python实现)
  5. python解非线性规划问题_Python+Gurobi+Pulp解决线性规划问题
  6. 如何将谷歌卫星地图转成80坐标并测量面积
  7. 如何把多个pdf文件合并成一个pdf
  8. 精选七条关于人工智能的经典语录
  9. 中国电信最快apn里面的服务器,电信4g网速最快的apn接入点(电信4g承载系统哪个快)...
  10. 利用ps制作油画风格的照片