php正则表达式详解

一、贪婪模式与非贪婪模式

贪婪模式:可以这样认为,就是在整个表达式匹配成功的前提下,尽可能多的匹配,也就是所谓的“贪婪”,通俗点讲,就是看到想要的,有多少就捡多少,除非再也没有想要的了。

非贪婪模式:可以这样认为,就是在整个表达式匹配成功的前提下,尽可能少的匹配,也就是所谓的“非贪婪”,通俗点讲,就是找到一个想要的捡起来就行了,至于还有没有没捡的就不管了。

什么叫贪婪,比如说要从字符串中

香肠月饼吃东西,本来 你只可以吃香肠,可是你贪心,于是就把第一个到最后一个里面的两个吃的取出来了,你想多吃点,非贪婪也就是 你不贪吃了,就只吃香肠。

我们来看看正则里面是怎么贪婪的:

[php] view plain copy

$str = '

香肠月饼';

preg_match('/

(.*)/',$str,$rs);

print_r($rs);

?>

这样输出的结果是:

[php] view plain copyArray ( [0] => 香肠月饼 [1] => 香肠月饼 )

怎么来限制贪婪?

在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配。

[php] view plain copy<?php

$str = '

香肠月饼';

preg_match('/

(.*?)/',$str,$rs);

print_r($rs);

?>

这样输出的结果是:

[php] view plain copyArray ( [0] => 香肠 [1] => 香肠 )

在PHP中还可以通过模式修饰符来实现,大写"U":

[php] view plain copy<?php

$str = '

香肠月饼';

preg_match('/

(.*)/U',$str,$rs);

print_r($rs);

?>

这样输出的结果是与上面一样的!

二、预搜索

预搜索是一个非获取匹配,不进行存储供以后使用。

1、正向预搜索  "(?=xxxxx)","(?!xxxxx)"

"(?=xxxxx)”:所在缝隙的右侧,必须能够匹配上 xxxxx 这部分的表达式,

[php] view plain copy<?php

$str = 'windows NT windows 2003 windows xp';

preg_match('/windows (?=xp)/',$str,$res);

print_r($res);

?>

结果:

[php] view plain copy

Array

(

[0] => windows

)

这个是xp前面的windows,不会取NT和2003前面的。

格式:"(?!xxxxx)",所在缝隙的右侧,必须不能匹配 xxxxx 这部分表达式

[php] view plain copy<?php

$str = 'windows NT windows 2003 windows xp';

preg_match_all('/windows (?!xp)/',$str,$res);

print_r($res);

?>

结果:

[php] view plain copyArray

(

[0] => Array

(

[0] => windows    这个是nt前面的

[1] => windows    这个是2003前面的

)

)

从这里可以看出,预搜索不进行存储供以后使用。与会存储的对比下。

[php] view plain copy<?php

$str = 'windows NT windows 2003 windows xp';

preg_match_all('/windows ([^xp])/',$str,$res);

print_r($res);

?>

结果:

[php] view plain copyArray

(

[0] => Array    全部模式匹配的数组

(

[0] => windows N

[1] => windows 2

)

[1] => Array   子模式所匹配的字符串组成的数组,通过存储取得。

(

[0] => N

[1] => 2

)

)

2、反向预搜索  "(?<=xxxxx)","(?

"(?<=xxxxx)" :所在缝隙的 "左侧”能够匹配xxxxx部分。

[php] view plain copy<?php

$str = '1234567890123456';

preg_match('/(?<=\d{4})\d+(?=\d{4})/',$str,$res);

print_r($res);

?>

结果:

[php] view plain copyArray

(

[0] => 56789012

)

匹配除了前4个数字和后4个数字之外的中间8个数字 "(?

[php] view plain copy<?php

$str = '我1234567890123456';

preg_match('/(?

print_r($res);

?>

结果:

[php] view plain copyArray

(

[0] => 234567890123456

)

@下面的例子其实主要讲了三个函数preg_replace();preg_match_all();preg_match()的基本用法。有兴趣的就看下吧!

例1:

我们把需要替换的放在parrerns数组里面,把换成后的数据放在replacement数组里面:

$string为一个字符串,定义$patterns为一个基于索引的数组:

函数讲解:preg_replace();mixedpreg_replace ( mixed$pattern ,mixed$replacement ,mixed$subject [,int$limit = -1[,int&$count ]] )

搜索subject中匹配pattern的部分, 以replacement进行替换。

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$string = 'kemo|addidas|就是这样的|haha|2013-12-13 09:00:09|weobo|lail';

$patterns = array();

$patterns[0] = '/2013-12-13 09:00:09/';

$patterns[1] = '/weobo/';

$patterns[2] = '/lail/';

$replacements = array();

$replacements[2] = date('Y-m-d H:i:s',time());

$replacements[1] = 'tengx';

$replacements[0] = 'buyao';

echo preg_replace($patterns, $replacements, $string);

?>

以上的例子会输出:

[php] view plain copykemo|addidas|就是这样的|haha|2013-12-14 11:40:43|tengx|buyao

以上例子我们可以把我们需要替换的值用索引数组的形式表达出来,然后一个一个的去替换,是不是很方便呢?

例2:

下面么再来看一个,我们需要把字符串里面的日期转当前的日期或者为我们需要的东西

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$string = 'kemo|addidas|就是这样的|haha|2013-12-13 09:00:09|weobo|lail';

$pattern = '/\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2}/';

$replacement = date('Y-m-d H:i:s',time());

echo preg_replace($pattern, $replacement, $string);

?>

以上的例子会输出:

[php] view plain copy

kemo|addidas|就是这样的|haha|2013-12-14 12:07:55|weobo|lail

字符串里面的日期被换成今天的日期了。例3:

正则表达式如何匹配出现第一次出现下划线以前的内容:

函数讲解:preg_match_all();intpreg_match_all (string $pattern ,string$subject [,array&$matches [,int$flags=PREG_PATTERN_ORDER [,int$offset = 0 ]]] )

搜索subject中所有匹配pattern给定正则表达式 的匹配结果并且将它们以flag指定顺序输出到matches中.

在第一个匹配找到后, 子序列继续从最后一次匹配位置搜索.

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$content="正则表达式如何匹配第一次出现下划线以前的内容_第二次_第三次_";

preg_match_all('/([^_]*?)_/i',$content, $matches);

if(count($matches[1])>0)

{

echo $matches[1][0];

}

var_dump($matches);

?>

以上的例子会输出:

[php] view plain copy正则表达式如何匹配第一次出现下划线以前的内容

上面的数组打印出来的结果为:

[php] view plain copyarray(2) { [0]=> array(3) { [0]=> string(45) "正则表达式如何匹配第一次出现下划线以前的内容_" [1]=> string(7) "第二次_" [2]=> string(7) "第三次_" } [1]=> array(3) { [0]=> string(44) "正则表达式如何匹配第一次出现下划线以前的内容" [1]=> string(6) "第二次" [2]=> string(6) "第三次" } }

例4:

函数讲解:preg_match()搜索subject与pattern给定的正则表达式的一个匹配.

preg_match()返回 pattern 的匹配次数。 它的值将是0次(不匹配)或1次,因为 preg_match()在第一次匹配后 将会停止搜索。 preg_match_all()不同于此,它会一直搜索subject 直到到达结尾。 如果发生错误 preg_match()返回 FALSE。

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$pattern="/\d{4}(\W)\d{2}\\1\d{2}\s+\d{2}(\W)\d{2}\\2\d{2}\s+(?:am|pm)/";   //正则表达式模式

$string="today is 2013/12/14 10:35:28 am...";      //需要和上面模式字符串进行匹配的变量字符串

if(preg_match($pattern, $string, $arr)){

echo "正则表达式 {$pattern} 和字符串 {$string} 匹配成功
";

echo '

';

print_r($arr);

echo '

';

}else{

echo "正则表达式{$pattern} 和字符串 {$string} 匹配失败";

}

?>

以上的例子会输出:

[php] view plain copy正则表达式 /\d{4}(\W)\d{2}\1\d{2}\s+\d{2}(\W)\d{2}\2\d{2}\s+(?:am|pm)/ 和字符串 today is 2013/12/14 10:35:28 am... 匹配成功

Array

(

[0] => 2013/12/14 10:35:28 am

[1] => /

[2] => :

)

匹配字符串里面的时间匹配成功。

例5:

匹配字符串中的url

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$str="这是一个正则表https://www.sina.com达式的匹配函数";

$url="/(https?|ftps?):\/\/((www|mail|news)\.([^\.\/]+)\.(com|org|net|cn))/i";

if(preg_match($url, $str, $arr)){

echo "字符串中有正确的URL信息
";

echo '

';

print_r($arr);

echo '

';

}else{

echo "字符串中不包括URL";

}

?>

以上的例子会输出:

[php] view plain copy字符串中有正确的URL信息

Array

(

[0] => https://www.sina.com

[1] => https

[2] => www.sina.com

[3] => www

[4] => sina

[5] => com

)

@其实我们也可以封装一个函数去完成匹配URL的功能:

[php] view plain copy<?php

date_default_timezone_set("Asia/Shanghai");

$str="这是一个正则表https://www.baidu.com达式的匹配函数

function setUrl($str) {

$url="/(https?|ftps?):\/\/((www|mail|news)\.([^\.\/]+)\.(com|org|net|cn))/i";

preg_match_all($url, $str, $arr,PREG_PATTERN_ORDER );

foreach($arr[0] as $url){

$str=str_replace($url, ''.$url.'', $str);

}

return  $str;

}

echo setUrl($str);

?>

以上的例子会输出

[php] view plain copy

这是一个正则表https://www.baidu.com达式的匹配函数

以上文章来源:http://blog.csdn.net/phpfenghuo/article/details/17316645

php中正则表达式详解,php正则表达式详解相关推荐

  1. c#中regex的命名空间_C#_详解C#正则表达式Regex常用匹配,使用Regex类需要引用命名空间 - phpStudy...

    详解C#正则表达式Regex常用匹配 使用Regex类需要引用命名空间:using System.Text.RegularExpressions; 一.利用Regex类实现验证 示例1:注释的代码所起 ...

  2. python中re模块的span,详解Python正则表达式re模块

    正则是处理字符串最常用的方法,我们编码中到处可见正则的身影. 正则大同小异,python 中的正则跟其他语言相比略有差异: 1.替换字符串时,替换的字符串可以是一个函数 2.split 函数可以指定分 ...

  3. 详解Python正则表达式之: (?Pname…) named group 带命名的组

    2019独角兽企业重金招聘Python工程师标准>>> Python 2.7的手册中的解释: (?P<name>...) Similar to regular paren ...

  4. python 正则表达式 断言 不定长表达式_【教程】详解Python正则表达式之: (?!…) negative lookahead assertion 前向否定匹配 /前向否定断言...

    Python 2.7的官网文档中的解释是:(?!...)Matches if ... doesn't match next. This is a negative lookahead assertio ...

  5. java正则表达式 匹配次数_正则表达式教程之重复匹配详解

    本文实例讲述了正则表达式教程之重复匹配.分享给大家供大家参考,具体如下: 注:在所有例子中正则表达式匹配结果包含在源文本中的[和]之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法 ...

  6. c++ regex 替换汉字_C++ - 正则表达式(regex) 替换(replace) 的 详解 及 代码

    正则表达式(regex) 替换(replace) 的 详解 及 代码 本文地址: http://blog.csdn.net/caroline_wendy/article/details/1732163 ...

  7. re匹配截至到第一个中文_Python正则表达式:re模块常用方法详解

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配.re 模块使 Python 语言拥有全部的正则表达式功能,re模块常用方法: re.match re.search r ...

  8. python正则表达式详解compile_python正则表达式详解

    前言正则表达式是一个特殊的字符序列,用来判断一个字符串与我们所设定的字符序列是否相匹配.实现快速检索文本和一些替换文本的操作. 在Python中我们有专门的正则表达式模块re,re 模块使 Pytho ...

  9. 【超详总结/理解:正则表达式】特点/元字符/正则表达式中的标志位-flag/RegExp/重复操作与后向引用/匹配模式/表达邮箱/正则表达式对象的方法/利用正则表达式限制网页表单里的文本框输入内容

    文章目录 正则表达式: 正则表达式的用途 正则表达式的组成-元字符 正则表达式的特点 正则表达式中的标志位-flag JavaScript中的正则表达式解析 RegExp 定义 RegExp RegE ...

最新文章

  1. 人大选博士的3个标准
  2. 实习的第一天——培训
  3. 删除A数据表中的一行数据时,不小心将表名写成了B,现在想恢复B中刚删除的的着一行数据怎么办...
  4. Time value help in webclient UI
  5. PHP 利用Mail_MimeDecode类提取邮件正文
  6. html json to table,javascript - HTML - Convert json to table - Stack Overflow
  7. Python程序打包exe文件(pyinstaller)
  8. OpenCV_Camera Calibration and Rectification under QT creator( 相机标定及矫正 | QT creator环境 )
  9. 数据库之战| 寻找你心中的数据库漫威英雄
  10. mysql sql文件分割_怎么将sql数据库文件分割
  11. 【2017年总结】--吾生也有涯,而知也无涯
  12. 2022年游戏出海行业研究报告
  13. 【unity 保卫星城】--- 开发笔记01(飞机移动)
  14. windows GDI+ 绘图的简单封装
  15. for_each 解读
  16. 竟然有人把VSCode玩成了IDEA的效果,有点东西
  17. 淘宝店铺买家订单+淘宝店铺买家订单物流获取步骤说明
  18. 彻底搞懂Netty高性能之零拷贝
  19. STM32F103程序设计-5-控制引脚高低电平的实现
  20. JavaScript中定义对象的几种方式

热门文章

  1. 编译原理-正则文法与正则表达式的相互转化
  2. MSP430G2553IPW28R 混合信号微处理器 封装:TSSOP28
  3. 【AGC】管理签名密钥相关问题
  4. 江苏图采上传已有证件照到草稿箱教程(bug标明)
  5. pytorch创建自己的Dataset加载数据集
  6. 校赛 问题 F: 传送门(Dijkstra算法)
  7. 75道程序员面试逻辑测试题(附答案)(2)
  8. 机器学习笔记-利用线性模型进行分类
  9. 看完你也能独立负责项目!产品经理做APP从头到尾的所有工作流程详解!
  10. python: 测量代码运行时间