fixHtmlTag

version 0.2

这个版本解决了上次遗留的问题,即就近闭合和嵌套闭合问题。具体可以看代码的注释。

/**

* fixHtmlTag

*

* HTML标签修复函数,此函数可以修复未正确闭合的 HTML 标签

*

* 由于不确定性因素太多,暂时提供两种模式“嵌套闭合模式”和

* “就近闭合模式”,应该够用了。

*

* 这两种模式是我为了解释清楚此函数的实现而创造的两个名词,

* 只需明白什么意思就行。

* 1,嵌套闭合模式,NEST,为默认的闭合方式。即 "

你好"

* 这样的 html 代码会被修改为 "

你好

"

* 2,就近闭合模式,CLOSE,这种模式会将形如 "

你好

为什么没有

* 闭合呢" 的代码修改为 "

你好

为什么没有闭合呢

"

*

* 在嵌套闭合模式(默认,无需特殊传参)下,可以传入需要就近闭合的

* 标签名,通过这种方式将类似 "

你好

我也好" 转换为

* "

你好

我也好

"的形式。

* 传参时索引需要按照如下方式写,不需要修改的设置可以省略

*

* $param = array(

* 'html' => '', //必填

* 'options' => array(

* 'tagArray' => array();

* 'type' => 'NEST',

* 'length' => null,

* 'lowerTag' => TRUE,

* 'XHtmlFix' => TRUE,

* )

* );

* fixHtmlTag($param);

*

* 上面索引对应的值含义如下

* string $html 需要修改的 html 代码

* array $tagArray 当为嵌套模式时,需要就近闭合的标签数组

* string $type 模式名,目前支持 NEST 和 CLOSE 两种模式,如果设置为 CLOSE,将会忽略参数 $tagArray 的设置,而全部就近闭合所有标签

* ini $length 如果希望截断一定长度,可以在此赋值,此长度指的是字符串长度

* bool $lowerTag 是否将代码中的标签全部转换为小写,默认为 TRUE

* bool $XHtmlFix 是否处理不符合 XHTML 规范的标签,即将
转换为

*

* @author IT不倒翁

* @version 0.2

* @link http://yungbo.com IT不倒翁

* @link http://enenba.com/?post=19 某某

* @param array $param 数组参数,需要赋予特定的索引

* @return string $result 经过处理后的 html 代码

* @since 2012-04-14

*/

function fixHtmlTag($param = array()) {

//参数的默认值

$html = '';

$tagArray = array();

$type = 'NEST';

$length = null;

$lowerTag = TRUE;

$XHtmlFix = TRUE;

//首先获取一维数组,即 $html 和 $options (如果提供了参数)

extract($param);

//如果存在 options,提取相关变量

if (isset($options)) {

extract($options);

}

$result = ''; //最终要返回的 html 代码

$tagStack = array(); //标签栈,用 array_push() 和 array_pop() 模拟实现

$contents = array(); //用来存放 html 标签

$len = 0; //字符串的初始长度

//设置闭合标记 $isClosed,默认为 TRUE, 如果需要就近闭合,成功匹配开始标签后其值为 false,成功闭合后为 true

$isClosed = true;

//将要处理的标签全部转为小写

$tagArray = array_map('strtolower', $tagArray);

//“合法”的单闭合标签

$singleTagArray = array(

'

'

'

'

'


'

'

);

//校验匹配模式 $type,默认为 NEST 模式

$type = strtoupper($type);

if (!in_array($type, array('NEST', 'CLOSE'))) {

$type = 'NEST';

}

//以一对 < 和 > 为分隔符,将原 html 标签和标签内的字符串放到数组中

$contents = preg_split("/(]+?>)/si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);

foreach ($contents as $tag) {

if ('' == trim($tag)) {

$result .= $tag;

continue;

}

//匹配标准的单闭合标签,如

if (preg_match("/]*?\/>/si", $tag)) {

$result .= $tag;

continue;

}

//匹配开始标签,如果是单标签则出栈

else if (preg_match("/]*?>/si", $tag, $match)) {

//如果上一个标签没有闭合,并且上一个标签属于就近闭合类型

//则闭合之,上一个标签出栈

//如果标签未闭合

if (false === $isClosed) {

//就近闭合模式,直接就近闭合所有的标签

if ('CLOSE' == $type) {

$result .= '' . end($tagStack) . '>';

array_pop($tagStack);

}

//默认的嵌套模式,就近闭合参数提供的标签

else {

if (in_array(end($tagStack), $tagArray)) {

$result .= '' . end($tagStack) . '>';

array_pop($tagStack);

}

}

}

//如果参数 $lowerTag 为 TRUE 则将标签名转为小写

$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];

$tag = str_replace('

//开始新的标签组合

$result .= $tag;

array_push($tagStack, $matchLower);

//如果属于约定的的单标签,则闭合之并出栈

foreach ($singleTagArray as $singleTag) {

if (stripos($tag, $singleTag) !== false) {

if ($XHtmlFix == TRUE) {

$tag = str_replace('>', ' />', $tag);

}

array_pop($tagStack);

}

}

//就近闭合模式,状态变为未闭合

if ('CLOSE' == $type) {

$isClosed = false;

}

//默认的嵌套模式,如果标签位于提供的 $tagArray 里,状态改为未闭合

else {

if (in_array($matchLower, $tagArray)) {

$isClosed = false;

}

}

unset($matchLower);

}

//匹配闭合标签,如果合适则出栈

else if (preg_match("/]*?>/si", $tag, $match)) {

//如果参数 $lowerTag 为 TRUE 则将标签名转为小写

$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];

if (end($tagStack) == $matchLower) {

$isClosed = true; //匹配完成,标签闭合

$tag = str_replace('' . $match[1], '' . $matchLower, $tag);

$result .= $tag;

array_pop($tagStack);

}

unset($matchLower);

}

//匹配注释,直接连接 $result

else if (preg_match("//si", $tag)) {

$result .= $tag;

}

//将字符串放入 $result ,顺便做下截断操作

else {

if (is_null($length) || $len + mb_strlen($tag) < $length) {

$result .= $tag;

$len += mb_strlen($tag);

} else {

$str = mb_substr($tag, 0, $length - $len + 1);

$result .= $str;

break;

}

}

}

//如果还有将栈内的未闭合的标签连接到 $result

while (!empty($tagStack)) {

$result .= '' . array_pop($tagStack) . '>';

}

return $result;

}

php html标签闭合,PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)相关推荐

  1. js正则匹配闭合标签_正则匹配闭合HTML标签(支持嵌套)

    OK,先确定我们要解决的问题--从一段Html文本中找出特定id的标签的innerHTML. 这里面最大的难点就是,Html标签是支持嵌套的,怎么能够找到指定标签相对应的闭合标签呢? 我们可以这样想, ...

  2. [Git高级教程 (一)] 通过 Tag 标签回退版本修复 bug

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 1 前言 本系列之所以取名"Git高级教程",主要是教大家解决实际工作中遇到的问 ...

  3. 正则匹配承兑的html,正则匹配闭合HTML标签(支持嵌套)

    原标题:正则匹配闭合HTML标签(支持嵌套) 任何复杂的正则表达式都是由简单的子表达式组成的,要想写出复杂的正则来,一方面需要有化繁为简的功底,另外一方面,我们需要从正则引擎的角度去思考问题.关于正则 ...

  4. [Git高级教程 (一)] 通过Tag标签回退版本修复bug

    1 前言 本系列之所以取名"Git高级教程",主要是教大家解决实际工作中遇到的问题,要求读者会基本的Git用法和命令,请不要使用SourceTree这样的工具,因为它让你啥都不会. ...

  5. 记一次steam修复未安装easy anti-cheat的经历

    steam修复未安装easy anti-cheat 今天在打开steam游戏时提示我,未安装easy anti-cheat 想着这两天什么也没动过,怎么就启动不了了 按照百度上的方法,试了几种办法 1 ...

  6. html 控制文字的标签,html里面有一个控制文字滚动的标签marquee,比较有用。

    简介这篇文章主要介绍了html里面有一个控制文字滚动的标签marquee,比较有用.以及相关的经验技巧,文章约3183字,浏览量161,点赞数4,值得参考! 本节笔者讲述HTML代码中比较特殊的标签, ...

  7. c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...

    1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...

  8. java th标签_初步认识Thymeleaf:简单表达式和标签。(一)

    本文只适用于不会Java对HTML语言有基础的程序员们,是浏览了各大博客后收集整理,重新编辑的一篇文章,希望能对大家有所帮助.最后本文如果有哪里写错的,希望各位大神们能够批评指正,谢谢大家! 对于Th ...

  9. flyme服务器未响应,魅族全智能手表更新:支持红包提醒 不再错过一个亿

    8月4日,魅族全智能手表发布Flyme for Watch 1.0.0.2A系统更新,大家可通过"手表设置-系统更新"即可接收升级. 新版固件新增支持手机端红包提醒.连接手机时可查 ...

最新文章

  1. 为什么不建议你用a.equals(b)判断对象相等
  2. 使用Memcached实现Session共享
  3. JVM(一):运行时数据区域
  4. 废弃电器电子产品回收:需要的不仅是补贴 !
  5. 基于php和服务器推技术的web即时聊天系统,基于php和服务器推技术的Web即时聊天系统...
  6. SVN 提交出错:Attempted to lock an already-locked dir
  7. webpack 3 零基础入门教程 #12 - 如何使用模块热替换 HMR 来处理 CSS
  8. Java基础入门笔记-字符串
  9. linux yum源码安装mysql_linux下通过源码包安装mysql,以及yum安装
  10. Windows中文编码显示问题集锦
  11. Qt容器类之三:通用算法
  12. iOS实例、类、元类
  13. CP Editor 编辑器(为竞赛而生的编辑器)的安装与配置
  14. Java 数组和List的使用
  15. 黑客30秒攻破苹果iOS系统夺得大赛冠军
  16. (附源码)spring boot网上购物系统 毕业设计 311236
  17. google Map API实现地址解析
  18. React innerHTML
  19. 2020数学建模参加后感想
  20. 各种游戏特效(持续更新)

热门文章

  1. 5G NR标准 第4章 LTE概述
  2. 剑三服务器维护后蹲宠刷新吗,剑三宠物开服刷新点合集 重置版除奇遇外宠物刷新点一览...
  3. SLAMTEC-思岚科技正式发布RPLIDAR A3
  4. 计算机启动突然断电,电脑启动运行过程主机突然断电怎么办
  5. python随机生成无序列表_python实现无序列表:链表
  6. raspberry pi_如何制作Raspberry Pi游戏手柄
  7. 自然语言处理(一)——文法(形式语言)基本概念
  8. Linux删除只读文件系统
  9. php调用lol数据库,计算lol战斗力
  10. 【§炫彩苹果win7主题§】