php html标签闭合,PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)
fixHtmlTag
version 0.2
这个版本解决了上次遗留的问题,即就近闭合和嵌套闭合问题。具体可以看代码的注释。
/**
* fixHtmlTag
*
* HTML标签修复函数,此函数可以修复未正确闭合的 HTML 标签
*
* 由于不确定性因素太多,暂时提供两种模式“嵌套闭合模式”和
* “就近闭合模式”,应该够用了。
*
* 这两种模式是我为了解释清楚此函数的实现而创造的两个名词,
* 只需明白什么意思就行。
* 1,嵌套闭合模式,NEST,为默认的闭合方式。即 "
* 这样的 html 代码会被修改为 "
"
* 2,就近闭合模式,CLOSE,这种模式会将形如 "
你好
为什么没有
* 闭合呢" 的代码修改为 "
你好
为什么没有闭合呢
"
*
* 在嵌套闭合模式(默认,无需特殊传参)下,可以传入需要就近闭合的
* 标签名,通过这种方式将类似 "
你好
我也好" 转换为
* "
你好
我也好
"的形式。
* 传参时索引需要按照如下方式写,不需要修改的设置可以省略
*
* $param = array(
* 'html' => '', //必填
* 'options' => array(
* 'tagArray' => array();
* 'type' => 'NEST',
* 'length' => null,
* 'lowerTag' => TRUE,
* 'XHtmlFix' => TRUE,
* )
* );
* fixHtmlTag($param);
*
* 上面索引对应的值含义如下
* string $html 需要修改的 html 代码
* array $tagArray 当为嵌套模式时,需要就近闭合的标签数组
* string $type 模式名,目前支持 NEST 和 CLOSE 两种模式,如果设置为 CLOSE,将会忽略参数 $tagArray 的设置,而全部就近闭合所有标签
* ini $length 如果希望截断一定长度,可以在此赋值,此长度指的是字符串长度
* bool $lowerTag 是否将代码中的标签全部转换为小写,默认为 TRUE
* bool $XHtmlFix 是否处理不符合 XHTML 规范的标签,即将
转换为
*
* @author IT不倒翁
* @version 0.2
* @link http://yungbo.com IT不倒翁
* @link http://enenba.com/?post=19 某某
* @param array $param 数组参数,需要赋予特定的索引
* @return string $result 经过处理后的 html 代码
* @since 2012-04-14
*/
function fixHtmlTag($param = array()) {
//参数的默认值
$html = '';
$tagArray = array();
$type = 'NEST';
$length = null;
$lowerTag = TRUE;
$XHtmlFix = TRUE;
//首先获取一维数组,即 $html 和 $options (如果提供了参数)
extract($param);
//如果存在 options,提取相关变量
if (isset($options)) {
extract($options);
}
$result = ''; //最终要返回的 html 代码
$tagStack = array(); //标签栈,用 array_push() 和 array_pop() 模拟实现
$contents = array(); //用来存放 html 标签
$len = 0; //字符串的初始长度
//设置闭合标记 $isClosed,默认为 TRUE, 如果需要就近闭合,成功匹配开始标签后其值为 false,成功闭合后为 true
$isClosed = true;
//将要处理的标签全部转为小写
$tagArray = array_map('strtolower', $tagArray);
//“合法”的单闭合标签
$singleTagArray = array(
'
'
'
'
'
'
'
);
//校验匹配模式 $type,默认为 NEST 模式
$type = strtoupper($type);
if (!in_array($type, array('NEST', 'CLOSE'))) {
$type = 'NEST';
}
//以一对 < 和 > 为分隔符,将原 html 标签和标签内的字符串放到数组中
$contents = preg_split("/(]+?>)/si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);
foreach ($contents as $tag) {
if ('' == trim($tag)) {
$result .= $tag;
continue;
}
//匹配标准的单闭合标签,如
if (preg_match("/]*?\/>/si", $tag)) {
$result .= $tag;
continue;
}
//匹配开始标签,如果是单标签则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {
//如果上一个标签没有闭合,并且上一个标签属于就近闭合类型
//则闭合之,上一个标签出栈
//如果标签未闭合
if (false === $isClosed) {
//就近闭合模式,直接就近闭合所有的标签
if ('CLOSE' == $type) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
//默认的嵌套模式,就近闭合参数提供的标签
else {
if (in_array(end($tagStack), $tagArray)) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
}
}
//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];
$tag = str_replace('
//开始新的标签组合
$result .= $tag;
array_push($tagStack, $matchLower);
//如果属于约定的的单标签,则闭合之并出栈
foreach ($singleTagArray as $singleTag) {
if (stripos($tag, $singleTag) !== false) {
if ($XHtmlFix == TRUE) {
$tag = str_replace('>', ' />', $tag);
}
array_pop($tagStack);
}
}
//就近闭合模式,状态变为未闭合
if ('CLOSE' == $type) {
$isClosed = false;
}
//默认的嵌套模式,如果标签位于提供的 $tagArray 里,状态改为未闭合
else {
if (in_array($matchLower, $tagArray)) {
$isClosed = false;
}
}
unset($matchLower);
}
//匹配闭合标签,如果合适则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {
//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];
if (end($tagStack) == $matchLower) {
$isClosed = true; //匹配完成,标签闭合
$tag = str_replace('' . $match[1], '' . $matchLower, $tag);
$result .= $tag;
array_pop($tagStack);
}
unset($matchLower);
}
//匹配注释,直接连接 $result
else if (preg_match("//si", $tag)) {
$result .= $tag;
}
//将字符串放入 $result ,顺便做下截断操作
else {
if (is_null($length) || $len + mb_strlen($tag) < $length) {
$result .= $tag;
$len += mb_strlen($tag);
} else {
$str = mb_substr($tag, 0, $length - $len + 1);
$result .= $str;
break;
}
}
}
//如果还有将栈内的未闭合的标签连接到 $result
while (!empty($tagStack)) {
$result .= '' . array_pop($tagStack) . '>';
}
return $result;
}
php html标签闭合,PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)相关推荐
- js正则匹配闭合标签_正则匹配闭合HTML标签(支持嵌套)
OK,先确定我们要解决的问题--从一段Html文本中找出特定id的标签的innerHTML. 这里面最大的难点就是,Html标签是支持嵌套的,怎么能够找到指定标签相对应的闭合标签呢? 我们可以这样想, ...
- [Git高级教程 (一)] 通过 Tag 标签回退版本修复 bug
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 1 前言 本系列之所以取名"Git高级教程",主要是教大家解决实际工作中遇到的问 ...
- 正则匹配承兑的html,正则匹配闭合HTML标签(支持嵌套)
原标题:正则匹配闭合HTML标签(支持嵌套) 任何复杂的正则表达式都是由简单的子表达式组成的,要想写出复杂的正则来,一方面需要有化繁为简的功底,另外一方面,我们需要从正则引擎的角度去思考问题.关于正则 ...
- [Git高级教程 (一)] 通过Tag标签回退版本修复bug
1 前言 本系列之所以取名"Git高级教程",主要是教大家解决实际工作中遇到的问题,要求读者会基本的Git用法和命令,请不要使用SourceTree这样的工具,因为它让你啥都不会. ...
- 记一次steam修复未安装easy anti-cheat的经历
steam修复未安装easy anti-cheat 今天在打开steam游戏时提示我,未安装easy anti-cheat 想着这两天什么也没动过,怎么就启动不了了 按照百度上的方法,试了几种办法 1 ...
- html 控制文字的标签,html里面有一个控制文字滚动的标签marquee,比较有用。
简介这篇文章主要介绍了html里面有一个控制文字滚动的标签marquee,比较有用.以及相关的经验技巧,文章约3183字,浏览量161,点赞数4,值得参考! 本节笔者讲述HTML代码中比较特殊的标签, ...
- c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...
1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...
- java th标签_初步认识Thymeleaf:简单表达式和标签。(一)
本文只适用于不会Java对HTML语言有基础的程序员们,是浏览了各大博客后收集整理,重新编辑的一篇文章,希望能对大家有所帮助.最后本文如果有哪里写错的,希望各位大神们能够批评指正,谢谢大家! 对于Th ...
- flyme服务器未响应,魅族全智能手表更新:支持红包提醒 不再错过一个亿
8月4日,魅族全智能手表发布Flyme for Watch 1.0.0.2A系统更新,大家可通过"手表设置-系统更新"即可接收升级. 新版固件新增支持手机端红包提醒.连接手机时可查 ...
最新文章
- 为什么不建议你用a.equals(b)判断对象相等
- 使用Memcached实现Session共享
- JVM(一):运行时数据区域
- 废弃电器电子产品回收:需要的不仅是补贴 !
- 基于php和服务器推技术的web即时聊天系统,基于php和服务器推技术的Web即时聊天系统...
- SVN 提交出错:Attempted to lock an already-locked dir
- webpack 3 零基础入门教程 #12 - 如何使用模块热替换 HMR 来处理 CSS
- Java基础入门笔记-字符串
- linux yum源码安装mysql_linux下通过源码包安装mysql,以及yum安装
- Windows中文编码显示问题集锦
- Qt容器类之三:通用算法
- iOS实例、类、元类
- CP Editor 编辑器(为竞赛而生的编辑器)的安装与配置
- Java 数组和List的使用
- 黑客30秒攻破苹果iOS系统夺得大赛冠军
- (附源码)spring boot网上购物系统 毕业设计 311236
- google Map API实现地址解析
- React innerHTML
- 2020数学建模参加后感想
- 各种游戏特效(持续更新)
热门文章
- 5G NR标准 第4章 LTE概述
- 剑三服务器维护后蹲宠刷新吗,剑三宠物开服刷新点合集 重置版除奇遇外宠物刷新点一览...
- SLAMTEC-思岚科技正式发布RPLIDAR A3
- 计算机启动突然断电,电脑启动运行过程主机突然断电怎么办
- python随机生成无序列表_python实现无序列表:链表
- raspberry pi_如何制作Raspberry Pi游戏手柄
- 自然语言处理(一)——文法(形式语言)基本概念
- Linux删除只读文件系统
- php调用lol数据库,计算lol战斗力
- 【§炫彩苹果win7主题§】