Java过滤HTML标签、属性等正则表达式汇总
Java过滤HTML标签、属性等正则表达式汇总
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
$str =preg_replace( "/\s+/" , " " , $str ); //过滤多余回车
$str =preg_replace( "/<[ ]+/si" , "<" , $str ); //过滤<__("<"号后面带空格)
$str =preg_replace( "/<\!--.*?-->/si" , "" , $str ); //注释
$str =preg_replace( "/<(\!.*?)>/si" , "" , $str ); //过滤DOCTYPE
$str =preg_replace( "/<(\/?html.*?)>/si" , "" , $str ); //过滤html标签
$str =preg_replace( "/<(\/?head.*?)>/si" , "" , $str ); //过滤head标签
$str =preg_replace( "/<(\/?meta.*?)>/si" , "" , $str ); //过滤meta标签
$str =preg_replace( "/<(\/?body.*?)>/si" , "" , $str ); //过滤body标签
$str =preg_replace( "/<(\/?link.*?)>/si" , "" , $str ); //过滤link标签
$str =preg_replace( "/<(\/?form.*?)>/si" , "" , $str ); //过滤form标签
$str =preg_replace( "/cookie/si" , "COOKIE" , $str ); //过滤COOKIE标签
$str =preg_replace( "/<(applet.*?)>(.*?)<(\/applet.*?)>/si" , "" , $str ); //过滤applet标签
$str =preg_replace( "/<(\/?applet.*?)>/si" , "" , $str ); //过滤applet标签
$str =preg_replace( "/<(style.*?)>(.*?)<(\/style.*?)>/si" , "" , $str ); //过滤style标签
$str =preg_replace( "/<(\/?style.*?)>/si" , "" , $str ); //过滤style标签
$str =preg_replace( "/<(title.*?)>(.*?)<(\/title.*?)>/si" , "" , $str ); //过滤title标签
$str =preg_replace( "/<(\/?title.*?)>/si" , "" , $str ); //过滤title标签
$str =preg_replace( "/<(object.*?)>(.*?)<(\/object.*?)>/si" , "" , $str ); //过滤object标签
$str =preg_replace( "/<(\/?objec.*?)>/si" , "" , $str ); //过滤object标签
$str =preg_replace( "/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si" , "" , $str ); //过滤noframes标签
$str =preg_replace( "/<(\/?noframes.*?)>/si" , "" , $str ); //过滤noframes标签
$str =preg_replace( "/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si" , "" , $str ); //过滤frame标签
$str =preg_replace( "/<(\/?i?frame.*?)>/si" , "" , $str ); //过滤frame标签
$str =preg_replace( "/<(script.*?)>(.*?)<(\/script.*?)>/si" , "" , $str ); //过滤script标签
$str =preg_replace( "/<(\/?script.*?)>/si" , "" , $str ); //过滤script标签
$str =preg_replace( "/javascript/si" , "Javascript" , $str ); //过滤script标签
$str =preg_replace( "/vbscript/si" , "Vbscript" , $str ); //过滤script标签
$str =preg_replace( "/on([a-z]+)\s*=/si" , "On\\1=" , $str ); //过滤script标签
$str =preg_replace( "/&#/si" , "&#" , $str ); //过滤script标签,如javAsCript:alert(
|
清除空格,换行
1
2
3
4
5
6
7
8
9
10
11
|
function DeleteHtml( $str )
{
$str = trim( $str );
$str = strip_tags ( $str , "" );
$str = ereg_replace ( "\t" , "" , $str );
$str = ereg_replace ( "\r\n" , "" , $str );
$str = ereg_replace ( "\r" , "" , $str );
$str = ereg_replace ( "\n" , "" , $str );
$str = ereg_replace ( " " , " " , $str );
return trim( $str );
}
|
过滤HTML属性
1,过滤所有html标签的正则表达式:
1
2
3
4
5
|
</?[^>]+>
//过滤所有html标签的属性的正则表达式:
$html = preg_replace( "/<([a-zA-Z]+)[^>]*>/" , "<\\1>" , $html );
|
Java过滤HTML标签、属性等正则表达式汇总相关推荐
- java过滤html标签获取纯文本信息
转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...
- Java过滤HTML标签工具类
过滤HTML标签能有效的放置XSS攻击. 封装: import org.slf4j.Logger; import org.slf4j.LoggerFactory;import org.springfr ...
- HTML5 Audio/Video 标签,属性,方法,事件汇总 (转)
2019独角兽企业重金招聘Python工程师标准>>> <audio> 标签属性:src:音乐的URLpreload:预加载autoplay:自动播放loop:循环播放c ...
- java 去除html标签属性_[Java]去除html中的标签或者元素属性(正则表达式)
@RequestMapping(value = "/details", method =RequestMethod.GET) @ResponseBody @ApiOperation ...
- php语句过滤掉html标签_php过滤HTML标签、属性等正则表达式
php过滤HTML标签.属性等正则表达式 本文是百分网小编搜索整理的使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,感兴趣的朋友一起学习吧!!想了解更多相关信息请持续关注我 ...
- 过滤HTML标签java工具类
废话不说,直接上码: package test; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p ...
- 使用正则过滤掉html标签,正则表达式过滤html标签
正则表达式如何过滤HTML标签中的属性值 去掉html标签: str.replace(//g,"") 去掉标签里面的属性: str.replace(//g,"" ...
- python3 正则 去除 html标签、提取正文内容_Python通过正则表达式去除(过滤)HTML标签,提取文字...
# -*- coding: utf-8-*- import re ##过滤HTML中的标签 #将HTML中标签等信息去掉 #@param htmlstr HTML字符串. def filter_tag ...
- html标签默认值,HTML标签CSS属性默认值汇总
HTML标签CSS属性默认值,在你需要还原默认值的时候比较有用. 以前一直在找这份文档,今天偶然在网上看到了.除了inline和block的定义,主要是要注意body|h1~h6|blockquote ...
最新文章
- 2022-2028年中国钢筘行业市场研究及前瞻分析报告
- 如何为机器视觉系统选择合适的图像采集卡
- 学习shell脚本之乘法口诀
- RMAN 不完全恢复
- ​5G行业应用成熟度洞察,哪些场景将率先起飞?|新基建技术洞察之
- 用于zsh的高亮插件 zsh-syntax-highlighting
- ModuleNotFoundError: No module named ‘apt_pkg‘
- 双稳态电路的两个稳定状态是什么_从双稳态到双“更”稳态 ——叶芳伟课题组在拓扑光子学研究方向上取得新进展...
- opencv12-图像金字塔
- ONNX系列一 --- 带有ONNX的便携式神经网络
- [Flex] ButtonBar系列——垂直布局
- 关于程序猿的六个问答题
- 模拟电子技术入门书籍教材“宝典”推荐
- comsol 超声声场模拟_Comsol Multiphysics 声场仿真模块整体介绍
- iOS远程真机之iTunes与iPhone的通信协议usbmuxd解析
- 用c语言编程英雄联盟,用C语言编写购置英雄联盟中的物品的过程
- DBA组件---ADO数据库编程利器
- 《机器学习》第四章 人工神经网络 深度学习启蒙篇
- 火狐浏览器页面里有iframe框架时,当开发者后台修改了css样式,火狐浏览器不能及时响应问题
- BIEE Hello World式的例子