Java过滤HTML标签、属性等正则表达式汇总

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
$str =preg_replace( "/\s+/" " " $str );  //过滤多余回车
$str =preg_replace( "/<[ ]+/si" , "<" , $str );  //过滤<__("<"号后面带空格)
   
$str =preg_replace( "/<\!--.*?-->/si" , "" , $str );  //注释
$str =preg_replace( "/<(\!.*?)>/si" , "" , $str );  //过滤DOCTYPE
$str =preg_replace( "/<(\/?html.*?)>/si" , "" , $str );  //过滤html标签
$str =preg_replace( "/<(\/?head.*?)>/si" , "" , $str );  //过滤head标签
$str =preg_replace( "/<(\/?meta.*?)>/si" , "" , $str );  //过滤meta标签
$str =preg_replace( "/<(\/?body.*?)>/si" , "" , $str );  //过滤body标签
$str =preg_replace( "/<(\/?link.*?)>/si" , "" , $str );  //过滤link标签
$str =preg_replace( "/<(\/?form.*?)>/si" , "" , $str );  //过滤form标签
$str =preg_replace( "/cookie/si" , "COOKIE" , $str );  //过滤COOKIE标签
   
$str =preg_replace( "/<(applet.*?)>(.*?)<(\/applet.*?)>/si" , "" , $str );  //过滤applet标签
$str =preg_replace( "/<(\/?applet.*?)>/si" , "" , $str );  //过滤applet标签
   
$str =preg_replace( "/<(style.*?)>(.*?)<(\/style.*?)>/si" , "" , $str );  //过滤style标签
$str =preg_replace( "/<(\/?style.*?)>/si" , "" , $str );  //过滤style标签
   
$str =preg_replace( "/<(title.*?)>(.*?)<(\/title.*?)>/si" , "" , $str );  //过滤title标签
$str =preg_replace( "/<(\/?title.*?)>/si" , "" , $str );  //过滤title标签
   
$str =preg_replace( "/<(object.*?)>(.*?)<(\/object.*?)>/si" , "" , $str );  //过滤object标签
$str =preg_replace( "/<(\/?objec.*?)>/si" , "" , $str );  //过滤object标签
   
$str =preg_replace( "/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si" , "" , $str );  //过滤noframes标签
$str =preg_replace( "/<(\/?noframes.*?)>/si" , "" , $str );  //过滤noframes标签
   
$str =preg_replace( "/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si" , "" , $str );  //过滤frame标签
$str =preg_replace( "/<(\/?i?frame.*?)>/si" , "" , $str );  //过滤frame标签
   
$str =preg_replace( "/<(script.*?)>(.*?)<(\/script.*?)>/si" , "" , $str );  //过滤script标签
$str =preg_replace( "/<(\/?script.*?)>/si" , "" , $str );  //过滤script标签
$str =preg_replace( "/javascript/si" , "Javascript" , $str );  //过滤script标签
$str =preg_replace( "/vbscript/si" , "Vbscript" , $str );  //过滤script标签
$str =preg_replace( "/on([a-z]+)\s*=/si" , "On\\1=" , $str );  //过滤script标签
$str =preg_replace( "/&#/si" , "&#" , $str );  //过滤script标签,如javAsCript:alert(

清除空格,换行

1
2
3
4
5
6
7
8
9
10
11
function  DeleteHtml( $str )
{
$str  = trim( $str );
$str  strip_tags ( $str , "" );
$str  ereg_replace ( "\t" , "" , $str );
$str  ereg_replace ( "\r\n" , "" , $str );
$str  ereg_replace ( "\r" , "" , $str );
$str  ereg_replace ( "\n" , "" , $str );
$str  ereg_replace ( " " , " " , $str );
return  trim( $str );
}

过滤HTML属性

1,过滤所有html标签的正则表达式:

1
2
3
4
5
</?[^>]+>
  
//过滤所有html标签的属性的正则表达式:
  
$html  = preg_replace( "/<([a-zA-Z]+)[^>]*>/" , "<\\1>" , $html );

  

Java过滤HTML标签、属性等正则表达式汇总相关推荐

  1. java过滤html标签获取纯文本信息

    转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...

  2. Java过滤HTML标签工具类

    过滤HTML标签能有效的放置XSS攻击. 封装: import org.slf4j.Logger; import org.slf4j.LoggerFactory;import org.springfr ...

  3. HTML5 Audio/Video 标签,属性,方法,事件汇总 (转)

    2019独角兽企业重金招聘Python工程师标准>>> <audio> 标签属性:src:音乐的URLpreload:预加载autoplay:自动播放loop:循环播放c ...

  4. java 去除html标签属性_[Java]去除html中的标签或者元素属性(正则表达式)

    @RequestMapping(value = "/details", method =RequestMethod.GET) @ResponseBody @ApiOperation ...

  5. php语句过滤掉html标签_php过滤HTML标签、属性等正则表达式

    php过滤HTML标签.属性等正则表达式 本文是百分网小编搜索整理的使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,感兴趣的朋友一起学习吧!!想了解更多相关信息请持续关注我 ...

  6. 过滤HTML标签java工具类

    废话不说,直接上码: package test; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p ...

  7. 使用正则过滤掉html标签,正则表达式过滤html标签

    正则表达式如何过滤HTML标签中的属性值 去掉html标签: str.replace(//g,"") 去掉标签里面的属性: str.replace(//g,"" ...

  8. python3 正则 去除 html标签、提取正文内容_Python通过正则表达式去除(过滤)HTML标签,提取文字...

    # -*- coding: utf-8-*- import re ##过滤HTML中的标签 #将HTML中标签等信息去掉 #@param htmlstr HTML字符串. def filter_tag ...

  9. html标签默认值,HTML标签CSS属性默认值汇总

    HTML标签CSS属性默认值,在你需要还原默认值的时候比较有用. 以前一直在找这份文档,今天偶然在网上看到了.除了inline和block的定义,主要是要注意body|h1~h6|blockquote ...

最新文章

  1. 2022-2028年中国钢筘行业市场研究及前瞻分析报告
  2. 如何为机器视觉系统选择合适的图像采集卡
  3. 学习shell脚本之乘法口诀
  4. RMAN 不完全恢复
  5. ​5G行业应用成熟度洞察,哪些场景将率先起飞?|新基建技术洞察之
  6. 用于zsh的高亮插件 zsh-syntax-highlighting
  7. ModuleNotFoundError: No module named ‘apt_pkg‘
  8. 双稳态电路的两个稳定状态是什么_从双稳态到双“更”稳态 ——叶芳伟课题组在拓扑光子学研究方向上取得新进展...
  9. opencv12-图像金字塔
  10. ONNX系列一 --- 带有ONNX的便携式神经网络
  11. [Flex] ButtonBar系列——垂直布局
  12. 关于程序猿的六个问答题
  13. 模拟电子技术入门书籍教材“宝典”推荐
  14. comsol 超声声场模拟_Comsol Multiphysics 声场仿真模块整体介绍
  15. iOS远程真机之iTunes与iPhone的通信协议usbmuxd解析
  16. 用c语言编程英雄联盟,用C语言编写购置英雄联盟中的物品的过程
  17. DBA组件---ADO数据库编程利器
  18. 《机器学习》第四章 人工神经网络 深度学习启蒙篇
  19. 火狐浏览器页面里有iframe框架时,当开发者后台修改了css样式,火狐浏览器不能及时响应问题
  20. BIEE Hello World式的例子

热门文章

  1. 在西电四年的小结和对小型机器人制作的总结(上)
  2. Python使用K-means聚类分析
  3. 【凸优化学习笔记1】什么是优化、优化的数学表达形式、优化问题的分类
  4. 1月12号-课堂讲义和代码
  5. 如何彻底卸载系统自带的IE浏览器
  6. App案例实践:一款好用的UI自动化测试工具——Katalon
  7. 一次buge寻找过程
  8. daemon tools ultra 6虚拟光驱软件
  9. 计算机硬盘管理 3t,3T硬盘的使用方法总结与分享
  10. setuptools打包安装工具的使用