过滤html标签的代码
public String html2Text(String inputString) {
String htmlStr = inputString; // 含html标签的字符串
String textStr = "" ;
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
String regEx_script = " <[\s]*?script[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?script[\s]*?> " ; // 定义script的正则表达式{或<script>]*?>[\s\S]*?<\/script> }
String regEx_style = " <[\s]*?style[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?style[\s]*?> " ; // 定义style的正则表达式{或<style>]*?>[\s\S]*?<\/style> }
String regEx_html = " <[^>]+> " ; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll( "" ); // 过滤script标签
p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll( "" ); // 过滤style标签
p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll( "" ); // 过滤html标签
textStr = htmlStr;
} catch (Exception e) {
System.err.println( " Html2Text: " + e.getMessage());
}
return textStr; // 返回文本字符串
}
过滤html标签的代码相关推荐
- php 实体转html,PHP 转HTML标签为实体, 把实体html标签转为,过滤html标签 | 学步园...
1.在开发由于我的需要千变万化.我们得根据需求做各种各样的事情.下面我我在开发中遇到的,HTML标签互转的,记录下来与君共享 实例: $str = preg_replace("//" ...
- php正则过滤html标签_空格_换行符的代码,php正则过滤html标签、空格、换行符的代码(附说明)_php技巧...
$str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/ $str=p ...
- php正则过滤html标签_空格_换行符的代码,PHP 正则过滤 html 标签、空格、换行符的代码 (文章格式化)...
$str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/ $str=p ...
- php过滤多空格_php正则过滤html标签、空格、换行符的代码(附说明)
$str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/ $str=p ...
- python文本筛选html_Python使用正则表达式去除(过滤)HTML标签提取文字功能
正则表达式是一个特殊的字符序列,可以帮助您使用模式中保留的专门语法来匹配或查找其他字符串或字符串集. 正则表达式在UNIX世界中被广泛使用. 下面给大家介绍下Python使用正则表达式去除(过滤)HT ...
- jq查找字段忽略html标签,jQuery过滤HTML标签并高亮显示关键字的方法
本文实例讲述了jQuery过滤HTML标签并高亮显示关键字的方法.分享给大家供大家参考.具体如下: jQuery实现网页关键字过滤效果,将需要过滤的文字定义在JavaScript中,可定义多个,不过要 ...
- python3 正则 去除 html标签、提取正文内容_Python通过正则表达式去除(过滤)HTML标签,提取文字...
# -*- coding: utf-8-*- import re ##过滤HTML中的标签 #将HTML中标签等信息去掉 #@param htmlstr HTML字符串. def filter_tag ...
- php正则过滤%3e,实用的替换或者过滤数据正则表达式php代码
实用的替换或者过滤数据正则表达式php代码 蓝叶 网站设计 2021-02-01 137 0评论 通过php代码来实现一些功能时或通过php代码来实现采集数据时,采集到的数据或 ...
- php过滤句尾空格,php正则过滤各种标签,空格,换行符的实现方法
这篇文章主要为大家详细介绍了php正则过滤各种标签,空格,换行符的实现方法,具有一定的参考价值,可以用来参考一下. 经测试代码如下: $str=preg_replace("/\s+/&quo ...
最新文章
- java string 内存写了_Java String的内存机制
- Docker 安装solr 配置IK分词,说明
- python使用redis有序集合_Redis 有序集合(sorted set)
- 小说和散文在写作语言(表达方式等)方面究竟有多大不同?
- [渝粤教育] 西南科技大学 信息法律法规 在线考试复习资料2021版
- java gui 字体颜色练习
- 超全汇总 | 基于Camera的3D目标检测算法综述!(单目/双目/伪激光雷达)
- C语言程序设计 题目抽签系统
- R语言使用sort函数对日期向量数据进行排序、默认从小到大升序排序、设置decreasing参数为真进行降序排序
- 若依ruoyi-vue总结
- 设计PCB螺旋线圈、电感线圈
- 【抓包工具】配置:Fiddler 配置手机/平板抓包 https
- linux循迹程序,基于ARM和Linux的路径记忆循迹小车
- 通过OpenCV识别QR二维码
- Python3-word文档操作(十):利用docx库创建word文档,添加段落,添加表格,添加图片,设置文字粗体,斜体
- ArchLinux 的 pacman 命令详解
- WordPress建站 新手入门
- 《动态壁纸 : 手机壁纸大全》用户协议
- 海格里斯带你认识立体库分类!立体仓库是如何分类的?
- 为什么过来人很多推荐出国读博?