java 过滤script_Java过滤任意(script,html,style)标签符,返回纯文本--封装类
import java.util.regex.Pattern;
/**
* 过滤标签字符串,返回纯文本
*
*/
public class ChangePlainText {
public static void main(String[] args) {
String test="hi
hello~
";
String b=ChangePlainText.Html2Text(test);
System.out.println(b);
}
public static String Html2Text(String inputString) {
String htmlStr = inputString; // 含html标签的字符串
String textStr = "";
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
String regEx_script = "]*?>[\\s\\S]*?"; // 定义script的正则表达式{或
// }
String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; // 定义style的正则表达式{或
// }
String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(""); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(""); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(""); // 过滤html标签
textStr = htmlStr;
} catch (Exception e) {
System.err.println("Html2Text: " + e.getMessage());
}
return textStr;// 返回文本字符串
}
}
java 过滤script_Java过滤任意(script,html,style)标签符,返回纯文本--封装类相关推荐
- python爬取疫情信息html.xpath p标签_python xpath 如何过滤div中的script和style标签
爬取一个页面中的div,想获取div中的文字,我是这么写的: selector.xpath('//div[@class="text-con"]').xpath('string(.) ...
- .Net(C#)用正则表达式清除HTML标签(包括script和style),保留纯本文(UEdit中编写的内容上传到数据库)...
去官网下载,本Demo用的MVC模式 下载地址:http://ueditor.baidu.com/website/download.html 加入文件夹中的结构: 引入了函数公式的图标: @{View ...
- java 使用正则表达式过滤HTML中标签
/*** 去掉文本中的html标签** @param inputString* @return*/public static String html2Text(String inputString) ...
- java过滤html标签获取纯文本信息
转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...
- Java实现文件过滤
Java实现文件过滤的方法,比如我只想获得某个路径下.java文件 只需要实现FilenameFilter这个接口即可. 比如: private class FileFilter implements ...
- Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类
Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类 =========================== ©Copyright 蕃薯耀 2017年9月22日 http://fansh ...
- java jfm入门_image Java版*图像过滤入门示例及源码模拟绿坝过滤机制 - 下载 - 搜珍网...
Java版*图像过滤入门示例及源码-0.1.0 (模拟绿坝过滤机制)/image/dy.jpg Java版*图像过滤入门示例及源码-0.1.0 (模拟绿坝过滤机制)/image/dymh.jpg Ja ...
- Java 敏感词过滤(DFA有穷自动机)
Java 敏感词过滤 DFA有穷自动机 初始化敏感词 构建树 查询 完整代码如下 后记 初始化敏感词 使用set集合,可以查询数据库. /*** 初始化值* @return*/private stat ...
- java过滤函数,过滤函数 (Sun Java System Portal Server 7.2 管理指南)
过滤函数 过滤函数在"元数据"和"数据"阶段运行,以根据函数及其属性指定的具体条件来允许或拒绝资源.在 filter.conf 文件的"枚举" ...
- Java敏感词过滤、java关键词过滤工具包原理
原理:基于多叉树的查找. 第一步:把敏感词读入搜索多叉树中, 树结构: 第二步,对需过滤的句子进行逐字匹配: 比如句子:解放了全中国 1.记录起始位置start=0,读到了"解", ...
最新文章
- dataTable 表格组件刷新 问题记录
- 腾讯云轻量应用服务器 开放端口
- JSP内置对象-out
- 关于“如何破坏单例“我说了好几种方式,面试官却说:我其实随便问问,没想到你真会
- GraphPad Prism 9.0.2 for MacOS 2021最新完美版科研绘图统计软件 附安装使用教程
- python将csv一行保存一个txt_Python读写文件(csv、txt、excel)
- flask找不到css_Flask干货:访问数据库——Flask-SQLAlchemy初始化
- 魅族显示无法连接到服务器,魅族连接电脑无法识别怎么办_魅族手机usb无法连接电脑的解决方法...
- ActiveMQ持久订阅设置
- 原生javascript淡入淡出焦点图 + Jquery实现方法
- libevent源码深度剖析六
- android 睡眠与唤醒I
- jQuery插件之:对话框
- centos7 部署dzzoffice最新版详细教程
- DOS命令大全(存档自用)
- IDEA jclasslib插件安装
- 网站的LOGO尺寸大小参考
- host头攻击漏洞修复
- 7.awd不死马权限维持及变种
- Vux使用Swiper遇到的问题