import java.util.regex.Pattern;

/**

* 过滤标签字符串,返回纯文本

*

*/

public class ChangePlainText {

public static void main(String[] args) {

String test="hi

hello~

";

String b=ChangePlainText.Html2Text(test);

System.out.println(b);

}

public static String Html2Text(String inputString) {

String htmlStr = inputString; // 含html标签的字符串

String textStr = "";

java.util.regex.Pattern p_script;

java.util.regex.Matcher m_script;

java.util.regex.Pattern p_style;

java.util.regex.Matcher m_style;

java.util.regex.Pattern p_html;

java.util.regex.Matcher m_html;

try {

String regEx_script = "]*?>[\\s\\S]*?"; // 定义script的正则表达式{或

// }

String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; // 定义style的正则表达式{或

// }

String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式

p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);

m_script = p_script.matcher(htmlStr);

htmlStr = m_script.replaceAll(""); // 过滤script标签

p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);

m_style = p_style.matcher(htmlStr);

htmlStr = m_style.replaceAll(""); // 过滤style标签

p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);

m_html = p_html.matcher(htmlStr);

htmlStr = m_html.replaceAll(""); // 过滤html标签

textStr = htmlStr;

} catch (Exception e) {

System.err.println("Html2Text: " + e.getMessage());

}

return textStr;// 返回文本字符串

}

}

java 过滤script_Java过滤任意(script,html,style)标签符,返回纯文本--封装类相关推荐

  1. python爬取疫情信息html.xpath p标签_python xpath 如何过滤div中的script和style标签

    爬取一个页面中的div,想获取div中的文字,我是这么写的: selector.xpath('//div[@class="text-con"]').xpath('string(.) ...

  2. .Net(C#)用正则表达式清除HTML标签(包括script和style),保留纯本文(UEdit中编写的内容上传到数据库)...

    去官网下载,本Demo用的MVC模式 下载地址:http://ueditor.baidu.com/website/download.html 加入文件夹中的结构: 引入了函数公式的图标: @{View ...

  3. java 使用正则表达式过滤HTML中标签

    /*** 去掉文本中的html标签** @param inputString* @return*/public static String html2Text(String inputString) ...

  4. java过滤html标签获取纯文本信息

    转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...

  5. Java实现文件过滤

    Java实现文件过滤的方法,比如我只想获得某个路径下.java文件 只需要实现FilenameFilter这个接口即可. 比如: private class FileFilter implements ...

  6. Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类

    Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类 =========================== ©Copyright 蕃薯耀 2017年9月22日 http://fansh ...

  7. java jfm入门_image Java版*图像过滤入门示例及源码模拟绿坝过滤机制 - 下载 - 搜珍网...

    Java版*图像过滤入门示例及源码-0.1.0 (模拟绿坝过滤机制)/image/dy.jpg Java版*图像过滤入门示例及源码-0.1.0 (模拟绿坝过滤机制)/image/dymh.jpg Ja ...

  8. Java 敏感词过滤(DFA有穷自动机)

    Java 敏感词过滤 DFA有穷自动机 初始化敏感词 构建树 查询 完整代码如下 后记 初始化敏感词 使用set集合,可以查询数据库. /*** 初始化值* @return*/private stat ...

  9. java过滤函数,过滤函数 (Sun Java System Portal Server 7.2 管理指南)

    过滤函数 过滤函数在"元数据"和"数据"阶段运行,以根据函数及其属性指定的具体条件来允许或拒绝资源.在 filter.conf 文件的"枚举" ...

  10. Java敏感词过滤、java关键词过滤工具包原理

    原理:基于多叉树的查找. 第一步:把敏感词读入搜索多叉树中, 树结构: 第二步,对需过滤的句子进行逐字匹配: 比如句子:解放了全中国 1.记录起始位置start=0,读到了"解", ...

最新文章

  1. dataTable 表格组件刷新 问题记录
  2. 腾讯云轻量应用服务器 开放端口
  3. JSP内置对象-out
  4. 关于“如何破坏单例“我说了好几种方式,面试官却说:我其实随便问问,没想到你真会
  5. GraphPad Prism 9.0.2 for MacOS 2021最新完美版科研绘图统计软件 附安装使用教程
  6. python将csv一行保存一个txt_Python读写文件(csv、txt、excel)
  7. flask找不到css_Flask干货:访问数据库——Flask-SQLAlchemy初始化
  8. 魅族显示无法连接到服务器,魅族连接电脑无法识别怎么办_魅族手机usb无法连接电脑的解决方法...
  9. ActiveMQ持久订阅设置
  10. 原生javascript淡入淡出焦点图 + Jquery实现方法
  11. libevent源码深度剖析六
  12. android 睡眠与唤醒I
  13. jQuery插件之:对话框
  14. centos7 部署dzzoffice最新版详细教程
  15. DOS命令大全(存档自用)
  16. IDEA jclasslib插件安装
  17. 网站的LOGO尺寸大小参考
  18. host头攻击漏洞修复
  19. 7.awd不死马权限维持及变种
  20. Vux使用Swiper遇到的问题

热门文章

  1. 如何修改植物大战僵尸文档
  2. node中Async模块的用法
  3. android 仿微信加载框,Android仿微信网络加载弹出框
  4. 华为鸿蒙系统平板电脑,华为5G鸿蒙系统平板电脑正式入网,搭载八核处理器麒麟9000芯片...
  5. 华为S5700交换机升级记录
  6. springboot 内存参数 启动
  7. ArcGIS 教程:Workflow Manager 高速浏览
  8. 修改DNS服务器的作用,请问修改DNS服务器会有什么后果
  9. root高级权限怎么弄,怎样拥有root权限
  10. QT<八> 绘图事件、绘图设备