转载自 java过滤html标签获取纯文本信息

package com.lyt.base.util;import java.util.regex.Pattern;public class FilterHtmlUtil {public static String Html2Text(String inputString){String htmlStr = inputString; //含html标签的字符串String textStr ="";java.util.regex.Pattern p_script;java.util.regex.Matcher m_script;java.util.regex.Pattern p_style;java.util.regex.Matcher m_style;java.util.regex.Pattern p_html;java.util.regex.Matcher m_html;try{String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> }String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> }String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);m_script = p_script.matcher(htmlStr);htmlStr = m_script.replaceAll(""); //过滤script标签p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);m_style = p_style.matcher(htmlStr);htmlStr = m_style.replaceAll(""); //过滤style标签p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);m_html = p_html.matcher(htmlStr);htmlStr = m_html.replaceAll(""); //过滤html标签textStr = htmlStr;}catch(Exception e){e.printStackTrace();}return textStr;//返回文本字符串
} }

java过滤html标签获取纯文本信息相关推荐

  1. java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言

    今天又对我的博客首页进行了一次版本的更新,使其自适应屏幕,获得更好的用户体验,然后就出现点小问题,那就是原来的摘要是人为添加的,有长有短,对自适应屏幕有影响,所以我们现在是截取文章的前200个字来完成 ...

  2. HtmlParser提取网页中的纯文本信息

    转载自   HtmlParser提取网页中的纯文本信息 HTMLParser 一个解析web页面的开源类库.           准备学习下搜索方面的技术,就学习了些网络爬虫的知识.最近一直在一个点上 ...

  3. textarea 转换 html,textarea html标签转换为纯文本

    我正在使用CKEditor将帖子发布到网站.不过,我输入的东西在其中创建HTML标签,但它们返回为纯文本:textarea html标签转换为纯文本 我使用EJS(如果它的事项)为我的看法引擎,并显示 ...

  4. java使用htmlparser提取网页纯文本例子

    转载自   java使用htmlparser提取网页纯文本例子 这篇文章主要介绍了java使用htmlparser提取网页纯文本例子,需要的朋友可以参考下 package com.test; impo ...

  5. java根据ip地址获取城市地域信息

    java根据ip地址获取城市地域信息 这里提供两个公开的接口,一个是阿里的,一个是新浪的 http://ip.taobao.com/service/getIpInfo.php?ip=123.139.9 ...

  6. Java过滤HTML标签、属性等正则表达式汇总

    Java过滤HTML标签.属性等正则表达式汇总 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2 ...

  7. java 正则 html 标签_Java正则 HTML 标签 得到 纯文本

    public static String Html2Text(String inputString){ String htmlStr = inputString; //含html标签的字符串 Stri ...

  8. Java过滤HTML标签工具类

    过滤HTML标签能有效的放置XSS攻击. 封装: import org.slf4j.Logger; import org.slf4j.LoggerFactory;import org.springfr ...

  9. 文本处理去除html标签,删除html标签得到纯文本可处理嵌套的标签

    方法基本上来自THinkphp中的源码,但是被我修改了一下 /* *@Description:删除HTML标签,得到纯文本.可以处理嵌套的标签 * */ class deleteHtmlTags{ p ...

最新文章

  1. hbase windows安装
  2. OpenCV中cvWaitKey()函数注意事项
  3. C++ reverse memcpy
  4. linux下svn常用指令(转)
  5. 随机调用mysql数据库表值10条php_PHP随机显示mysql数据库中的数据
  6. poj3259 Wormholes(spfa判负环)
  7. C学习笔记-makefile
  8. “一切即代码”究竟意味着什么?
  9. 微软Azure Services Bus中的工作流
  10. 更新sdk_即构ZegoLiveRoom SDK版本更新,新增多项功能及自定义设置
  11. 低成本高笑果之两只大老虎(TBT)
  12. phpfilter的妙用
  13. CPGIS三十周年专访系列|陶闯主席
  14. JDBC模拟SQL注入和避免SQL注入
  15. 使用React Hooks 时要避免的5个错误!
  16. halcon三维检测启蒙1
  17. 读《借助开源项目,学习软件开发》总结
  18. 在Openshift上部署asp.net遇到的一些捉急问题总结
  19. Java解决表格统计“近一日、近一周、近一月”数据的时间函数调用问题
  20. 当STM32遇上RFID

热门文章

  1. [JS-BOM]BOM概念与组成
  2. [JavaWeb-MySQL]DQL_查询表中记录,语句
  3. Redis流量控制策略
  4. 数据结构---邻接表的DFS
  5. MySQL集群搭建——主备模式
  6. P4175 [CTSC2008]网络管理(整体二分)
  7. P3978 [TJOI2015]概率论(生成函数)
  8. Codeforces Round #585 (Div. 2) F. Radio Stations 2-sat + 神仙建模
  9. P3321 [SDOI2015]序列统计(未解决)
  10. 【每日一题】7月14日题目精讲—压缩