当我们用ckeditor或其他一些在线文本编辑器的时候 内容里会有很多的标签如下片段:

  <P sizcache09220071460488126="0.0.0"

  sizset="false"><IMG style="WIDTH: 460px; DISPLAY: none;

  HEIGHT: 494px" alt=\ src="" jQuery18003577157966567542="1">

  <IMG title=图片加载中… alt=加载中… src="statics/images/s_nopic.gif"></P>

  <P>生命的旅途,一程有一程的风景,一程有一程的盛放。打开心灵的窗子,

  静看时光旖旎着一曲花开花落,用一种看山是山,看水是水的境界来生活就会快乐,

  人生的最美,便是来自心灵深处的通透与清欢。</P>

  <P>--题记</P>

  <P>喜欢在飘雪的午后,盈一眸恬静,书一抹情怀,看那雪花落入红尘最深处。

  暂离尘世喧嚣,将心灵放空,尽情的体会那份旷达与纯净。生命的旅途中,

  会有不期而遇的欣喜,也会有痛彻心扉的清醒,一地落红,氤氲了冷暖;一树梅开,

  缱绻了浮华,雪如拂尘,能掸去俗世的无奈,也能让灵魂净化。</P>

  包含一些图片,段落,换行等html标签如果要进行统计字数,则就需要去除这些标签。用java正则 如下代码:

  /**

  * 删除Html标签

  *

  * @param inputString

  * @return

  */

  public static String htmlRemoveTag(String inputString) {

  if (inputString == null)

  return null;

  String htmlStr = inputString; // 含html标签的字符串

  String textStr = "";

  java.util.regex.Pattern p_script;

  java.util.regex.Matcher m_script;

  java.util.regex.Pattern p_style;

  java.util.regex.Matcher m_style;

  java.util.regex.Pattern p_html;

  java.util.regex.Matcher m_html;

  try {

  //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script>

  String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";

  //定义style的正则表达式{或<STYLE[^>]*?>[\\s\\S]*?<\\/style>

  String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";

  String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式

  p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);

  m_script = p_script.matcher(htmlStr);

  htmlStr = m_script.replaceAll(""); // 过滤script标签

  p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);

  m_style = p_style.matcher(htmlStr);

  htmlStr = m_style.replaceAll(""); // 过滤style标签

  p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);

  m_html = p_html.matcher(htmlStr);

  htmlStr = m_html.replaceAll(""); // 过滤html标签

  textStr = htmlStr;

  } catch (Exception e) {

  e.printStackTrace();

  }

  return textStr;// 返回文本字符串

  }

ccccccccccccccccccccc相关推荐

  1. HTML(格式,文本标签)

    <html>  <head>   <title>格式标签</title>  </head>  <body>   aaa aaaa ...

  2. 分析函数调用的汇编指令

    同样一段c++代码生成的汇编指令可能会不一样.有多种原因,例如编译器.调用约定或者底层平台. 今天要分析的是cdecl在x86机器上用visual c++ 2005上的编译结果. 首先需要设置一下项目 ...

  3. Markdown语法入门

    更新记录 版本 时间 修订内容 1.0 2018-4-5 完善了"表格"这一节 1.1 2022-2-6 完善了"链接"这一节 写在前面: 若没有特别说明,则以 ...

  4. linux cat代码,linux cat命令(示例代码)

    1.cat命令功能 cat命令的用途是连接文件或标准输入并打印.这个命令常用来显示文件内容,或者将几个文件连接起来显示,或者从标准输入读取内容并显示,它常与重定向符号配合使用 2.cat命令格式 ca ...

  5. Android -- 开机启动无界面后台程序

    简单的说,这是一个没有界面的后台运行的应用程序 而且,还有一功能:开机自启动,启动运行一个服务 程序结构非常简单,两个类,一个是service的扩展类,一个是BroadcastReceiver扩展类 ...

  6. python substr_Python字符串的方法

    一.index.find和rfind方法查找字串所在位置 S.find(substr, [start, [end]]):返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1. ...

  7. 1677. 【USACO】山峰暸望

    题目描述 一天,Bessie在眺望美丽的威斯康星的群山的时候,她突然产生了疑问:哪座山是最宽的捏?她决定在地平线上,利用她的新发明的山峰高度测量仪依次做N (1 <= N <= 10,00 ...

  8. SQL协同Excel制表统计各学院一二三等奖

    今天总算是考完了,然而刚出考场,就接到了任务,要求对全校863个校内获奖项目进行统计处理,天.. SQL协同Excel制表统计各学院一二三等奖 需求 现有EXCEL表一张,内含以下字段,和近900条数 ...

  9. python中readlines是什么意思_Python中read,readline,readlines三种方式的区别

    在用python读取文件的时经常用到三read.readline.readlines三种方法,它们功能实质区别如下: read       读取整个文件 readline    读取下一行 readl ...

最新文章

  1. 执行eclipse,迅速failed to create the java virtual machine。
  2. win7下安装配置tomcat,java运行环境
  3. 【Android 逆向】x86 汇编 ( align | db | dw | dd | nop | 伪指令 )
  4. 图解Spark On Yarn cluster模式运行机制
  5. Codeforces Round #529 (Div. 3) E. Almost Regular Bracket Sequence (括号配对,前缀和)
  6. 删除本地git的远程分支和远程删除git服务器的分支
  7. mysql数据库rp集群,使用MySQL-Cluster搭建MySQL数据库集群
  8. CF1063A Oh Those Palindromes
  9. 十年沉淀,阿里云发布全球领先的对象存储OSS可用性SLA
  10. JSR 299 建议草案第二版已提交
  11. 【游戏开发】Excel表格批量转换成CSV的小工具
  12. 企业级数据服务的一点感受
  13. 【单目标优化求解】基于matlab遗传算法求解非线性目标函数最小值问题【含Matlab源码 1574期】
  14. mysql可视化连接的错误及解决方案
  15. Mac下安装java运行环境
  16. html5 打开支付宝app,支付宝H5唤醒APP
  17. Spring Boot 应用在 kubernetes 的 sidecar 设计与实战
  18. 维修服务器bga是什么,服务器主板芯片坏了有机器能拆除焊接BGA吗?
  19. 使用Zadig从0到1搭建持续交付平台
  20. FireFoxPortable升级3.5手记

热门文章

  1. win10下如何解决VC++MSDEV.EXE的0xc0000142错误
  2. 数学建模--层次分析法
  3. 基于C#实现的简易绘图工具设计
  4. C语言实现成语接龙完整版
  5. java开发安卓app_开发安卓app常用的三种开发语言
  6. JDK中提供的类(常用API)
  7. delphi代码在linux编译运行,[教程] Delphi 10.2 Linux 程序开发环境部署的基本步骤
  8. 毕业论文计算机设计,计算机设计毕业论文
  9. win7 计算机定时关机脚本,w7系统定时关机命令如何设置_w7电脑怎样设置定时关机...
  10. 如何使用FreeTextBox