ccccccccccccccccccccc
当我们用ckeditor或其他一些在线文本编辑器的时候 内容里会有很多的标签如下片段:
<P sizcache09220071460488126="0.0.0"
sizset="false"><IMG style="WIDTH: 460px; DISPLAY: none;
HEIGHT: 494px" alt=\ src="" jQuery18003577157966567542="1">
<IMG title=图片加载中… alt=加载中… src="statics/images/s_nopic.gif"></P>
<P>生命的旅途,一程有一程的风景,一程有一程的盛放。打开心灵的窗子,
静看时光旖旎着一曲花开花落,用一种看山是山,看水是水的境界来生活就会快乐,
人生的最美,便是来自心灵深处的通透与清欢。</P>
<P>--题记</P>
<P>喜欢在飘雪的午后,盈一眸恬静,书一抹情怀,看那雪花落入红尘最深处。
暂离尘世喧嚣,将心灵放空,尽情的体会那份旷达与纯净。生命的旅途中,
会有不期而遇的欣喜,也会有痛彻心扉的清醒,一地落红,氤氲了冷暖;一树梅开,
缱绻了浮华,雪如拂尘,能掸去俗世的无奈,也能让灵魂净化。</P>
包含一些图片,段落,换行等html标签如果要进行统计字数,则就需要去除这些标签。用java正则 如下代码:
/**
* 删除Html标签
*
* @param inputString
* @return
*/
public static String htmlRemoveTag(String inputString) {
if (inputString == null)
return null;
String htmlStr = inputString; // 含html标签的字符串
String textStr = "";
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
//定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script>
String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";
//定义style的正则表达式{或<STYLE[^>]*?>[\\s\\S]*?<\\/style>
String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";
String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(""); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(""); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(""); // 过滤html标签
textStr = htmlStr;
} catch (Exception e) {
e.printStackTrace();
}
return textStr;// 返回文本字符串
}
ccccccccccccccccccccc相关推荐
- HTML(格式,文本标签)
<html> <head> <title>格式标签</title> </head> <body> aaa aaaa ...
- 分析函数调用的汇编指令
同样一段c++代码生成的汇编指令可能会不一样.有多种原因,例如编译器.调用约定或者底层平台. 今天要分析的是cdecl在x86机器上用visual c++ 2005上的编译结果. 首先需要设置一下项目 ...
- Markdown语法入门
更新记录 版本 时间 修订内容 1.0 2018-4-5 完善了"表格"这一节 1.1 2022-2-6 完善了"链接"这一节 写在前面: 若没有特别说明,则以 ...
- linux cat代码,linux cat命令(示例代码)
1.cat命令功能 cat命令的用途是连接文件或标准输入并打印.这个命令常用来显示文件内容,或者将几个文件连接起来显示,或者从标准输入读取内容并显示,它常与重定向符号配合使用 2.cat命令格式 ca ...
- Android -- 开机启动无界面后台程序
简单的说,这是一个没有界面的后台运行的应用程序 而且,还有一功能:开机自启动,启动运行一个服务 程序结构非常简单,两个类,一个是service的扩展类,一个是BroadcastReceiver扩展类 ...
- python substr_Python字符串的方法
一.index.find和rfind方法查找字串所在位置 S.find(substr, [start, [end]]):返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1. ...
- 1677. 【USACO】山峰暸望
题目描述 一天,Bessie在眺望美丽的威斯康星的群山的时候,她突然产生了疑问:哪座山是最宽的捏?她决定在地平线上,利用她的新发明的山峰高度测量仪依次做N (1 <= N <= 10,00 ...
- SQL协同Excel制表统计各学院一二三等奖
今天总算是考完了,然而刚出考场,就接到了任务,要求对全校863个校内获奖项目进行统计处理,天.. SQL协同Excel制表统计各学院一二三等奖 需求 现有EXCEL表一张,内含以下字段,和近900条数 ...
- python中readlines是什么意思_Python中read,readline,readlines三种方式的区别
在用python读取文件的时经常用到三read.readline.readlines三种方法,它们功能实质区别如下: read 读取整个文件 readline 读取下一行 readl ...
最新文章
- 执行eclipse,迅速failed to create the java virtual machine。
- win7下安装配置tomcat,java运行环境
- 【Android 逆向】x86 汇编 ( align | db | dw | dd | nop | 伪指令 )
- 图解Spark On Yarn cluster模式运行机制
- Codeforces Round #529 (Div. 3) E. Almost Regular Bracket Sequence (括号配对,前缀和)
- 删除本地git的远程分支和远程删除git服务器的分支
- mysql数据库rp集群,使用MySQL-Cluster搭建MySQL数据库集群
- CF1063A Oh Those Palindromes
- 十年沉淀,阿里云发布全球领先的对象存储OSS可用性SLA
- JSR 299 建议草案第二版已提交
- 【游戏开发】Excel表格批量转换成CSV的小工具
- 企业级数据服务的一点感受
- 【单目标优化求解】基于matlab遗传算法求解非线性目标函数最小值问题【含Matlab源码 1574期】
- mysql可视化连接的错误及解决方案
- Mac下安装java运行环境
- html5 打开支付宝app,支付宝H5唤醒APP
- Spring Boot 应用在 kubernetes 的 sidecar 设计与实战
- 维修服务器bga是什么,服务器主板芯片坏了有机器能拆除焊接BGA吗?
- 使用Zadig从0到1搭建持续交付平台
- FireFoxPortable升级3.5手记
热门文章
- win10下如何解决VC++MSDEV.EXE的0xc0000142错误
- 数学建模--层次分析法
- 基于C#实现的简易绘图工具设计
- C语言实现成语接龙完整版
- java开发安卓app_开发安卓app常用的三种开发语言
- JDK中提供的类(常用API)
- delphi代码在linux编译运行,[教程] Delphi 10.2 Linux 程序开发环境部署的基本步骤
- 毕业论文计算机设计,计算机设计毕业论文
- win7 计算机定时关机脚本,w7系统定时关机命令如何设置_w7电脑怎样设置定时关机...
- 如何使用FreeTextBox