把body中的html隐藏,JAVA通过正则匹配html里面body标签的内容,去掉body标签
/**
* 获取html中body的内容 包含body标签
* @param htmlStr html代码
* @return
*/
public static String getBody(String htmlStr){
String pattern = "]*>([\\s\\S]*)";
Pattern p_body = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher m_body = p_body.matcher(htmlStr); if (m_body.find()){ return m_body.group();
} return htmlStr;
} /**
* 取到html中body里面的内容 不包含body标签
* @param htmlStr
* @return
*/
public static String removeBody(String htmlStr){ /**
* 获取html代码中body标签里的内容 */
htmlStr=getBody(htmlStr); //body开头标签
String bodyEx_start = "]*>"; //body结尾标签
String bodyEx_end = "";
Pattern p_script = Pattern.compile(bodyEx_start, Pattern.CASE_INSENSITIVE);
Matcher m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(""); // 过滤script标签
Pattern p_style = Pattern.compile(bodyEx_end, Pattern.CASE_INSENSITIVE);
Matcher m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(""); // 过滤style标签
return htmlStr;
}
如果要取得html代码中body里面的内容 不包含body标签
直接调用 removeBody
把body中的html隐藏,JAVA通过正则匹配html里面body标签的内容,去掉body标签相关推荐
- Java使用正则匹配
Java使用正则匹配 1.Java trim() 方法 2.匹配空格(一个或多个) 3.匹配回车换行 4.匹配字符串 整理一下正则表达式再Java中的使用 1.Java trim() 方法 删除头尾空 ...
- Java通过正则匹配字符串中“${key}”的key
文章目录 前言 一.正则表达式匹配${key} 二.在Java中使用 参考文档 前言 不太了解正则表达式,这里只是记录解决问题的方法. 一.正则表达式匹配${key} .*\$\{([x00-xF]+ ...
- python3中find函数的用法_Python3正则匹配re.split,re.finditer及re.findall函数用法详解...
本文实例讲述了Python3正则匹配re.split,re.finditer及re.findall函数用法.分享给大家供大家参考,具体如下: re.split re.finditer re.finda ...
- js和Java分别正则匹配小数点后多余的0
var dd = "2.0010万抵10.00万";var aa = dd.match(/\d+\.\d+/g);for ( var index in aa) {dd = dd.r ...
- java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言
今天又对我的博客首页进行了一次版本的更新,使其自适应屏幕,获得更好的用户体验,然后就出现点小问题,那就是原来的摘要是人为添加的,有长有短,对自适应屏幕有影响,所以我们现在是截取文章的前200个字来完成 ...
- java/scala正则匹配英文句号
object ScalaTest {def main(args: Array[String]): Unit = {println("ABC...".replaceAll(" ...
- idea中java项目显示不对_Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决...
Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决,模块,工程,给大家,文件,灰色 Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决 易采站长 ...
- java 正则 空白字符_关于JAVA正则匹配空白字符的问题
今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件 显示"\u3000" ,这是什么? 这是全角空格!!! 查了一下 \s ...
- php正则匹配字符_php中字符串和正则表达式详解
一.字符串类型的特点 1.PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作. echo substr("123456",2,4); //输出345 echo s ...
最新文章
- android如何使用xml资源文件,Android-使用xml文件资源定义菜单
- new Random().Next(1, 100); 多线程同时执行结果很高概率相同,
- 提示缺少Qedit.h问题
- JAVA IOC及代理模式
- 英特尔® 硬件加速执行管理器安装指南 — Mac OS X*
- IIS 添加mime 支持 apk,exe,.woff,IIS MIME设置 ,Android apk下载的MIME 设置 苹果ISO .ipa下载mime 设置...
- 大数据分析如何助力企业发展
- vs2010使用教程c语言编程,VS2010的使用
- 软考-计算机组成原理与结构
- curl 命令详解(超详细)
- 从360图书馆抓取全球国家的中文名与英文名(requests_html)
- HTML期末学生大作业-新闻网页作业html+css
- 系统运维工程师30岁学python_一名Linux系统运维工程师的自述
- lego_loam 代码阅读与总结
- 愿天下有情人都是失散多年的兄妹(25 分)
- 【M】⽴项or申报书中的重点难点咋写?
- 软考笔记——5.2网络安全技术
- 1046 划拳 PTA
- C语言学习笔记——输入五个国家的名称,按字母顺序排列输出
- 光速不变原理与狭义相对论的关系——思想实验推导狭义相对论(一)
热门文章
- iOS VideoToolBox decoder解码失败(-12909和-12911)问题解决
- 如何在Windows下强制git使用LF而不是CR + LF?
- 我什么时候应该真正使用noexcept?
- 项目启动后去除项目标题,去除时间与状态栏Android
- excel保存时 检测到错误,Microsoft Excel可通过删除或修复某些功能来保存此文件
- 终结者2显示天网服务器,《终结者2:审判日》天网觉醒秘测开服公告
- 机器人图规划算法研究现状简述
- mysql 权限管理无效_mysql 权限控制笔记
- arcgis engine设置数据源路径_不用ArcGIS做前期分析,你是不是想被辞!
- 常见的遍历数组和对象的方法