/**

*  获取html中body的内容 包含body标签

* @param htmlStr  html代码

* @return

*/

public static String getBody(String htmlStr){

String pattern = "]*>([\\s\\S]*)";

Pattern p_body = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);

Matcher m_body = p_body.matcher(htmlStr);        if (m_body.find()){            return m_body.group();

}        return htmlStr;

}    /**

* 取到html中body里面的内容 不包含body标签

* @param htmlStr

* @return

*/

public static String removeBody(String htmlStr){        /**

* 获取html代码中body标签里的内容         */

htmlStr=getBody(htmlStr);        //body开头标签

String bodyEx_start = "]*>";        //body结尾标签

String bodyEx_end = "";

Pattern p_script = Pattern.compile(bodyEx_start, Pattern.CASE_INSENSITIVE);

Matcher m_script = p_script.matcher(htmlStr);

htmlStr = m_script.replaceAll(""); // 过滤script标签

Pattern p_style = Pattern.compile(bodyEx_end, Pattern.CASE_INSENSITIVE);

Matcher m_style = p_style.matcher(htmlStr);

htmlStr = m_style.replaceAll(""); // 过滤style标签

return htmlStr;

}

如果要取得html代码中body里面的内容 不包含body标签

直接调用 removeBody

把body中的html隐藏,JAVA通过正则匹配html里面body标签的内容,去掉body标签相关推荐

  1. Java使用正则匹配

    Java使用正则匹配 1.Java trim() 方法 2.匹配空格(一个或多个) 3.匹配回车换行 4.匹配字符串 整理一下正则表达式再Java中的使用 1.Java trim() 方法 删除头尾空 ...

  2. Java通过正则匹配字符串中“${key}”的key

    文章目录 前言 一.正则表达式匹配${key} 二.在Java中使用 参考文档 前言 不太了解正则表达式,这里只是记录解决问题的方法. 一.正则表达式匹配${key} .*\$\{([x00-xF]+ ...

  3. python3中find函数的用法_Python3正则匹配re.split,re.finditer及re.findall函数用法详解...

    本文实例讲述了Python3正则匹配re.split,re.finditer及re.findall函数用法.分享给大家供大家参考,具体如下: re.split re.finditer re.finda ...

  4. js和Java分别正则匹配小数点后多余的0

    var dd = "2.0010万抵10.00万";var aa = dd.match(/\d+\.\d+/g);for ( var index in aa) {dd = dd.r ...

  5. java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言

    今天又对我的博客首页进行了一次版本的更新,使其自适应屏幕,获得更好的用户体验,然后就出现点小问题,那就是原来的摘要是人为添加的,有长有短,对自适应屏幕有影响,所以我们现在是截取文章的前200个字来完成 ...

  6. java/scala正则匹配英文句号

    object ScalaTest {def main(args: Array[String]): Unit = {println("ABC...".replaceAll(" ...

  7. idea中java项目显示不对_Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决...

    Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决,模块,工程,给大家,文件,灰色 Intellj Idea中的maven工程Java文件颜色不对,未被识别的解决 易采站长 ...

  8. java 正则 空白字符_关于JAVA正则匹配空白字符的问题

    今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件 显示"\u3000" ,这是什么? 这是全角空格!!! 查了一下    \s   ...

  9. php正则匹配字符_php中字符串和正则表达式详解

    一.字符串类型的特点 1.PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作. echo substr("123456",2,4);  //输出345 echo s ...

最新文章

  1. android如何使用xml资源文件,Android-使用xml文件资源定义菜单
  2. new Random().Next(1, 100); 多线程同时执行结果很高概率相同,
  3. 提示缺少Qedit.h问题
  4. JAVA IOC及代理模式
  5. 英特尔® 硬件加速执行管理器安装指南 — Mac OS X*
  6. IIS 添加mime 支持 apk,exe,.woff,IIS MIME设置 ,Android apk下载的MIME 设置 苹果ISO .ipa下载mime 设置...
  7. 大数据分析如何助力企业发展
  8. vs2010使用教程c语言编程,VS2010的使用
  9. 软考-计算机组成原理与结构
  10. curl 命令详解(超详细)
  11. 从360图书馆抓取全球国家的中文名与英文名(requests_html)
  12. HTML期末学生大作业-新闻网页作业html+css
  13. 系统运维工程师30岁学python_一名Linux系统运维工程师的自述
  14. lego_loam 代码阅读与总结
  15. 愿天下有情人都是失散多年的兄妹(25 分)
  16. 【M】⽴项or申报书中的重点难点咋写?
  17. 软考笔记——5.2网络安全技术
  18. 1046 划拳 PTA
  19. C语言学习笔记——输入五个国家的名称,按字母顺序排列输出
  20. 光速不变原理与狭义相对论的关系——思想实验推导狭义相对论(一)

热门文章

  1. iOS VideoToolBox decoder解码失败(-12909和-12911)问题解决
  2. 如何在Windows下强制git使用LF而不是CR + LF?
  3. 我什么时候应该真正使用noexcept?
  4. 项目启动后去除项目标题,去除时间与状态栏Android
  5. excel保存时 检测到错误,Microsoft Excel可通过删除或修复某些功能来保存此文件
  6. 终结者2显示天网服务器,《终结者2:审判日》天网觉醒秘测开服公告
  7. 机器人图规划算法研究现状简述
  8. mysql 权限管理无效_mysql 权限控制笔记
  9. arcgis engine设置数据源路径_不用ArcGIS做前期分析,你是不是想被辞!
  10. 常见的遍历数组和对象的方法