import org.jsoup.nodes.Element; //导入方法依赖的package包/类

public static String parseForContent(String key, Element seItemBody) {

String content = seItemBody.outerHtml();

// check if key is found and remove everything in front

int keyOccurrence = content.toLowerCase().indexOf(key);

if (keyOccurrence == -1) {

return "";

} else {

content = content.substring(keyOccurrence + key.length());

}

// check if line break is found and remove everything in front

// assumption: content is right after the key and on new line

int firstLineBreak = content.indexOf("
");

if (firstLineBreak == -1) {

return "";

} else {

content = content.substring(firstLineBreak + 4);

}

content = content.replaceAll("\r", "");

content = content.replaceAll("\n", "");

// only read until the next line break

Pattern patternLineBreak = Pattern.compile("(.+?)
.*");

Matcher matcherLineBreak = patternLineBreak.matcher(content);

// if no line break tag is found just read until the next html tag occurs

Pattern patternTag = Pattern.compile("(.+?)<.>.*");

Matcher matcherTag = patternTag.matcher(content);

if (matcherLineBreak.find()) {

content = matcherLineBreak.group(1);

} else if (matcherTag.find()) {

content = matcherTag.group(1);

} else {

LOG.debug("No end html tag for key '{}' in [{}] parsed from [{}]", key, content, seItemBody.outerHtml());

}

content = content.trim();

return content;

}

java htmlelement_Java Element.outerHtml方法代码示例相关推荐

  1. java getdocument_Java Element.getDocument方法代码示例

    import javax.swing.text.Element; //导入方法依赖的package包/类 /** * Writes out all empty elements (all tags t ...

  2. java kryo_Kryo框架使用方法代码示例

    Kryo框架的source已移至https://github.com/EsotericSoftware/kryo ,进入此页面,然后点击右边的Download Zip按钮,就能下载到最新版本的Kryo ...

  3. java readtimeout_Java HttpURLConnection.getReadTimeout方法代码示例

    import java.net.HttpURLConnection; //导入方法依赖的package包/类 /** * 得到响应对象 * * @param urlConnection * @retu ...

  4. java invalidate_Java Component.invalidate方法代码示例

    import java.awt.Component; //导入方法依赖的package包/类 /** Installs the component we will embed to display t ...

  5. java hasmoreelements_Java IOException.hasMoreElements方法代码示例

    import java.io.IOException; //导入方法依赖的package包/类 /** * fileName���� ���� package �������� ������ ���� ...

  6. java methode_Java Method.getTypeParameters方法代码示例

    import java.lang.reflect.Method; //导入方法依赖的package包/类 private void validateRuleMethod(MethodRuleDefin ...

  7. java locationuitool_Java JavaUI.getLibraryJavadocLocation方法代码示例

    import org.eclipse.jdt.ui.JavaUI; //导入方法依赖的package包/类 /** * Shows the UI for configuring a javadoc l ...

  8. java setmethod_Java Operation.setJavaMethod方法代码示例

    import com.sun.tools.internal.ws.processor.model.Operation; //导入方法依赖的package包/类 private void createJ ...

  9. java cancel_Java RunnableFuture.cancel方法代码示例

    import java.util.concurrent.RunnableFuture; //导入方法依赖的package包/类 @Test public void testSnapshotAsyncC ...

  10. java getevent_Java ActionEvent.getWhen方法代码示例

    import java.awt.event.ActionEvent; //导入方法依赖的package包/类 @Override final public void actionPerformed(A ...

最新文章

  1. ios中MKHorizMenu用法
  2. 对数线性模型之一(逻辑回归), 广义线性模型学习总结
  3. Android仿微信图片上传,可以选择多张图片,缩放预览,拍照上传等
  4. java中打印输出数组内容的三种方式
  5. 用 Freemarker 生成 word 文档
  6. linux如何分析系统的堆栈,Linux内核分析:操作系统是如何工作的?
  7. WEB文件上传之JQuery ajaxfileupload插件使用(二)
  8. 前端学习(3167):react-hello-react之鼠标添加一个todoList
  9. Oracle 游标使用大全2
  10. Xml序列化、反序列化帮助类
  11. 2019三星比2018好在哪_2019年全球可穿戴设备销量榜:苹果第一小米第二,华为排名很给力...
  12. LESS是一个CSS预处理器,跨浏览器友好,提供诸如变量,函数, mixins 和操作等功能,可以构建动态CSS...
  13. android poi导出excel,解决java poi导出excel2003不能超过65536行的问题
  14. 带你快速了解ISO27001信息安全管理体系认证
  15. html自定义字体,css怎么自定义字体?
  16. 代理服务是个什么东西?
  17. 除了ChatGPT,还能用什么计划管理软件提高效率?
  18. linux服务器的Gzip文件压缩方法[转]
  19. 探索 OkHttp 原理
  20. 网站如何报价 做一个普通企业网站多少钱?

热门文章

  1. Avalondock 第一步 创建停靠面板
  2. 设置服务器网站播放flv视频文件,网页制作 flvplayer.swf无法播放服务器上flv文件 如何设置...
  3. Openjudge 1.13 33:实数加法
  4. Unity插件Odin入门
  5. Unity3d如何制作声音开关按钮
  6. 通过ADB命令打开MTK和展讯日志的方法
  7. 雅马哈推出可以播放黑胶唱片和流行音乐的无线唱盘
  8. c语言蠕虫病毒源码,蠕虫病毒源码!附带解毒源码!
  9. 【AD封装】插件电感,变压器(带3D)
  10. 使用三边定位算法进行室内定位