/**

* 从HTML源码中提取图片路径,最后以一个 String 类型的 List 返回,如果不包含任何图片,则返回一个 size=0 的List

* 需要注意的是,此方法只会提取以下格式的图片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic

* @param htmlCode HTML源码

* @return 标签 src 属性指向的图片地址的List集合

* @author Carl He

*/

public static List getImageSrc(String htmlCode) {

List imageSrcList = new ArrayList();

Pattern p = Pattern.compile("]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE);

Matcher m = p.matcher(htmlCode);

String quote = null;

String src = null;

while (m.find()) {

quote = m.group(1);

src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2);

imageSrcList.add(src);

}

return imageSrcList;

}

java 获取图片的路径_Java中使用正则表达式获取网页中所有图片的路径相关推荐

  1. java爬取验证码图片_JAVA HttpClient实现页面信息抓取(获取图片验证码并传入cookie实现信息获取)...

    JAVA HttpClient实现页面信息抓取(获取图片验证码并传入cookie实现信息获取) 发布时间:2018-05-18 16:41, 浏览次数:632 , 标签: JAVA HttpClien ...

  2. php正则网络图片格式,php中通过正则表达式下载内容中的远程图片的函数代码

    这段程序其实是属于"小偷程序"的重要部分. 这一段程序只是下载远程图片的那一段而已,程序写的比较简单,大多部分都做了注释. if (preg_match_all("/ht ...

  3. HTML的超级链接,HTML对图片的控制,表格(TABLE)标记,网页中的框架,会移动的文字(4)

    9 超级链接 普通超级链接1 超级链接是整个WWW应用的核心和基础.如果没有超级链接的概念,那么,我们现在所有的WWW的应用将不复存在.所以,对超级链接的掌握具有特殊重要的意义. 普通超级链接2 超级 ...

  4. 网页表格线框html,关于Dreamweaver中怎么让html网页中的table边框细线显示?

    关于Dreamweaver中怎么让html网页中的table边框细线显示? 对于不是编程的我们,用Dreamweaver制作表格的`情况下.默认表格边框会标的比较粗,今天给大家介绍下制作西表格超级简单 ...

  5. php提取网页mp3,怎么提取网页中的音乐|下载网页中的音乐 网页音乐提取工具及使用教程分享...

    相信很多人都比较了解怎么下载网页上的视频吧,那么现在怎么提取网页中的音乐或者说怎么下载网页中的音乐 ,嗯~ o(* ̄▽ ̄*)o ,不懂的孩纸,路过走过不要错过啦,快来看看小编分享的网页音乐提取工具及使 ...

  6. 在asp.net中如何用javascript读取本地Xml中的数据到网页中的文本框?

    在asp.net中如何用javascript读取本地Xml中的数据到网页中的文本框? 转载于:https://www.cnblogs.com/dynasty/archive/2005/08/18/21 ...

  7. 利用正则表达式提取网页中Table内的数据

    利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...

  8. 正则表达式提取网页中的网址

    正则表达式提取网页中的网址,并用匿名函数 #coding=utf-8 import res="https://www.baidu.com/message.asp?id=35" re ...

  9. java获取上传文件路径_java上传文件获取跟目录的办法

    在java中获得文件的路径在我们做上传文件操作时是不可避免的. web 上运行 1: this.getClass().getClassLoader().getResource("/" ...

  10. java date只保留年月日_Java日期时间API系列14-----Jdk8中日期API类,日期计算1,获取年月日时分秒等...

    通过Java日期时间API系列8-----Jdk8中java.time包中的新的日期时间API类的LocalDate源码分析 ,可以看出java8设计非常好,实现接口Temporal, Tempora ...

最新文章

  1. 活动要点回顾 | 智源论坛:自然语言处理报告会
  2. python 网络相关依赖库 dpkt、scapy、pcap 安装
  3. 成功解决VirtualBox is not installed. Please re-run the Toolbox Installer and try again.
  4. 理解 Android 消息机制
  5. shop--8.店铺管理页面的开发
  6. 远程服务器虚拟显示器配置方法
  7. matlab运算放大器概述,运算放大器概述
  8. jpg与gif的互换(使用ImageIO代替JPEGImageEncoder)
  9. LINUX内存管理子系统和进程管理子系统
  10. 16天记住7000考研单词(784个句子版本) 实际单词4369
  11. JavaWEB作业 用CSS制作高仿QQ空间
  12. 重庆云阳2021云中高考成绩查询,重庆云阳中学2021年招生简章
  13. 06 Redis中BigKey、HotKey的发现与处理
  14. 一款基于Vue的自适应Web在线音乐播放器
  15. E - Help Hanzo(LightOJ 1197)
  16. Email营销课堂:邮件群发平台与软件区别
  17. python爬虫学习-定制请求头
  18. 厉害!猛提升70马力150牛米!帕拉梅拉2.9T南京刷ECU升级一阶程序方案分享
  19. 万字长文讲清楚4D毫米波雷达
  20. Mahout使用入门

热门文章

  1. 【可视化】表格的设计
  2. bios sgx需要开启吗_华硕主板BIOS解读:新手装机必备篇(必须收藏)
  3. 暗战无人货架 先发制人还是后来居上
  4. 解决 Windows server 2008 R2 DataCenter 不能安装 .NETFramework4.6.1
  5. Python基础知识速记
  6. swf2exe,Flash2exe,SWF to Exe转换器,FLV视频打包,SWF转换为Exe,Flash转换为Exe视频
  7. 网易126邮箱服务器设置,网易闪电邮企业邮箱设置教程(POP3)
  8. linux系统英伟达显卡刷新率,nVidia多显卡多GPU在Linux下的超频设置
  9. 上海百络隆重推出免费上网监控软件-《百络网警》家庭版V6.6B9
  10. 九、垃圾回收:垃圾数据是如何自动回收的?