java 获取图片的路径_Java中使用正则表达式获取网页中所有图片的路径
/**
* 从HTML源码中提取图片路径,最后以一个 String 类型的 List 返回,如果不包含任何图片,则返回一个 size=0 的List
* 需要注意的是,此方法只会提取以下格式的图片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic
* @param htmlCode HTML源码
* @return 标签 src 属性指向的图片地址的List集合
* @author Carl He
*/
public static List getImageSrc(String htmlCode) {
List imageSrcList = new ArrayList();
Pattern p = Pattern.compile("]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(htmlCode);
String quote = null;
String src = null;
while (m.find()) {
quote = m.group(1);
src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2);
imageSrcList.add(src);
}
return imageSrcList;
}
java 获取图片的路径_Java中使用正则表达式获取网页中所有图片的路径相关推荐
- java爬取验证码图片_JAVA HttpClient实现页面信息抓取(获取图片验证码并传入cookie实现信息获取)...
JAVA HttpClient实现页面信息抓取(获取图片验证码并传入cookie实现信息获取) 发布时间:2018-05-18 16:41, 浏览次数:632 , 标签: JAVA HttpClien ...
- php正则网络图片格式,php中通过正则表达式下载内容中的远程图片的函数代码
这段程序其实是属于"小偷程序"的重要部分. 这一段程序只是下载远程图片的那一段而已,程序写的比较简单,大多部分都做了注释. if (preg_match_all("/ht ...
- HTML的超级链接,HTML对图片的控制,表格(TABLE)标记,网页中的框架,会移动的文字(4)
9 超级链接 普通超级链接1 超级链接是整个WWW应用的核心和基础.如果没有超级链接的概念,那么,我们现在所有的WWW的应用将不复存在.所以,对超级链接的掌握具有特殊重要的意义. 普通超级链接2 超级 ...
- 网页表格线框html,关于Dreamweaver中怎么让html网页中的table边框细线显示?
关于Dreamweaver中怎么让html网页中的table边框细线显示? 对于不是编程的我们,用Dreamweaver制作表格的`情况下.默认表格边框会标的比较粗,今天给大家介绍下制作西表格超级简单 ...
- php提取网页mp3,怎么提取网页中的音乐|下载网页中的音乐 网页音乐提取工具及使用教程分享...
相信很多人都比较了解怎么下载网页上的视频吧,那么现在怎么提取网页中的音乐或者说怎么下载网页中的音乐 ,嗯~ o(* ̄▽ ̄*)o ,不懂的孩纸,路过走过不要错过啦,快来看看小编分享的网页音乐提取工具及使 ...
- 在asp.net中如何用javascript读取本地Xml中的数据到网页中的文本框?
在asp.net中如何用javascript读取本地Xml中的数据到网页中的文本框? 转载于:https://www.cnblogs.com/dynasty/archive/2005/08/18/21 ...
- 利用正则表达式提取网页中Table内的数据
利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...
- 正则表达式提取网页中的网址
正则表达式提取网页中的网址,并用匿名函数 #coding=utf-8 import res="https://www.baidu.com/message.asp?id=35" re ...
- java获取上传文件路径_java上传文件获取跟目录的办法
在java中获得文件的路径在我们做上传文件操作时是不可避免的. web 上运行 1: this.getClass().getClassLoader().getResource("/" ...
- java date只保留年月日_Java日期时间API系列14-----Jdk8中日期API类,日期计算1,获取年月日时分秒等...
通过Java日期时间API系列8-----Jdk8中java.time包中的新的日期时间API类的LocalDate源码分析 ,可以看出java8设计非常好,实现接口Temporal, Tempora ...
最新文章
- 活动要点回顾 | 智源论坛:自然语言处理报告会
- python 网络相关依赖库 dpkt、scapy、pcap 安装
- 成功解决VirtualBox is not installed. Please re-run the Toolbox Installer and try again.
- 理解 Android 消息机制
- shop--8.店铺管理页面的开发
- 远程服务器虚拟显示器配置方法
- matlab运算放大器概述,运算放大器概述
- jpg与gif的互换(使用ImageIO代替JPEGImageEncoder)
- LINUX内存管理子系统和进程管理子系统
- 16天记住7000考研单词(784个句子版本) 实际单词4369
- JavaWEB作业 用CSS制作高仿QQ空间
- 重庆云阳2021云中高考成绩查询,重庆云阳中学2021年招生简章
- 06 Redis中BigKey、HotKey的发现与处理
- 一款基于Vue的自适应Web在线音乐播放器
- E - Help Hanzo(LightOJ 1197)
- Email营销课堂:邮件群发平台与软件区别
- python爬虫学习-定制请求头
- 厉害!猛提升70马力150牛米!帕拉梅拉2.9T南京刷ECU升级一阶程序方案分享
- 万字长文讲清楚4D毫米波雷达
- Mahout使用入门
热门文章
- 【可视化】表格的设计
- bios sgx需要开启吗_华硕主板BIOS解读:新手装机必备篇(必须收藏)
- 暗战无人货架 先发制人还是后来居上
- 解决 Windows server 2008 R2 DataCenter 不能安装 .NETFramework4.6.1
- Python基础知识速记
- swf2exe,Flash2exe,SWF to Exe转换器,FLV视频打包,SWF转换为Exe,Flash转换为Exe视频
- 网易126邮箱服务器设置,网易闪电邮企业邮箱设置教程(POP3)
- linux系统英伟达显卡刷新率,nVidia多显卡多GPU在Linux下的超频设置
- 上海百络隆重推出免费上网监控软件-《百络网警》家庭版V6.6B9
- 九、垃圾回收:垃圾数据是如何自动回收的?