C#正则表达式提取HTML中IMG标签的URL地址 .
/// <summary>
/// 取得HTML中所有图片的 URL。
/// </summary>
/// <param name="sHtmlText">HTML代码</param>
/// <returns>图片的URL列表</returns>
public static string[] GetHtmlImageUrlList(string sHtmlText)
{
// 定义正则表达式用来匹配 img 标签
Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);
// 搜索匹配的字符串
MatchCollection matches = regImg.Matches(sHtmlText);
int i = 0;
string[] sUrlList = new string[matches.Count];
// 取得匹配项列表
foreach (Match match in matches)
sUrlList[i++] = match.Groups["imgUrl"].Value;
return sUrlList;
}
转载于:https://www.cnblogs.com/wangchuang/archive/2012/05/23/2515282.html
C#正则表达式提取HTML中IMG标签的URL地址 .相关推荐
- C#正则表达式提取HTML中IMG标签的SRC地址(转)
一般来说一个 HTML 文档有很多标签,比如"<html>"."<body>"."<table>"等,想 ...
- C#正则表达式提取HTML中IMG标签中的SRC地址
百度到的一个,这里就直接贴了 http://blog.csdn.net/smeller/article/details/7108502#comments 一般来说一个 HTML 文档有很多标签,比如& ...
- IOS使用正则表达式去掉html中的标签元素,获得纯文本
IOS使用正则表达式去掉html中的标签元素,获得纯文本 content是根据网址获得的网页源码字符串 NSRegularExpression *regularExpretion=[NSRegular ...
- 利用正则表达式提取网页中Table内的数据
利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...
- php 正则 尖括号,php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符...
PHP使用正则表达式提取字符串中尖括号<>.小括号().中括号[].大括号{}中的字符示例,需要的朋友可以参考下 代码如下: $str="你好(爱)[北京]{天安门}" ...
- 01. 利用正则表达式提取文章中的所有英文单词
利用正则表达式提取文章中的所有英文单词 1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象 Pattern pattern = Pattern.compile("[a ...
- 使用正则表达式提取文件中满足条件的内容
最近遇到需要处理一个很大文件的情况,需求是提取满足以`(ASCII 十进制 96)开头'结束的字符串,例如xxxxx`abcdedg'. 尝试在shell脚本中用正则表达式提取.有点曲折,后来通过py ...
- 正则表达式提取字符串中的手机号码
正则表达式提取字符串中的手机号码 1.正则表达式提取思路 1.先提取出来11位的数字组合 2.再判断这11位的数字组合是否符合要求 2.要用到的正则表达式功能 a.match() 用于提取()里面的符 ...
- 正则表达式提取网页中的网址
正则表达式提取网页中的网址,并用匿名函数 #coding=utf-8 import res="https://www.baidu.com/message.asp?id=35" re ...
最新文章
- 大触教你如何调节python内置函数
- bat小工具_小程序反编译工具在windows系统下的调用脚本
- 从「王师傅一共损失了多少钱」说开去
- python二次开发攻略-ABAQUS Python二次开发攻略
- hashlib模块使用详情
- WIN32 多线程吃字母练习
- CVPR 2019 | 小样本域适应的目标检测
- nginx mysql5.7_Centos7+Php7+Mysql5.7+Nginx源码安装实战部署手册
- html5表白页面3d,七夕节表白3d相册制作(html5+css3)
- 麦克风的喧响伪原创工具
- python分支语句_Python中的分支语句和循环语句及案例
- Java 泛型 extends T 和 super T 详解
- ubuntu mysql 多硬盘_ubuntu下磁盘空间不足导致mysql无法启动的解决方法
- 海康威视存储服务器的作用,海康存储服务器CVR存储方式配置说明
- (Hopcroft-Carp二分图匹配)Rain on your Parade
- 华为5g cpe 虚拟服务器,中国移动科普5G CPE:不换手机也能体验5G
- linux双击运行jar包,linux下发布JAR包 并运行
- Ubuntu 输入法fcitx方块乱码解决设置
- Unity 骨骼动画 Anima2D
- Google操作系统基于Chrome?!