/// <summary>
/// 取得HTML中所有图片的 URL。
/// </summary>
/// <param name="sHtmlText">HTML代码</param>
/// <returns>图片的URL列表</returns>
public static string[] GetHtmlImageUrlList(string sHtmlText)
{
  // 定义正则表达式用来匹配 img 标签
  Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>",   RegexOptions.IgnoreCase);
 
  // 搜索匹配的字符串
  MatchCollection matches = regImg.Matches(sHtmlText);
  int i = 0;
  string[] sUrlList = new string[matches.Count];
 
  // 取得匹配项列表
  foreach (Match match in matches)
  sUrlList[i++] = match.Groups["imgUrl"].Value;
  return sUrlList;
}

转载于:https://www.cnblogs.com/wangchuang/archive/2012/05/23/2515282.html

C#正则表达式提取HTML中IMG标签的URL地址 .相关推荐

  1. C#正则表达式提取HTML中IMG标签的SRC地址(转)

    一般来说一个 HTML 文档有很多标签,比如"<html>"."<body>"."<table>"等,想 ...

  2. C#正则表达式提取HTML中IMG标签中的SRC地址

    百度到的一个,这里就直接贴了 http://blog.csdn.net/smeller/article/details/7108502#comments 一般来说一个 HTML 文档有很多标签,比如& ...

  3. IOS使用正则表达式去掉html中的标签元素,获得纯文本

    IOS使用正则表达式去掉html中的标签元素,获得纯文本 content是根据网址获得的网页源码字符串 NSRegularExpression *regularExpretion=[NSRegular ...

  4. 利用正则表达式提取网页中Table内的数据

    利用正则表达式提取网页中Table内的数据 using System; using System.Collections.Generic; using System.Linq; using Syste ...

  5. php 正则 尖括号,php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符...

    PHP使用正则表达式提取字符串中尖括号<>.小括号().中括号[].大括号{}中的字符示例,需要的朋友可以参考下 代码如下: $str="你好(爱)[北京]{天安门}" ...

  6. 01. 利用正则表达式提取文章中的所有英文单词

    利用正则表达式提取文章中的所有英文单词 1.先创建一个Pattern对象, 模式对象,可以理解成一个正则表达式对象 Pattern pattern = Pattern.compile("[a ...

  7. 使用正则表达式提取文件中满足条件的内容

    最近遇到需要处理一个很大文件的情况,需求是提取满足以`(ASCII 十进制 96)开头'结束的字符串,例如xxxxx`abcdedg'. 尝试在shell脚本中用正则表达式提取.有点曲折,后来通过py ...

  8. 正则表达式提取字符串中的手机号码

    正则表达式提取字符串中的手机号码 1.正则表达式提取思路 1.先提取出来11位的数字组合 2.再判断这11位的数字组合是否符合要求 2.要用到的正则表达式功能 a.match() 用于提取()里面的符 ...

  9. 正则表达式提取网页中的网址

    正则表达式提取网页中的网址,并用匿名函数 #coding=utf-8 import res="https://www.baidu.com/message.asp?id=35" re ...

最新文章

  1. 大触教你如何调节python内置函数
  2. bat小工具_小程序反编译工具在windows系统下的调用脚本
  3. 从「王师傅一共损失了多少钱」说开去
  4. python二次开发攻略-ABAQUS Python二次开发攻略
  5. hashlib模块使用详情
  6. WIN32 多线程吃字母练习
  7. CVPR 2019 | 小样本域适应的目标检测
  8. nginx mysql5.7_Centos7+Php7+Mysql5.7+Nginx源码安装实战部署手册
  9. html5表白页面3d,七夕节表白3d相册制作(html5+css3)
  10. 麦克风的喧响伪原创工具
  11. python分支语句_Python中的分支语句和循环语句及案例
  12. Java 泛型 extends T 和 super T 详解
  13. ubuntu mysql 多硬盘_ubuntu下磁盘空间不足导致mysql无法启动的解决方法
  14. 海康威视存储服务器的作用,海康存储服务器CVR存储方式配置说明
  15. (Hopcroft-Carp二分图匹配)Rain on your Parade
  16. 华为5g cpe 虚拟服务器,中国移动科普5G CPE:不换手机也能体验5G
  17. linux双击运行jar包,linux下发布JAR包 并运行
  18. Ubuntu 输入法fcitx方块乱码解决设置
  19. Unity 骨骼动画 Anima2D
  20. Google操作系统基于Chrome?!

热门文章

  1. 反转一个值中的最后n位
  2. hibernate3配置文件hibernate.cfg.xml的详细解释
  3. [架构] 分布式和集群的区别
  4. Javascript取select的选中值和文本
  5. 装饰模式在Intermec CK1应用程序中通讯模块的应用
  6. 关于 Oracle 分区索引的失效和重建
  7. 机器学习07应用机器学习的建议
  8. 查看NVIDIA使用率工具目录
  9. 使用ActionTrail Python SDK
  10. Digital River拉来Netconcepts站台 亚太营销服务升级