如何提取HTML代码中img的src地址?
答案:专门的代码
使用专门的正则表达式
/// <summary> /// 获得HTML中所有图片的src地址【比较稳定的一个版本】/// </summary> /// <param name="sHtmlText">HTML代码</param> /// <returns>图片的URL列表</returns> public static string[] GetHtmlImageUrlList(string sHtmlText){// 定义正则表达式用来匹配 img 标签 Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);// 搜索匹配的字符串 MatchCollection matches = regImg.Matches(sHtmlText);int i = 0;string[] sUrlList = new string[matches.Count];// 取得匹配项列表 foreach (Match match in matches)sUrlList[i++] = match.Groups["imgUrl"].Value;return sUrlList;}
上面的方法我一直在用哦,对于喜欢采集的朋友可以帮上忙哦
转载于:https://www.cnblogs.com/Sky-cloudless/p/3850724.html
如何提取HTML代码中img的src地址?相关推荐
- C#提取HTML代码中的文字(转)
C#提取HTML代码中的文字 /// <summary> /// 去除HTML标记 /// </summary> /// <param name=" ...
- vb.net提取html网址,如何提取网页代码中指定内容
怎么提取网页代码中指定内容? 某数据库网页结构如下: html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http ...
- php依次替换文本字符串中的图片src地址
比如有这样的一段代码: <p><img _src="/tt.jpg" src="http://www.sjmoban.com/tt.jpg" ...
- 提取HTML代码中文字的C#函数
/// <summary> /// 去除HTML标记 /// </summary> /// <param name="strHtml"&g ...
- shell脚本提取一个文件中的合法email地址
#! /bin/bash function read_file(){ for i in `cat $1` do if [ `echo $i |grep "^[a-zA-Z0-9_-]*@[A ...
- js获取html代码中所有图片地址
/** * JS获取html代码中所有的图片地址 * @param htmlstr * @returns imgsrcArr 数组 */ function getimgsrc(htmlstr) { v ...
- 2018-11-02 在代码中进行中文命名实践的短期目标
对中文命名的意义不再赘述, 请参看之前的对在代码中使用中文命名的质疑与回应. 去年中文命名实践的阻力和应对之后, 在一些小项目中继续实践了中文命名(Java/JS/Python等, 详见之前的专栏文章 ...
- C#正则表达式提取HTML中IMG标签的SRC地址(转)
一般来说一个 HTML 文档有很多标签,比如"<html>"."<body>"."<table>"等,想 ...
- C++ 提取代码中的函数
输入一段代码,输出这段代码中包含的所有函数 ASCII码表 #include<iostream> #include<fstream> #include<cstring&g ...
最新文章
- Memcache内存分配策略
- python功能性爬虫案例_Python使用requests及BeautifulSoup构建爬虫实例代码
- Spark算子汇总和理解(详细)
- 使用sn.exe为程序集签名
- 激光雷达选型指南 这2项重要指标却被很多人忽略
- PP模块入门考试试题,看看能得多少分吧!
- mysql的每隔1分钟定时_深入研究MySQL(四)、备份与恢复
- 手把手带你玩转Tensorflow 物体检测 API (3)——训练模型
- 2021年高考成绩查询2,2021年高考成绩公布后几天填报志愿
- html页面酷炫,5个酷炫、实用的HTML标签和属性介绍
- STM8S 低功耗模式
- ogg格式怎样才能转换成mp3
- PRINCE2与PMP含金量对比
- 易语言单窗口单ip软件源码_易语言助手下载-易语言助手 v3.2.0701 官方版
- COleDateTime和COleDateTimeSpan类
- IntellIdea 注册码
- 互动游戏对战平台推荐:盘点很火的互动小游戏多人对战平台
- android充电信息代码,【代码】android 关机充电
- 典型相关分析原理(例题+代码)
- 如何动态设置Picture图形控件的位图
热门文章
- PyTorch 入坑九:权重初始化
- logistic regression及其Python实现
- mybatis mysql 模糊查询语句_mybatis+Spring mysql的模糊查询问题
- givemesomecredit数据_EasyEnsemble:一种简单的不平衡数据的建模方法(附测试代码)...
- mysql+基本代码_PHP+MySQL扎实基本功十句话_php
- java海滩上有一_海滩上有一堆桃子,五只猴子来分-海滩上有一堆桃子,五只猴子来分java实现-吾爱编程网...
- sql查询百分之20到百分之40的数据_FOCUS数据管理之ETL监控
- 割线法求解过程_浸入边界法求解流固耦合问题
- 如何在Linux,Ubuntu,CentOS上安装Java 14
- struts2数据库操作_Struts 2操作错误和操作消息