C#用正则表达式 获取网页源代码标签的属性或值
整理两个 在C#中,用正则表达式 获取网页源代码标签的属性或值的方法 :
1、获取标签中的值: <a href="www.csdn.net" class="main" >CSDN</a>
/// <summary>/// 获取字符中指定标签的值/// </summary>/// <param name="str">字符串</param>/// <param name="title">标签</param>/// <returns>值</returns>public static string GetTitleContent(string str, string title){string tmpStr = string.Format("<{0}[^>]*?>(?<Text>[^<]*)</{1}>", title, title); //获取<title>之间内容Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);string result = TitleMatch.Groups["Text"].Value;return result;}
2、获取标签中的属性: <a href="www.csdn.net" class="main">CSDN</a>
/// <summary>/// 获取字符中指定标签的值/// </summary>/// <param name="str">字符串</param>/// <param name="title">标签</param>/// <param name="attrib">属性名</param>/// <returns>属性</returns>public static string GetTitleContent(string str, string title,string attrib){string tmpStr = string.Format("<{0}[^>]*?{1}=(['\"\"]?)(?<url>[^'\"\"\\s>]+)\\1[^>]*>", title, attrib); //获取<title>之间内容Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);string result = TitleMatch.Groups["url"].Value;return result;}
C#用正则表达式 获取网页源代码标签的属性或值相关推荐
- c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...
1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...
- C#用正则表达式 获取标签的属性或值
整理两个 在C#中,用正则表达式 获取网页源代码标签的属性或值的方法 : 1.获取标签中的值: string str="<a href=\"www.csdn.net\&quo ...
- html标签默认值,HTML标签CSS属性默认值汇总
HTML标签CSS属性默认值,在你需要还原默认值的时候比较有用. 以前一直在找这份文档,今天偶然在网上看到了.除了inline和block的定义,主要是要注意body|h1~h6|blockquote ...
- java获取页面标签_java获取网页源代码后,提取标签内容……
java获取网页源代码后,提取标签内容-- 关注:245 答案:2 mip版 解决时间 2021-02-01 09:11 提问者咏bù琂败 2021-01-31 13:49 import java ...
- 获取网页源代码 python_python 获取网页源代码
import re #正则表达式模块 import urllib.request import time #时间模块 import string #字符串模块 def getHtml(url):f=u ...
- python selenium 获取网页源代码
获取网页源代码: 引入组件:[from selenium import webdriver]. [from selenium.webdriver.chrome.options import Optio ...
- 使用 Python3 获取网页源代码
爬虫的数据爬取量非常大,显然不可能对每个页面都手动复制源代码,因此就有必要使用自动化的方式来获取网页源代码.requests是Python的一个第三方HTTP(Hypertext Transfer P ...
- 4.1 使用Python获取网页源代码
1)第三方库的安装 a.在线安装 pip install 第三方库名 b.本地安装 下载对应版本的.whl文件,然后cd到文件目录下,通过 pip install xxx.whl 2)使用reques ...
- 获取网页源代码的最简单办法
获取网页源代码的最简单办法,就是利用 WinInet 单元中的函数: Code uses WinInet; function GetWebPage(const Url: string):string; ...
- c#利用WebClient和WebRequest获取网页源代码的比较
前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...
最新文章
- GCC 参数列举及解释
- 深蓝词库转换1.2版本发布——支持紫光拼音和拼音加加
- 《数据库SQL实战》查找employees表
- python列表函数方法_与Python列表相关的函数
- MySQL 正则表达式查询
- 这不关我的事,别烦我!
- C语言中利用switch语句和 if--else 语句输出,,闰年或平年,及每月对应的天数。
- mysql binlog DDL_MySQL binlog原理及应用
- 吃是为了肉体,喝是为了灵魂
- hdoj 3400 三分
- 计算机病毒是通过内存传播吗,计算机病毒的工作过程
- Jupyterlab 执行时间插件
- 使用PHP和NetBeans创建基于XAMPP的动态网页(学习笔记7)(技术笔记7)网站应用和服务器管理 澳大利亚维多利亚大学VIT1204 Web Application and
- 国庆锦鲤大礼包,还不Pick一下~
- 裸金属服务器能虚拟化吗,市场需求多样化,裸金属服务器如何“吃得开”?
- 微软新版edge浏览器如何开启画中画模式
- git改变用户名和邮箱
- 关于Oracle执行sql语句报错[ORA-01722: invalid number]无效数字解决思路
- 1.js变量、作⽤域和引⽤类型,js制作页。
- 艺宁书局-专业经营原版国外电子书