1.有url获取到网页源代码:

using System.Web;

using System.IO;

using System.Net;

private void GetHtmlinfo(string PageUrl)

{

WebRequest request = WebRequest.Create(PageUrl);

WebResponse response = request.GetResponse();

Stream resStream = response.GetResponseStream();

StreamReader sr = new StreamReader(resStream, System.Text.Encoding.UTF8);

string htmlinfo = sr.ReadToEnd();

resStream.Close();

sr.Close();

}

2.获取标签中的值:

using System.Text.RegularExpressions;

/// 获取字符中指定标签的值

///

/// 字符串

/// 标签

/// 值

public static string GetTitleContent(string str, string title1, string title2)

{

string tmpStr = string.Format("]*?>(?[^", title1, title2); //获取之间内容

Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);

string result = TitleMatch.Groups["Text"].Value;

return result;

}

Example:

HTML 源文件:现排名:20

Parameter: title1 = @"span class=""t1_tx"">现排名:

title2 - "b";

3.获取标签中的属性:

/// 获取字符中指定标签的值

///

/// 字符串

/// 标签

/// 属性名

/// 属性

public static string GetTitleContent(string str, string title,string attrib)

{

string tmpStr = string.Format("]*?{1}=(['\"\"]?)(?[^'\"\"\\s>]+)\\1[^>]*>", title, attrib); //获取之间内容

Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);

string result = TitleMatch.Groups["url"].Value;

return result;

}

[转载]C#用正则表达式 获取网页源代码标签的属性或值

最近调试程序需要用到获取网页指定标签的属性和值,找到了一个比较好的正则匹配方法,特此备份. [原]C#用正则表达式 获取网页源代码标签的属性或值 整理两个 在C#中,用正则表达式 获取网页源代码标签的 ...

C#用正则表达式 获取标签的属性或值

整理两个 在C#中,用正则表达式 获取网页源代码标签的属性或值的方法 : 1.获取标签中的值: string str="

delphi 获取网页源代码

//获取网页源代码 var   s: string; begin   s := WebBrowser1.OleObject.document.body.innerHTML; //body内的所有代码 ...

Java 网络爬虫获取网页源代码原理及实现

Java 网络爬虫获取网页源代码原理及实现 1.网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL ...

c#利用WebClient和WebRequest获取网页源代码的比较

前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...

JS远程获取网页源代码的例子

js代码获取网页源代码. 代码: html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &lt ...

c#利用WebClient和WebRequest获取网页源代码

C#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现.   WebClient类获取网页源代码   WebClient类   WebClient ...

c#利用HttpWebRequest获取网页源代码

c#利用HttpWebRequest获取网页源代码,搞了好几天终于解决了,直接获取网站编码进行数据读取,再也不用担心乱码了! 命名空间:Using System.Net private static ...

js技术要点---JS 获取网页源代码

JS 获取网页源代码

随机推荐

Linux_10个需要了解的Linux网络和监控命令(转)

源文地址:http://www.linuxde.net/2013/10/15325.html 1. hostname hostname 没有选项,显示主机名字 hostname –d 显示机器所属域名 ...

gulp watch error ENOSPC

in linux you fix this with the command:echo fs.inotify.max_user_watches=524288 | sudo tee -a /etc/sy ...

Java的多线程机制系列:(三)synchronized的同步原理

synchronized关键字是JDK5之实现锁(包括互斥性和可见性)的唯一途径(volatile关键字能保证可见性,但不能保证互斥性,详细参见后文关于vloatile的详述章节),其在字节码上编译为 ...

http://backboneconf.com/ @前端 真好

http://backboneconf.com/ @前端http://backboneconf.com/ @前端http://backboneconf.com/ @前端http://backbonec ...

An erroroccurred while filtering resources

maven报错: maven An error occurred while filtering resources Maven -> Update Project... resolved th ...

@ControllerAdvice详解

@ControllerAdvice,是Spring3.2提供的新注解,从名字上可以看出大体意思是控制器增强.让我们先看看@ControllerAdvice的实现:   package org.spri ...

Android Studio--gradle:download 过慢甚至超时timeout报错

问题描述 今天第一次学习安卓,配置环境花了不少时间其他都比较容易的解决了 gradle 因为会从外国的网站下载东西会非常的慢(具体原理我也不清楚),所以最好让下载地址变成国内的 解决方案(最后有升级方 ...

一个简单的makefile文件

一个简单的makefile文件:可以编译指定目录下的所有c和cpp文件,暂未加入自动头文件的依赖. #!/bin/bash #编译器 CROSS_COMPILING_PATH = #源文件路径 VPA ...

Spring整体了解

1.spring原理 内部最核心的就是IOC了,动态注入,让一个对象的创建不用new了,可以自动的生产,这其实就是利用java里的反射,反射其实就是在运行时动态的去创建.调用对象,Spring就是 ...

JVM规范系列第1章:引言

如果你还没下载这本书,那么先点击这里下载再一块儿看吧. 前言 Java 虚拟机是一个抽象化的机器,整个规范中提及的 Java 虚拟机都是抽象化的概念,而不是特指 Or ...

c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...相关推荐

  1. mysql数据库中,查询一个表的下一条数据减上一条数据的值的写法

    mysql数据库中,查询一个表的下一条数据减上一条数据的值的写法: select a.nodeId,a.cpuCharge-b.cpuCharge cpuCharge, a.chargeTime fr ...

  2. java获取页面标签_java获取网页源代码后,提取标签内容……

    java获取网页源代码后,提取标签内容-- 关注:245  答案:2  mip版 解决时间 2021-02-01 09:11 提问者咏bù琂败 2021-01-31 13:49 import java ...

  3. 用 Python selenium爬取股票新闻并存入mysql数据库中带翻页功能demo可下载

    用 Python selenium爬取实时股票新闻并存入mysql数据库中 1.分析需求 2.创建表 3.分析需要爬取的网页内容 4.python里面selenium进行爬虫操作 1.添加包 2.连接 ...

  4. 利用SQL语句查找某数据库中所有存储过程包含的内容

    查找存储过程包含内容 Use 数据库 DECLARE @ProcName varchar(50) Create Table #tmpName(Content  varchar(2000)) Creat ...

  5. 获取xml里的某个属性的值,并把值写入到文件中

    需求:需要找出xml里的某个特定属性的值并把值复制到一个.properties文件中,目的是做成字典,进行字段映射:要求字段不能重复. 实现:如果字段少的话,直接复制粘贴就行了,但是字段很多,算上重复 ...

  6. QT利用lamda正则表达式取出字符串中的浮点数与整数

    文章目录 前言 一.待取的数据格式 二.Qt使用正则表达式 1.加入头文件 2.cpp中代码 2.读取到的数据 总结 前言 利用正则表达式实现取出一串字符串中的浮点数与正整数 一.待取的数据格式 以下 ...

  7. 用正则表达式取出table中的所有行(支持嵌套table)

    此是通过csdn询问得高人之手写的. 谢谢gzdiablo 表达式: <tr[^>]*>(?:(?:\s|\S)*?(?=<table|</tr>)(?(<t ...

  8. java读取excel数据保存到数据库中_java读取excel的内容(可保存到数据库中)

    //** poi jar包 // public classReadExcel { @SuppressWarnings("static-access")private staticS ...

  9. f12获取网页文本_怎么获取网页源代码中的文件?

    展开全部 易语言如何取网页源码: 1.首先,运行"易语言"主程序,弹出"新建工程32313133353236313431303231363533e4b893e5b19e3 ...

最新文章

  1. 微服务架构及其最重要的 10 个设计模式!
  2. 递归算法——汉诺塔问题
  3. 遍历聚合对象中的元素——迭代器模式(二)
  4. 牛客题霸 [跳台阶] C++题解/答案
  5. python代码可以内嵌在asp文件中_在IE中使用Python作为开发脚本(转)
  6. 花书+吴恩达深度学习(十一)卷积神经网络 CNN 之池化层
  7. Visual Studio的.NET内存分配分析器解析
  8. 云-PC-matlab-物联网及其它
  9. 【新手必看】C语言开发环境,请查收!
  10. JAVA Future类详解
  11. 使用consul注册中心要求服务以自定义instance-id形式注册
  12. 音视频基础学习之【01.基于ffmpeg的简单播放器demo实现】
  13. kvm 监控内存,替换页表(linux版的win VT晶核)(这个整复杂了,不用小内核也可以实现,留着吧,主要记录了bootLoad的启动过程)
  14. Hadoop 新手填坑指南
  15. 经过离散点画平滑曲线(贝塞尔3次)
  16. 《Go语言精进之路,从新手到高手的编程思想、方法和技巧1》读书笔记和分享
  17. VBA—压缩文件夹成一个rar压缩包
  18. 修改滚动条样式的方法
  19. 把backtrader改造成金融强化学习回测引擎
  20. 【北邮国院大三上】互联网协议_Internet Protocol_PART A

热门文章

  1. 【腾讯出品】2019互联网行业趋势报告
  2. 如何对待逐渐疏远的朋友?
  3. RT-Thread 简介 https://www.rt-thread.org/
  4. mysql信息函数和加密函数_MYSQL 常用函数(数学、字符串、日期时间、系统信息、加密)...
  5. 4月1日起 理想ONE零售价由33.8万元上调至34.98万元
  6. 在这个功能上,iOS 落后 Android 了
  7. 郭明錤:因设计复杂 苹果可能推迟至明年底生产AR/VR头盔
  8. Redmi K40S难产:缺芯是根本原因 明年或有望缓解
  9. 何小鹏退出UC浏览器母公司股东名单
  10. 特斯拉Model Y在6月份销售7500辆 是Model X两倍多