ASP.NET 抓取网页源文件
做项目分享的时候要抓取网页里面的图片,及视频,标头。当然要取到这些东西之前,必须把源文件读出来
,拿到源文件之后就用JS正则取图片和视频了(JS正则还不完美,先不贴)
C#抓取网页源文件代码如下:
using System; using System.Data; using System.Configuration; using System.Collections; using System.Web; using System.Web.Security; using System.Web.UI; using System.Web.UI.WebControls; using System.Web.UI.WebControls.WebParts; using System.Web.UI.HtmlControls; using System.Net; using System.IO; using System.Text; namespace WebApplication3 { public partial class _Default : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { if (!IsPostBack) { tb.Text = ""; try { WebRequest request = WebRequest.Create("http://v.youku.com/v_show/id_XMTMxMzQyOTQ0.html"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("UTF-8")); tb.Text = reader.ReadToEnd(); reader.Close(); reader.Dispose(); response.Close(); } catch (Exception ex) { tb.Text = ex.Message; } } } } }
ASP.NET 抓取网页源文件相关推荐
- asp.net 初步入门使用正则抓取网页信息
今天闲着没事看了看使用正则的使用,之前只是用来做验证,第一次用来抓取网页, 抓去了博客园首页几个分页的推荐文章列表.... 代码很简单就不做解释了,肯定做得不严谨,主要是熟悉下几个正则类和用于抓取网页 ...
- ASP.NET抓取网页内容
原文:ASP.NET抓取网页内容 一.ASP.NET 使用HttpWebRequest抓取网页内容 这种方式抓取某些页面会失败 不过,有时候我们会发现,这个程序在抓取某些页面时,是获不到所需的内容的, ...
- .NET2.0抓取网页全部链接【月儿原创】
.NET2.0抓取网页全部链接 作者:清清月儿 主页:http://blog.csdn.net/21aspnet/ 时间:2007.4.18 该方法经过对各大门户网站测试结果是抓取 ...
- ASP.NET 抓取网页内容
(转)ASP.NET 抓取网页内容 ASP.NET 抓取网页内容-文字 ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest. ...
- php curl_setopt抓取内容,PHP的CURL方法curl_setopt()函数案例介绍(抓取网页,POST数据)
通过curl_setopt()函数可以方便快捷的抓取网页(采集很方便),curl_setopt 是php的一个扩展库 使用条件:需要在php.ini 中配置开启.(PHP 4 >= 4.0.2) ...
- matlab抓取网页信息,如何利用Matlab抓取网页数据
如何利用Matlab抓取网页数据 2019-01-01 %朋友需要做金融方面的分析,要求从网站上下载大量的数据,一个一个复制粘贴太费事.我写了一个简单的网络爬虫,主要用到正则表达式,可以自动下载网页源 ...
- Linux 抓取网页实例(shell+awk)
分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 上一篇博 ...
- 爬取html数据中文乱码,解决PHP中file_get_contents抓取网页中文乱码问题
根据网上有朋友介绍说原因可能是服务器开了GZIP压缩. 下面是用firebug查看我的博客的头信息,Gzip是开了的. 请求头信息原始头信息 代码如下 复制代码 Accept text/html,ap ...
- 利用HttpURLConnection抓取网页取名
闲来无事,利用Java 的HttpURLConnection,使用多线程来抓取网页,计算名字的分数. 仅供娱乐. 程序如下 import java.io.BufferedReader; import ...
- Python 多线程抓取网页 牛人 use raw socket implement http request great
Python 多线程抓取网页 - 糖拌咸鱼 - 博客园 Python 多线程抓取网页 最近,一直在做网络爬虫相关的东西. 看了一下开源C++写的larbin爬虫,仔细阅读了里面的设计思想和一些关键技术 ...
最新文章
- 小样本点云深度学习库_2019-01-07-小样本深度学习
- 如何将adb shell里面查到的文件复制到本地电脑
- android 设备名称_如何更改您的Android TV的设备名称
- Python可变与不可变类型及垃圾回收机制
- 简单英文题 16 Maximum Sum Not Exceeding K(python)
- aix Mysql-Rpm puppet puppetAgent
- 计算机任务管理器恢复默认,关于任务管理器的一个问题??
- maxcompute操作_MaxCompute问答整理之9月
- 技能大赛 计算机 融合 研究,技能大赛与高职计算机教学的融合研究.doc
- 谈谈javascript中原型继承
- Linux下挂载和格式化虚拟磁盘图文教程
- 不知道Word转图片PDF怎么转?1分钟帮你快速转换
- mysql消除冗余_mysql剔除冗余数据
- 数据结构单向链表(C++)
- VIPKID前端面试题
- 字体大宝库:12款好看的手写艺术字体免费下载
- RTP/RTCP 和 SRTP/SRTCP协议
- android 手机型号占有量,2021年安卓手机性能排行及手机品牌占有率
- ZYNQ之路--搞清楚Xilinx开发软件之间的关系
- 音视频OSD——将64*64的GB2312字库的信息叠加至YUV图像
热门文章
- 捡到的苹果手机怎么解id锁_苹果手机维修中软解与硬解的区别
- 20172302 《Java软件结构与数据结构》第五周学习总结
- 2020全球搜索引擎市场份额排行榜
- LeetCode刷题笔记——(8/17 - 8/27)
- 2021云蓝课c++填空第4题(B)
- 《爱的五种能力》读书笔记22.02
- SmartBI入门(二)配置SmartBI
- 数据库系统概论(第5版)王珊 详细知识清单 期末复习速成 考前冲刺 面试——(第一篇 基础篇)
- 【概率】甲乙射击比赛,单局甲胜率0.6,3局2胜和5局3胜两种赛制甲如何选择?无限多局,甲获胜概率?
- 12306网站专家:拟采取办法应对抢票软件