做项目分享的时候要抓取网页里面的图片,及视频,标头。当然要取到这些东西之前,必须把源文件读出来

,拿到源文件之后就用JS正则取图片和视频了(JS正则还不完美,先不贴)

C#抓取网页源文件代码如下:

using System; using System.Data; using System.Configuration; using System.Collections; using System.Web; using System.Web.Security; using System.Web.UI; using System.Web.UI.WebControls; using System.Web.UI.WebControls.WebParts; using System.Web.UI.HtmlControls; using System.Net; using System.IO; using System.Text; namespace WebApplication3 { public partial class _Default : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { if (!IsPostBack) { tb.Text = ""; try { WebRequest request = WebRequest.Create("http://v.youku.com/v_show/id_XMTMxMzQyOTQ0.html"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("UTF-8")); tb.Text = reader.ReadToEnd(); reader.Close(); reader.Dispose(); response.Close(); } catch (Exception ex) { tb.Text = ex.Message; } } } } }

ASP.NET 抓取网页源文件相关推荐

  1. asp.net 初步入门使用正则抓取网页信息

    今天闲着没事看了看使用正则的使用,之前只是用来做验证,第一次用来抓取网页, 抓去了博客园首页几个分页的推荐文章列表.... 代码很简单就不做解释了,肯定做得不严谨,主要是熟悉下几个正则类和用于抓取网页 ...

  2. ASP.NET抓取网页内容

    原文:ASP.NET抓取网页内容 一.ASP.NET 使用HttpWebRequest抓取网页内容 这种方式抓取某些页面会失败 不过,有时候我们会发现,这个程序在抓取某些页面时,是获不到所需的内容的, ...

  3. .NET2.0抓取网页全部链接【月儿原创】

    .NET2.0抓取网页全部链接 作者:清清月儿 主页:http://blog.csdn.net/21aspnet/           时间:2007.4.18 该方法经过对各大门户网站测试结果是抓取 ...

  4. ASP.NET 抓取网页内容

    (转)ASP.NET 抓取网页内容 ASP.NET 抓取网页内容-文字 ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题. 需要三个类:WebRequest. ...

  5. php curl_setopt抓取内容,PHP的CURL方法curl_setopt()函数案例介绍(抓取网页,POST数据)

    通过curl_setopt()函数可以方便快捷的抓取网页(采集很方便),curl_setopt 是php的一个扩展库 使用条件:需要在php.ini 中配置开启.(PHP 4 >= 4.0.2) ...

  6. matlab抓取网页信息,如何利用Matlab抓取网页数据

    如何利用Matlab抓取网页数据 2019-01-01 %朋友需要做金融方面的分析,要求从网站上下载大量的数据,一个一个复制粘贴太费事.我写了一个简单的网络爬虫,主要用到正则表达式,可以自动下载网页源 ...

  7. Linux 抓取网页实例(shell+awk)

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 上一篇博 ...

  8. 爬取html数据中文乱码,解决PHP中file_get_contents抓取网页中文乱码问题

    根据网上有朋友介绍说原因可能是服务器开了GZIP压缩. 下面是用firebug查看我的博客的头信息,Gzip是开了的. 请求头信息原始头信息 代码如下 复制代码 Accept text/html,ap ...

  9. 利用HttpURLConnection抓取网页取名

    闲来无事,利用Java 的HttpURLConnection,使用多线程来抓取网页,计算名字的分数. 仅供娱乐. 程序如下 import java.io.BufferedReader; import ...

  10. Python 多线程抓取网页 牛人 use raw socket implement http request great

    Python 多线程抓取网页 - 糖拌咸鱼 - 博客园 Python 多线程抓取网页 最近,一直在做网络爬虫相关的东西. 看了一下开源C++写的larbin爬虫,仔细阅读了里面的设计思想和一些关键技术 ...

最新文章

  1. 小样本点云深度学习库_2019-01-07-小样本深度学习
  2. 如何将adb shell里面查到的文件复制到本地电脑
  3. android 设备名称_如何更改您的Android TV的设备名称
  4. Python可变与不可变类型及垃圾回收机制
  5. 简单英文题 16 Maximum Sum Not Exceeding K(python)
  6. aix Mysql-Rpm puppet puppetAgent
  7. 计算机任务管理器恢复默认,关于任务管理器的一个问题??
  8. maxcompute操作_MaxCompute问答整理之9月
  9. 技能大赛 计算机 融合 研究,技能大赛与高职计算机教学的融合研究.doc
  10. 谈谈javascript中原型继承
  11. Linux下挂载和格式化虚拟磁盘图文教程
  12. 不知道Word转图片PDF怎么转?1分钟帮你快速转换
  13. mysql消除冗余_mysql剔除冗余数据
  14. 数据结构单向链表(C++)
  15. VIPKID前端面试题
  16. 字体大宝库:12款好看的手写艺术字体免费下载
  17. RTP/RTCP 和 SRTP/SRTCP协议
  18. android 手机型号占有量,2021年安卓手机性能排行及手机品牌占有率
  19. ZYNQ之路--搞清楚Xilinx开发软件之间的关系
  20. 音视频OSD——将64*64的GB2312字库的信息叠加至YUV图像

热门文章

  1. 捡到的苹果手机怎么解id锁_苹果手机维修中软解与硬解的区别
  2. 20172302 《Java软件结构与数据结构》第五周学习总结
  3. 2020全球搜索引擎市场份额排行榜
  4. LeetCode刷题笔记——(8/17 - 8/27)
  5. 2021云蓝课c++填空第4题(B)
  6. 《爱的五种能力》读书笔记22.02
  7. SmartBI入门(二)配置SmartBI
  8. 数据库系统概论(第5版)王珊 详细知识清单 期末复习速成 考前冲刺 面试——(第一篇 基础篇)
  9. 【概率】甲乙射击比赛,单局甲胜率0.6,3局2胜和5局3胜两种赛制甲如何选择?无限多局,甲获胜概率?
  10. 12306网站专家:拟采取办法应对抢票软件