using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.IO;//引用流
using System.Net;
using System.Text.RegularExpressions;//引用网页namespace WindowsFormsApplication8
{public partial class Form1 : Form{public Form1(){InitializeComponent();}private string thtxt(string q){Regex reg = new Regex("<(.|\n)+?>");//Regex r = new Regex(@"\s+");//把空格替换掉的正则表达式string th = reg.Replace(q, "");th = th.Replace("<", "<");th = th.Replace(">", "");//th = r.Replace(th,"");return th;}private void button1_Click(object sender, EventArgs e)//抓取网页,在richtextbox1中显示出网页的源代码
        {WebRequest wr = WebRequest.Create(textBox1.Text.Trim());//接收按钮2里输入的网址的文本内容WebResponse wtr = wr.GetResponse();//得到一个网址的回应Stream a = wtr.GetResponseStream();//用流来读取StreamReader s = new StreamReader(a,Encoding.UTF8);string q= s.ReadToEnd();//定义一个string类型的来接受它string th = thtxt(q);//调用上面去乱码的函数,把里面的符号全部去掉。a.Close();//使用完把流给关掉richTextBox1.Text = th;StreamWriter c = new StreamWriter("E:\\1.txt");//桌面上新建一个测试的内容,吧截下来的文本保存在这个文本档里。//把截取好的文本内容从流里输出出来c.WriteLine(th);//输出c.Close();//把流给关掉
             wtr.Close();if (q.IndexOf("红|袖|言|情|小|说") > 0){int sub = q.IndexOf("红|袖|言|情|小|说");//添加一个网址的索引int xub = q.IndexOf("最后放弃");//从这里截取//+4 (“好了,收工”)这4个字的索引不被截取,+4就是这五个字都显示在文本,否则会被删掉string w = q.Substring(sub, xub - sub + 4);richTextBox1.Text = w;//让显示框里吧截取好的文本内容给显示出来。//引用一个流把它截取下来的内容存到一个文件里
             }else{MessageBox.Show("您没有获得数据");}}}
}

转载于:https://www.cnblogs.com/w-wz/p/4587711.html

winfrom 从网页中通过源代码截取文章相关推荐

  1. html 选择自动增加行数,为网页中的源代码自动设置行号

    本文演示了如何为网页中的源代码块自动设置行号. 现在,我们准备在网页中显示C++的Hello world.这段著名的代码如下所示: #include intmain() { std::cout < ...

  2. 如何读懂网页中的源代码?

    要读懂网页中的源代码,需要了解 HTML.CSS 和 JavaScript 等相关技术. HTML:网页的结构和内容都是由 HTML 代码构建的,因此要读懂网页,需要先了解 HTML.可以通过学习 H ...

  3. 如何查找网页中的源代码文件

    我在看往年的前端项目代码,发现自己之前的方法找不到相对应的源代码文件具体在哪里. 随后我找到了一个新的方法 1.F12调出界面 2.然后按图上点击图标,点击自己需要寻找的部分,然后在元素里面弄出htm ...

  4. 阿拉伯语在网页中排版问题解决

    阿拉伯语在网页中排版问题解决 参考文章: (1)阿拉伯语在网页中排版问题解决 (2)https://www.cnblogs.com/tdalcn/p/8391914.html 备忘一下.

  5. 网页中审查元素(按F12)与查看网页源代码的区别

    在网页中右键,如图: 所谓查看源代码,就是别人服务器发送到浏览器的原封不动的代码. 审查元素时,你看到那些,在源代码中找不到的代码,是在浏览器执行js动态生成的. 通过审查元素看到的就是最终的html ...

  6. php中表格的美化,美化网页中的Table表格样式 - 文章教程

    Table表格曾经是网页布局的霸主,可惜现在用的少了,主要还是用在表现表格结构化数据的布局,虽说用得少,但是表格用起来还是很方便的,至少有时候比DIV+CSS更方便,关于如何美化网页中的Table表格 ...

  7. 在HTML网页中巧用URL

    http://www.cnbruce.com/blog/showlog.asp?cat_id=5&log_id=657 首先,先放出一个地址给大家测试 http://cnbruce.com/t ...

  8. C# 网络编程之webBrowser获取网页url和下载网页中图片

    该文章主要是通过C#网络编程的webBrowser获取网页中的url并简单的尝试下载网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识.正则表达式实现浏览.获取url.下 ...

  9. html 显示代码块,使用Pre在文章中显示代码块 - 文章教程

    作为技术博客,难免会在文章中插入一部分代码块,代码具有一定的格式,所以很自然就会使用 标签,其在使用上与 等其他标签没有太大区别,但由于其会保留标签中所有的空白与换行,因此在使用时还是有几个地方是需要 ...

最新文章

  1. linux数字大小判断,if 判断两个数值大小--多分支if语句实现对参数的严格判断
  2. python里countsget_在Python中测试访问同一数据的竞争条件的方法
  3. OpenGL生成的法线贴图并增加光照
  4. 通过lseek产生空洞文件
  5. 使用内存映射文件获取巨大的矩阵
  6. 458. 可怜的小猪
  7. django 1.8 官方文档翻译: 5-1-1 使用表单
  8. JavaScript-箭头函数
  9. bootstrap入门-1.可视化布局
  10. 实验十三——DD和S-MAC协议仿真实验
  11. Coverage [minx,miny,maxx,maxy] is [12, 4, 13, 6, 3], index [x,y,z] is [2, 5, 3]错误原因及其解决方式...
  12. 可能是最好的正则表达式的教程笔记了吧...
  13. Java获得随机数的几种方法
  14. GPA计算(5.0分制)
  15. 第三届厦门国际银行数创金融杯金融营销建模大赛-BaseLine
  16. Go语言处理Windows系统的图标ICO文件(下)
  17. FreeType移植到 STM32 单片机以支持矢量字体
  18. 王爽汇编语言 实验15
  19. 【每周一读】——你的孤独,虽败犹荣
  20. java电商和企业项目_java电商和企业项目

热门文章

  1. mysql数据库的字符集_mysql数据库中字符集乱码问题原因及解决
  2. 7 centos 时钟跟物理机同步_centos7上使用chrony自动同步时间
  3. 先天性脑部发育异常_儿童脑发育不良的3大“诱因”,若孩子出现这5种异常,要警惕...
  4. ccf魔数c语言,ccf 201609-4 交通规划
  5. 同步请求和ajax请求,ajax 同步请求和异步请求的差异分析
  6. php开发添加表情功能,WordPress网站评论区如何实现添加表情包功能?
  7. php 自动切图,前端工程师技能之photoshop巧用系列扩展篇自动切图
  8. 山东大学 2020级数据库系统 实验七
  9. 用体元滤波器进行降低采样
  10. 教师网络计算机研修日志,教师网络研修日志