看了好久有关新闻小偷的文章,在PHP里找到了一个很好的文章抓区工具,功能特别好,可还是没有找到一个好的新闻小偷的例子,所以我决定自己写,也仿照了别人的代码
下面是一个获取HTML也一段代码

string str = "http://www.sooboo.com.cn/Services/NewsList.aspx";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(str);
        request.Method = "Get";
        request.ContentType = "application/x-www-form-urlencoded";
        WebResponse response = request.GetResponse();
        Stream s = response.GetResponseStream();
        StreamReader sr = new StreamReader(s, System.Text.Encoding.GetEncoding("utf-8"));
        string html = sr.ReadToEnd();
        s.Close();
        sr.Close();
 Response.Write(htm);

以上这部分没问题了成功,哈哈
我们在说下一步
分析代码,代码我们是获取到了,但是我们怎么样才能提取到我们想要的东西呢, 例如,新闻标题,URL,时间等
在看我下面的一段代码

public string[] GetData(string Html)
    {
        String[] rS = new String[2];为什么这里要2位的数组
        string s = Html;
        s = Regex.Replace(s, "\\s{3,}", "");
        s = s.Replace("\r", "");
        s = s.Replace("\n", "");

        string Pat = "<td align=\"center\" class=\"24p\"><B>(.*)</B></td></tr><tr>.*(<table width=\"95%\" border=\"0\" cellspacing=\"0\" cellpadding=\"10\">.*</table>)<table width=\"98%\" border=\"0\" cellspacing=\"0\" cellpadding=\"0\">(.*)<td align=center class=l6h>";
        string pt = "<a href='(.*)'";
        Regex Re = new Regex(pt);
        Match Ma = Re.Match(s);//我想实现以下功能,第一获取网站左右的URL和连接标题, 我自己写了几个表达式,但是都得不到满意的效果,大家帮忙想想
        if (Ma.Success)
        {
            rS[0] = Ma.Groups[1].ToString();
            rS[1] = Ma.Groups[2].ToString();
           string  pgStr = Ma.Groups[3].ToString();
        }
        Response.Write(Ma.Groups.Count);
        Response.Write(rS[0].ToString());
        Response.Write(rS[1].ToString());
        return rS;
       
    }

现在的问题就出现了,第一怎么样获取文章标题和连接啊,主要也就是对HTML的分析,高手们一起讨论一下吧,互相学习
就用http://www.sooboo.com.cn/Services/NewsList.aspx这个地址来分析吧

转载于:https://www.cnblogs.com/sujingnan/archive/2008/03/21/1116563.html

我专严新闻小偷之心得与大家交流相关推荐

  1. 网站发布网(发布号) 海量热点新闻小偷程序 V1.2

    网站发布网(发布号) 海量热点新闻小偷程序 V1.2 PHP版小偷程序 海量数据 下载:https://www.qzqcw.com/qzqcw.zip 发布号新闻:https://www.qzqcw. ...

  2. 网站发布网(发布号) 自媒体新闻小偷程序伪静态版 V1.0

    网站发布网(发布号) 自媒体新闻小偷程序伪静态版 V1.0 演示:https://news.aikisport.com/ 下载:https://news.aikisport.com/wzfbw.rar ...

  3. 苏大计算机学院出国交流,新闻 | 2019年苏州大学国际化工作交流和推进会顺利举办...

    原标题:新闻 | 2019年苏州大学国际化工作交流和推进会顺利举办 苏大国际 官方信息发布平台 关注 为加快推进学校"双一流"建设,加强我校国际化工作效能建设,提升国际化工作管理队 ...

  4. sina网页新闻小偷原理及源代码(java版) .

    在网上看到网页小偷,有偷笑话的有偷天气的...最可笑的是GOOGLE上有个人发布了一篇文章,说是js版本的,我打开一看,language=vbscript.......还被很多人引用,一搜网页小偷,都 ...

  5. sina网页新闻小偷原理及源代码(java版)

    在网上看到网页小偷,有偷笑话的有偷天气的...最可笑的是GOOGLE上有个人发布了一篇文章,说是js版本的,我打开一看,language=vbscript.......还被很多人引用,一搜网页小偷,都 ...

  6. 网站发布网(发布号) 海量热点新闻小偷程序 V1.0

    发布时间:2019.5.18 演示:http://xw.qzqcw.com 下载:http://xw.qzqcw.com/wzfbw.rar 官方:https://www.wzfbw.com 移动版: ...

  7. ASP VBS xmlhttp adodbstream下载和保存图片(新闻小偷)

    函数: function saveFile(data,recfilen)     set Astream=CreateObject("Adodb.Stream")'asp Serv ...

  8. 前端和后端的英文_80后老阿姨转行做前端的学习心得,深情交流!

    一.Why choose front-end 2012.07毕业后,进了一家游戏公司做运营策划,写过营销方案.做过内容编辑.知道广告投放和换量,还得兼职产品经理画原型. 每天9.30-23.00以后, ...

  9. 80后老阿姨转行做前端的学习心得,深情交流!

    一.Why choose front-end 2012.07毕业后,进了一家游戏公司做运营策划,写过营销方案.做过内容编辑.知道广告投放和换量,还得兼职产品经理画原型. 每天9.30-23.00以后, ...

最新文章

  1. 技术图文:字典技术在求解算法题中的应用
  2. android中menu菜单扩增_【已解决】Android添加Menu菜单
  3. 牛客网_PAT乙级_1013组个最小数 (20)
  4. php foreach ,PHP学习之foreach循环时加符号的说明
  5. 备忘录模式--如果再回到从前
  6. [汇总]Web前端优化
  7. Datasqueeze v2.0.7
  8. vim替换字符串带斜杠_vim替换命令
  9. utorrent设置上传速度_设置好uTorrent让你的下载速度飞起来
  10. 凌晨 3 点不回家:成年人的世界不是他们说的那样子
  11. QComboBox下拉框条目高度的调整
  12. PL/0语言 词法分析
  13. 15年前陪你一起看《泰坦尼克号》的人在哪里?
  14. 史上最牛逼最好看的vim插件配置
  15. 全球及中国生命科学产业投资现状分析与十四五深度调研报告2022年
  16. 我的oracle 健康检查报告
  17. [work] python list中数字与一个数相乘
  18. C 关于中文汉字字符串
  19. tfs 方法访问数据库 源代码_TFS源代码管理
  20. IEEE 2030.5智能逆变器实施指南(4)

热门文章

  1. 学术界盛事揭幕:一图解读跨越百余年的诺贝尔奖
  2. 淘宝特价版给拼多多送芒果,网友:这是什么操作?
  3. 雷军坚持了 10 年的东西,现在彻底凉了
  4. 没有 5G 版 iPhone 的苹果秋季发布会,发布了些什么?
  5. 大众点评开源监控CAT概览
  6. TOJ4537: n阶行列式
  7. Schema中elementFormDefault=qualified所起的作用
  8. Ubuntu左边启动器移到底部及自动隐藏
  9. git 基本操作语句
  10. RHEL 5基础篇—文件和目录的管理