前言:

今天 CYQ.Data 框架  框架群里,“路过冬天”问了个天气预报的问题,问哪里有webservice调用?于是随性就有了这篇文章了。

天气预报,回忆中做过那么三次。

第一次的做法是:

技术总监写了个采集后台,每天早晚各采一次,从tq121站里采集大量的天气信息到数据库,我就直接从数据库里读数据了。

总结:

这种做法很麻烦,每天要开后台采数据,做成自动的,还要不半路程序自动死亡才行,而且数据库会产生大堆垃圾过时的数据。

优点是:可以采集很多信息,做成很专业的天气预报站,那时候做旅游站,天气也是重要模块,所以这种方式也很合适。

第二次:

自己做毕业设计,都没采集后台,自己又写不出采集来,没数据读了,只好到处百度搜索“天气预报Webservice"调用。

总结:

这种做法也很郁闷,首先Webservice不好找,第二找到的如果小站提供的,随时又会挂掉了,要是人家挂掉,你要另找一个?

优点是:找到就调用,什么也不用管,菜鸟也能飞。

第三次:

是电子商务平台在首页显示下天气,那时候正巧遇到刚做完web版的采集系统,于是顺理直接使用采集类库现采现显。

总结:

优点是:不用和数据库打交道,现采现显,减少数据库压力,速度快,每天只采一次,丁点信息,缓存即可。对于天气只是装饰性的极适用。

缺点是:数据量少,不能做能专业性天气预报站。

以下介绍现采现显的实现方式

1:既然要采,当然找到有天气预报的站了,这个很好找,网上到处都是资源,只要你会采。

比如百度,你搜索城市如广州,即会出现天气信息了,如图:

比如腾讯soso,如下图。当然还有其它很多很多,只要看得到的,都可以采,不过最好找大站,稳定。

2:采集类,一个好的采集类,事半功倍,以下出一个简化版,足够采集天气信息

using System;
using System.Text;
using System.Net;
using System.Text.RegularExpressions;

namespace CYQ.Tool
{
    /// <summary>
    /// 作者:路过秋天
    /// 博客:http://cyq1162.cnblogs.com
    /// </summary>
    public class GatherHelper
    {
        /// <summary>
        /// 返回获取的目标地址HTML全部代码
        /// </summary>
        /// <param name="strUrl">目标地址</param>
        /// <returns></returns>
        public static string GetHtmlCode(string pageUrl, Encoding encoding)
        {
            try
            {
                //返回目标页HTML代码
                WebClient webclient = new WebClient();
                webclient.Credentials = CredentialCache.DefaultCredentials;
                byte[] buffer = webclient.DownloadData(pageUrl);
                string HtmlCode = encoding.GetString(buffer);
                webclient.Dispose();    //释放WebClient资源
                return HtmlCode;
            }
            catch
            {
                return string.Empty;
            }

}

#region 内容截取分析
        /// <summary>
        /// 返回根据内容开始及结束代码分析出内容
        /// </summary>
        /// <param name="ContentCode">内容代码</param>
        /// <param name="StartCode">内容所在开始代码</param>
        /// <param name="EndCode">内容所在结束代码</param>
        /// <param name="index">取第几条[从1开始]</param>
        /// <returns></returns>
        public static string GetContent(string contentCode, string startCode, string endCode, int index)
        {
            string[] matchItems = null;
            return GetContent(contentCode, startCode, endCode, index, out matchItems);
        }
        public static string GetContent(string contentCode, string startCode, string endCode, int index, out string[] matchItems)
        {
            matchItems = null;
            if (string.IsNullOrEmpty(startCode) && string.IsNullOrEmpty(endCode))
            {
                return contentCode;
            }
            Regex regObj = new Regex(startCode + @"([\S\s]*?)" + endCode, RegexOptions.Compiled | RegexOptions.IgnoreCase);
            MatchCollection matchItemList = regObj.Matches(contentCode);
            if (matchItemList != null && matchItemList.Count >= index)
            {
                matchItems = new string[matchItemList.Count];
                for (int i = 0; i < matchItemList.Count; i++)
                {
                    matchItems[i] = matchItemList[i].Groups[1].Value;
                }
                index = index > 0 ? index - 1 : 0;
                return matchItemList[index].Groups[1].Value;
            }
            return string.Empty;
        }
        #endregion
    }
}

3:编写天气预报实体类,将采集的信息以实体返回,如果采集多个,返回就是List<实体>了

  public class WeatherInfo
    {
        private string imgUrl;
        /// <summary>
        /// 天气图片地址
        /// </summary>
        public string ImgUrl
        {
            get { return imgUrl; }
            set { imgUrl = value; }
        }
        private string wind;
        /// <summary>
        /// 天气风力
        /// </summary>
        public string Wind
        {
            get { return wind; }
            set { wind = value; }
        }
        private string cityName;
        /// <summary>
        /// 天气城市名称
        /// </summary>
        public string CityName
        {
            get { return cityName; }
            set { cityName = value; }
        }
        private string temperature;
        /// <summary>
        /// 天气温度
        /// </summary>
        public string Temperature
        {
            get { return temperature; }
            set { temperature = value; }
        }
        private string description;
        /// <summary>
        /// 天气说明
        /// </summary>
        public string Description
        {
            get { return description; }
            set { description = value; }
        }

4:编写采集Soso的天气预报类

A:新建采集天气预报类:WeatherSearch

    /// <summary>
    /// 作者:路过秋天
    /// 博客:http://cyq1162.cnblogs.com
    /// </summary>
    public class WeatherSearch
    {
        /// <summary>
        /// 数据采集来源于腾信搜搜天气预报
        /// </summary>
        /// <param name="cityName"></param>
        /// <returns></returns>
        public static WeatherInfo Get(string cityName)
        {
              //待实现
        }

private static WeatherInfo GetFormCache(string cityName,string key)
        {
            object weather = HttpContext.Current.Cache.Get(key);
            if (weather!=null)
            {
                return weather as WeatherInfo;
            }
            return null;
        }

}

重要说明:

采集一次后,记得缓存起来,不然每次访问都现采,刷刷就被soso给封了,切身经历啊。

B:Get函数分解:

1:先读取缓存,注意缓存Key用日期做key,可以方便缓存今天和删除昨天的缓存。

        public static WeatherInfo Get(string cityName)//中文城市名称
        {
            if (string.IsNullOrEmpty(cityName))
            {
                return null;
            }
            string todayKey = cityName + DateTime.Now.ToString("yyyyMMdd");
            WeatherInfo weather = GetFormCache(cityName, todayKey);
            if (weather == null)
            {
                //待实现
            }
        }

2:读不到缓存就现采了,调用采集类

 if (weather == null)
  {
                weather = new WeatherInfo();
                weather.CityName = cityName;
                cityName = System.Web.HttpUtility.UrlEncode(cityName + "天气", Encoding.GetEncoding("gb2312"));
                string url = "http://www.soso.com/q?num=1&w=" + cityName;

//采集所有html
                string html = GatherHelper.GetHtmlCode(url, Encoding.GetEncoding("gb2312"));
                //接下来待实现
  }

说明:

这里城市要用中文编码传过去,至于url,是我发现的最简洁的参数,现在已把搜搜的搜索页面的全html抓回来了,接下来就是分离出想要的信息。

3:分析html,缩小范围,对于一大堆html,我们只要这一部分

<!--上面的被省略-->
<div class="w_main">
                                            <ol>
                                                <li class="w_space" title="北风4-5级"><span>今天(周五)</span>
                                                    <img src="http://cache.soso.com/zdq/wea/s_a3.png" onload="setPng(this,48,48)" />
                                                    <span>21 / 28<em>&deg;</em>C</span><span class="w_w">多云转阵雨</span> </li>
                                                <li title="北风3-4级"><span>明天(周六)</span>
                                                    <img src="http://cache.soso.com/zdq/wea/s_a3.png" onload="setPng(this,48,48)" />
                                                    <span>22 / 28<em>&deg;</em>C</span><span class="w_w">多云转阵雨</span> </li>
                                                <li title="微风"><span>后天(周日)</span>
                                                    <img src="http://cache.soso.com/zdq/wea/s_a33.png" onload="setPng(this,48,48)" />
                                                    <span>18 / 29<em>&deg;</em>C</span><span class="w_w">多云</span> </li>
                                            </ol>
</div>
<!--下面的也被省略-->

说明:

我们使用GetContent方法可以非常方便的缩小范围,只要找到唯一的起始标签和结束标签,不会正则,也一样截取。

4:使用GetContent步步截取所需要信息

if (string.IsNullOrEmpty(html)) { return null; }
                //缩小范围
                html = GatherHelper.GetContent(html, "<div class=\"w_main\">", "</div>", 1);
                if (string.IsNullOrEmpty(html)) { return null; }

//说明
                weather.Description = GatherHelper.GetContent(html, "<span class=\"w_w\">", "</span>", 1);
                //图片
                weather.ImgUrl = GatherHelper.GetContent(html, "<img src=\"", "\"", 1);
               
                //风向
                weather.Wind=GatherHelper.GetContent(html, "title=\"", "\"", 1);

//温度
                weather.Temperature = GatherHelper.GetContent(html, "/> <span>", "<em>", 1);

5:存入缓存并清除昨天的缓存信息[看需要展示几天的信息了]

                HttpContext.Current.Cache.Insert(todayKey, weather);
                string yesterdayKey = cityName + DateTime.Now.AddDays(-1).ToString("yyyyMMdd");

if (HttpContext.Current.Cache.Get(yesterdayKey)!=null)
                {
                    HttpContext.Current.Cache.Remove(yesterdayKey);
                }

5:界面调用

 protected void Page_Load(object sender, EventArgs e)
    {
        WeatherInfo info = WeatherSearch.Get("广州");
        if (info != null)
        {
            litCity.Text = info.CityName;
            litDescprtion.Text = info.Description;
            imgUrl.ImageUrl = info.ImgUrl;
            litWind.Text = info.Wind;
            litTemperature.Text=info.Temperature;
        }
    }

6:调用结果

最后结言:

本博没有快速评论通道,大伙积极点下手。

再不济手动复制-》“此文不错,值的推荐”!!

-_-...!!!

IE6好卡,鼠标又发神经,单击双击混在一起,本文写起来好辛苦~~

本文示例下载地址:CYQ.Data 轻量数据层之路 bug反馈、优化建议、最新框架下载

实战系列之天气预报实时采集相关推荐

  1. 【PBL项目实战】户外智慧农场项目实战系列——5.天气预报API接口对接

    [PBL项目实战]户外智慧农场项目实战系列--5.天气预报API接口对接 原文链接  https://mp.weixin.qq.com/s/jditkIEd-UK6cSQyCC_-Eg 本系列以户外智 ...

  2. 【PBL项目实战】户外智慧农场项目实战系列之4——Mind+Mixly双平台ESP32数据上云及云端可视化实时展示

    [PBL项目实战]户外智慧农场项目实战系列之4--Mind+Mixly双平台ESP32数据上云及云端可视化实时展示 原文链接  https://mp.weixin.qq.com/s/r_NeJdPoi ...

  3. Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark Streaming简介 1.1 概述 Spark Streaming 是Sp ...

  4. 【PBL项目实战】户外智慧农场项目实战系列——7.Mind+Mixly双平台工业级多合一空气质量传感器数据上云及云端可视化展示

    [PBL项目实战]户外智慧农场项目实战系列--7.Mind+Mixly双平台工业级多合一空气质量传感器数据上云及云端可视化展示 原文链接  https://mp.weixin.qq.com/s/ZEU ...

  5. 【PBL项目实战】户外智慧农场项目实战系列——2.产品与设备的新建及与云端可视化应用的关联

    [PBL项目实战]户外智慧农场项目实战系列--2.产品与设备的新建及与云端可视化应用的关联 原文链接  https://mp.weixin.qq.com/s/mH4bRSf93QC4Jhhd5ci2m ...

  6. 【PBL项目实战】户外智慧农场项目实战系列——1.阿里云物联网平台的开通与云端可视化应用的新建

    岭师人工智能素养教育共同体PBL项目教程系列之1:户外智慧农场项目实战系列 原文链接  https://mp.weixin.qq.com/s/avKWJHNvnPeFsdEXUBByjw 本系列以户外 ...

  7. 【PBL项目实战】户外智慧农场项目实战系列——3.云端可视化页面开发及设备数据源的配置与调试

    [PBL项目实战]户外智慧农场项目实战系列--3.云端可视化页面开发及设备数据源的配置与调试 原文链接  https://mp.weixin.qq.com/s/5OT57-_QlN7lwRMWvey4 ...

  8. 基于DSP技术的多路语音实时采集与压缩处理系统

    在语音的数字通信和数字存储等应用领域,需要对多路语音信号进行实时采集和压缩处理[1].如某语音记录设备,需要对8路语音信号进行实时采集和压缩处理,而且要求对采集到的语音数据的压缩率尽量高.一般地,当要 ...

  9. 《视频直播技术详解》系列之二:采集

    七牛云于 6 月底发布了一个针对视频直播的实时流网络 LiveNet 和完整的直播云解决方案,很多开发者对这个网络和解决方案的细节和使用场景非常感兴趣. 结合七牛实时流网络 LiveNet 和直播云解 ...

  10. MongoDB实战系列之二:MongoDB的常用操作

    #以服务方式启动mongodb,要求验证 /elain/apps/mongodb/bin/mongod --fork --port 27001 --auth --dbpath /elain/data/ ...

最新文章

  1. R语言效用分析 ( 效能分析、Power analysis)、除了pwr包之外还有其它包、例如、基因研究中的效能分析、MBESS包可用于各种形式的效能分析和最少样本量确定、其他效用分析包的简要介绍
  2. linux+不同分区mv,mv操作深入浅出
  3. TP5与TP3.X对比
  4. oracle中偏移,怎么对相同的坐标点偏移?
  5. 异常处理_Maven之web项目java.lang.LinkageError
  6. java 同域名下怎么访问同事的项目_喜大普奔,两个开源的前后端分离项目可以在线体验了...
  7. 嵌入式电路设计(soc底板电路设计)
  8. python 文本换行_Python学习入门(23)—读写文件
  9. Intel SGX远程认证【SGX手册截图】
  10. KK集团5年估值200亿,新零售还好做吗?
  11. 电子书PDF文件的压缩实践
  12. FPGA自学之路12(二进制转换8421bcd码)
  13. 景联文科技:为扫地机器人AI训练提供数据采集标注解决方案
  14. JAVA中如何实现代码优化(技巧讲解)
  15. 听劝!不要啥都不懂就学PMP!这100个考试关键点,带你直击考试现场
  16. 经典SQL Server语句大全(超详细)
  17. swoole开启了守护进程如何关掉
  18. JAVA大学实用教程(第四版)课后习题三、四章答案(自整理)
  19. 计算机网络基础第一章(思维导图)
  20. DBA解题集:学会数数

热门文章

  1. lamp+cacti+ntop+thold+nagios+syslog
  2. 科技经济调整td-scdma中国
  3. 打造专业化FTTD布线产品解决方案
  4. OPC 学习交流感想
  5. SRv6技术研究和组网设计
  6. (六)洞悉linux下的Netfilteriptables:如何理解连接跟踪机制?(2)
  7. Linux进程的管理与调度(六) -- Linux下1号进程的前世(kernel_init)今生(init进程)
  8. H.264熵编码分析
  9. P-Called-Party-ID 头域的应用说明
  10. 入门选手都能了解的聚类算法之二(DBSCAN)