经验总结21--抓取WEB数据,汇率,HtmlAgilityPack
网上找了非常多资料,PHP的比較多,然后找到有csv文件的。处理起来非常麻烦,国外的站点速度非常慢。
最后还是去页面上抓取数据,我是从中国银行抓取的,各位可去其它站点抓取。
1、模拟请求URL。
string url = "http://srh.bankofchina.com/search/whpj/search.jsp?
pjname=1316";
HttpWebRequest request = WebRequest.Create(url) as HttpWebRequest;
request.Method = "GET";
request.ContentType = "text/html; charset=UTF-8";
request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:30.0) Gecko/20100101 Firefox/30.0";
HttpWebResponse response = request.GetResponse() as HttpWebResponse;
Stream myResponseStream = response.GetResponseStream();
StreamReader myStreamReader = new StreamReader(myResponseStream, Encoding.UTF8);
string result = myStreamReader.ReadToEnd();
2、对HTML进行处理。
使用HtmlAgilityPack进行辅助。
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(result);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//td"))
{
if (node.InnerText == "美元")
{
result = node.NextSibling.NextSibling.InnerText;
break;
}
}
具体数据位置。自己可先用F12查找到。然后使用工具进行查找,具体文档自己去查,这种方法临时获取到USD-CNY的汇率。
经验总结21--抓取WEB数据,汇率,HtmlAgilityPack相关推荐
- Linux使用tcpdump抓取网络数据包示例
tcpdump是linux命令行下常用的的一个抓包工具,记录一下平时常用的方式,测试机器系统是ubuntu 12.04. tcpdump的命令格式 tcpdump的参数众多,通过man tcpdump ...
- web scraper 抓取网页数据的几个常见问题
如果你想抓取数据,又懒得写代码了,可以试试 web scraper 抓取数据. 相关文章: 最简单的数据抓取教程,人人都用得上 web scraper 进阶教程,人人都用得上 如果你在使用 web s ...
- 怎么获取web开发怎么获取手机的唯一标识_PYTHON实现北京住宅小区数据抓取-(Web服务API-地点检索服务)
最近工作需要整理了一些百度地图接口查询北京住宅小区的相关信息.该篇文章主要从如下3个方面的说明:Web服务API -地点检索服务.需求分析 和 PYTHON实现 . Web服务API -地点检索服务: ...
- 从人人网抓取高校数据信息,包括,省份 - 高校 - 院系 (提供最终SQL文件下载)...
从人人网抓取高校数据信息,包括,省份 - 高校 - 院系 Author: handt Blog : www.cnblogs.com/handt 涉及到的脚本和 SQL 文件 点此下载 ===== ...
- Python 爬虫篇#笔记02# | 网页请求原理 和 抓取网页数据
目录 一. 网页请求原理 1.1 浏览网页的过程 1.2 统一资源定位符URL 1.3 计算机域名系统DNS 1.4 分析浏览器显示完整网页的过程 1.5 客户端THHP请求格式 1.6 服务端HTT ...
- 查询数据 抓取 网站数据_有了数据,我就学会了如何在几个小时内抓取网站,您也可以...
查询数据 抓取 网站数据 I had a shameful secret. It is one that affects a surprising number of people in the da ...
- 抓取网页数据并解析Android
抓取网页数据并解析 标签: 网页抓取jsoupAndroid 2016-03-02 13:54 1262人阅读 评论(1) 收藏 举报 分类: Android开发(原创)(7) 版权声明:本文为博 ...
- Scrapy 案例一:通过 API 抓取天气预报数据
目录 一.概述 二.案例分析 三.编码实现 四.获取多个 city 的天气信息(简单实现) 一.概述 在一些简单的网站中,可以发现,所有的数据都在网页代码中,然而在实际获取数据的过程中,我们可以发现, ...
- cookie追加数据_集算器 SPL 抓取网页数据
[摘要] 集算器 SPL 支持抓取网页数据,根据抓取定义规则,可将网页数据下载到在本地进行统计分析.具体定义规则要求.使用详细情况,请前往乾学院:集算器 SPL 抓取网页数据! 网站上的数据源是我们进 ...
- python爬网页数据用什么_初学者如何用“python爬虫”技术抓取网页数据?
原标题:初学者如何用"python爬虫"技术抓取网页数据? 在当今社会,互联网上充斥着许多有用的数据.我们只需要耐心观察并添加一些技术手段即可获得大量有价值的数据.而这里的&quo ...
最新文章
- 查看apache、linux、kernel、nginx等版本
- 坦克大战 - 设计模式、BIO、NIO、AIO、Netty
- 介绍一下画图小能手matplotlib。
- maximum mean discrepancy
- nginx php怎么配置伪静态,nginx rewrite 伪静态配置参数和使用例子
- OpenSSL原理与实现
- HDU-Keywords Search(AC自动机)
- 需要友元的原因及使用
- 从零开始学数据分析,什么程度可以找工作?
- nodejs学习—安装
- 大白话5分钟带你走进人工智能-第一节开篇介绍以及线性回归简介篇
- 360安全卫士加速球误关闭某个应用软件
- 小波与小波包、小波包分解与信号重构、小波包能量特征提取
- PCL implicit shape model 做目标识别分类
- 人寿保险的十大真相 保险不是什么时候都能买的
- 分享一些可用的淘宝(1688)关于订单信息获取的相关接口(开放API收费)
- 008 解决问题的策略 转化(苏教版 五下)
- Java实现仿QQ聊天工具的项目总结
- Knights 题解
- DOA估计 基于互质阵列的DOA估计
热门文章
- java JDK 自带的 native2ascii 和它的 reverse 命令
- 力扣题目——53. 最大子序和
- 【Oracle】ORA-00054: resource busy and acquire with NOWAIT specified or timeout expired
- ora-12505报错解决方法(转)
- VS code中使用code runner遇到两例问题之解决:1.输出乱码,2运行无响应(输出)
- JSON中的多行字符串
- win11如何设置始终以管理员身份运行 windows11设置始终以管理员身份运行的方法步骤
- win11快捷键怎么使用 Windows11快捷键的使用方法
- eclipse jstl包_我的Java Web之路41 - JSTL初步使用
- Linux:如何更新Ubuntu的数据源