R语言处理Web数据

许多网站提供的数据,以供其用户的消费。例如,世界卫生组织(WHO)提供的CSV,TXT和XML文件的形式的健康和医疗信息报告。基于R程序,我们可以通过编程提取这些网站的具体数据。R中一些程序包,用来提取网络数据形式- "RCurl",XML", 和"stringr". 它们被用于连接到的URL,确定所需链接的文件,并将它们下载到本地环境。

安装R程序包

下面的软件包都需要处理的URL和链接文件。如果它们没有R环境中,可以使用下面的命令进行安装。

install.packages("RCurl")
install.packages("XML")
install.packages("stringr")
install.packages("pylr")

输入数据

我们将访问URL:气象资料,并下载使用R中的CSV文件(这是在2015年之前的数据)。

示例

我们将使用函数getHTMLLinks()来收集文件的网址。然后,我们将使用函数download.file()将文件保存到本地系统。我们将一次又一次应用相同的代码下载多个文件, 我们将创建一个函数被调用多次。该文件名通过在R列表对象的形式参数到这个函数。

# Read the URL.
url <- "http://www.geos.ed.ac.uk/~weather/jcmb_ws/"

# Gather the html links present in the webpage.
links <- getHTMLLinks(url)

# Identify only the links which point to the JCMB 2015 files.
filenames <- links[str_detect(links, "JCMB_2015")]

# Store the file names as a list.
filenames_list <- as.list(filenames)

# Create a function to download the files by passing the URL and filename list.
downloadcsv <- function (mainurl,filename){
        filedetails <- str_c(mainurl,filename)
        download.file(filedetails,filename)
        }

# Now apply the l_ply function and save the files into the current R working directory.
l_ply(filenames,downloadcsv,mainurl="http://www.geos.ed.ac.uk/~weather/jcmb_ws/")

验证文件下载

运行上面的代码后,可以在当前R工作组目录下面找到文件。

"JCMB_2015.csv" "JCMB_2015_Apr.csv" "JCMB_2015_Feb.csv" "JCMB_2015_Jan.csv" "JCMB_2015_Mar.csv"

转载于:https://www.cnblogs.com/amengduo/p/9587019.html

R语言处理Web数据相关推荐

  1. r语言 读服务器数据,R语言数据实战 | 安装R语言

    原标题:R语言数据实战 | 安装R语言 1.R的获取和安装 获取和安装R很容易(这也是它"亲民"的地方),具体步骤如下: Step 1: 登陆R语言官方网站https://www. ...

  2. r语言中进行数据可视化_R中的数据可视化

    r语言中进行数据可视化 R programming was developed in 1993 for making graphs and producing statistical results. ...

  3. R语言把dataframe数据转化为tibble格式、查看每个数据列的缺失值个数、使用数据列的均值对数据列的缺失值进行填充

    R语言把dataframe数据转化为tibble格式.查看每个数据列的缺失值个数.使用数据列的均值对数据列的缺失值进行填充 目录

  4. R语言进行dataframe数据内连接(Inner join):使用R原生方法、data.table、dplyr等方案

    R语言进行dataframe数据内连接(Inner join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据内连接(Inner join):使用R原生 ...

  5. R语言可视化dataframe数据、并自定义设置坐标轴各个标签使用不同的色彩

    R语言可视化dataframe数据.并自定义设置坐标轴各个标签使用不同的色彩 目录 R语言可视化dataframe数据.并自定义设置坐标轴各个标签使用不同的色彩

  6. R语言ggplot2可视化数据点注释、标签显示不全、发生边界截断问题解决实战

    R语言ggplot2可视化数据点注释.标签显示不全.发生边界截断问题解决实战 目录 R语言ggplot2

  7. R语言进行dataframe数据左连接(Left join):使用R原生方法、data.table、dplyr等方案

    R语言进行dataframe数据左连接(Left join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据左连接(Left join):使用R原生方法 ...

  8. R语言将dataframe数据从宽表(wide)变为长表(long)实战:tidyr包的gather函数、cdata包的unpivot_to_blocks函数、data.table使用melt函数

    R语言将dataframe数据从宽表(wide)变为长表(long)实战:tidyr包的gather函数.cdata包的unpivot_to_blocks函数.data.table使用melt函数 目 ...

  9. R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能)

    R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能) 目录 R语言计算dataframe数据列中各分类的计数(类似pandas value

最新文章

  1. APP安全谁之过?爱加密为APP开发者分忧
  2. C语言hw,[c语言]EmailAddresses(for hw)
  3. poj 1192(简单树形dp)
  4. vs2003打开项目错误
  5. css画个框,用CSS绘制带有边框的尖端
  6. python手把手教程_【Python 1-7】Python手把手教程之——详解列表List
  7. CVPR2021 | 北航商汤耶鲁口头报告
  8. eclipse新建maven报错
  9. 2019.08.29定时器以及轮播图
  10. Android xml文件的序列化
  11. sqlserver 中怎样查看一个数据库中表的关系
  12. Maven插件:maven-javadoc-plugin
  13. chrome哪个版本最好用_我拥有哪个版本的Chrome?
  14. Vue打开动态html页面,vue.js中怎么打开新页面?
  15. 百度地图--南京行政区域划分
  16. Java8 stream toMap 解决 key 冲突
  17. Pr 视频速率与关键帧
  18. win7音量图标不见了怎么办捏
  19. 计算机应用基础论文1000字,计算机应用基础论文.doc
  20. 复旦情商课魅力女教师上课实录

热门文章

  1. LSTM implementation explained
  2. python程序员编辑器_5款Python程序员高频使用开发工具推荐
  3. JZOJ 5982. 【WC2019模拟12.27】路径排序
  4. JZOJ 3766. 【BJOI2014】大融合
  5. java编译器使用教程_Java编译器API简介
  6. Qt 操作words实例 --- 幼儿快算题生成器
  7. 禁用cookie后怎么使用session_Session 和 Cookie 的区别?你在项目中哪些地方使用了?...
  8. PageRank行将过时 搜索引擎遭遇范式转移
  9. UOJ #277 BZOJ 4739 定向越野 (计算几何、最短路)
  10. pbr 多出口_结合BFD基于PBR的多出口流量转发的控制与备份