R语言数据科学程序包:Tidyverse介绍

  • 1. R语言简介
  • 2. 数据科学简介
  • 3. Tidyverse简介

1. R语言简介

R语言是用于统计计算和绘图的免费软件。它可以在Windows, Unix以及MacOS等系统下运行。用户可以从网上免费下载R语言。

R语言的起源可以追溯到80年代,那时候的AT&T贝尔实验室(也就是现在的朗讯科技)开发了S语言进行数据挖掘、统计分析和绘图。S语言后来演变成为了商业软件S-Plus。后来有一些志愿者将S-Plus改进成为免费的R语言。R语言的统计功能强大,包括线性和非线性模型,经典统计检验、时间序列分析、聚类分析等等。

R语言不但免费,而且开发源代码,是一种自由软件。另外,R语言的编程简单易学。你可以自己写函数,将最新的统计方法应用到R语言中去。R语言的函数和数据集都保存在程序包里面。当我们需要访问这些函数和数据时,需要下载相关的程序包。

2. 数据科学简介

数据科学是一门利用科学的模型、算法和系统,从有结构(Structured)和无结构(Unstructured)的数据中提取信息的学科。数据科学同数据挖掘和大数据密切相关,并将统计学、数据分析、机器学习等方法相结合,利用数据解释和分析问题。信息技术的发展导致大量数据的产生,这就促进了数据科学的发展。从发展过程来看,数据科学经历了经验、理论、计算、数据驱动这4个阶段。


尽管在过去几十年里,数据科学在不断发展,但是直到1992年在法国召开的一次统计学会议上,才有人提出了数据科学这个名词。到了1996年,数据科学才出现在学术会议的名称中。

数据科学和统计学之间的关系可谓是“剪不断,理还乱”。1997年,就有人开始讨论统计学是不是等同于数据科学。这是因为统计学就是搜集和整理数据,建模并且分析数据,然后得出结论的学科。这似乎和数据科学区别不大。到了2001年,有人提出数据科学和统计学不一样,因为数据科学更加跨学科。2012年,哈佛商业评论刊登了“数据科学家:21世纪最性感的工作”的文章。这篇文章认为数据科学是一个崭新的学科。但是在美国统计学协会的会议上,有统计学家认为数据科学是统计学进化以后的学科。2014年,华尔街日报又登出文章,还是认为数据科学的面更宽,和统计学不一样。有关数据科学和统计学之间的争论还在继续,暂时没有明确的结果。

3. Tidyverse简介

Tidyverse是R语言的一个程序包。Tidy的意思是干净、整洁。Verse的意思是诗歌、歌曲。那么Tidyverse的意思就是干净整洁的语句。

Tidyverse可以大大简化数据处理和分析,其核心包括ggplot2, dplyr, tidyr和readr,等程序包。其中,ggplot2用来可视化数据。dplyr用来解决数据处理问题,tidyr用来清理数据,readr读入表格数据。它们可以用来转换数据,建立模型,实现数据可视化。因此,Tidyverse是R语言中下载量排名靠前的程序包。

R语言数据科学程序包:Tidyverse介绍相关推荐

  1. 【组队学习】【28期】R语言数据科学

    R语言数据科学 论坛版块: http://datawhale.club/c/team-learning/36-category/36 开源内容: https://github.com/datawhal ...

  2. 【R语言数据科学】(十八):系统聚类和K-Means聚类

    [R语言数据科学]

  3. R语言数据科学:变量选择(一)逐步回归法

    [R语言数据科学]

  4. 【R语言数据科学】(十六):交叉验证再回首

    [R语言数据科学]:交叉验证再回首

  5. R语言图形用户界面数据挖掘包Rattle介绍、安装、启动、介绍(Using the rattle package for data mining)

    R语言图形用户界面数据挖掘包Rattle介绍.安装.启动.介绍(Using the rattle package for data mining) 目录

  6. 【R语言数据科学】(二十二):多项式回归

    [R语言数据科学]:多项式回归

  7. 【R语言数据科学】:(二)R语言编程

    [R语言数据科学]:(二)R语言编程基础

  8. 【R语言数据科学】:(九)数据清洗技巧之数据表连接大全

    R语言数据分析

  9. 【R语言数据科学】:(十)数据清洗之日期型数据处理

    R语言数据分析

最新文章

  1. Codeforces Gym 100523E E - Gophers SET
  2. ffmpeg4编解码例子
  3. 【开发环境】Ubuntu 中使用 VSCode 开发 C/C++ ④ ( 创建 tasks.json 编译器构建配置文件 | tasks.json 编译器构建配置文件分析 )
  4. result的type属性
  5. java检测安卓程序退出_java-我的Android应用程序的gameLoop线程在退出...
  6. android openGl纹理的使用
  7. 收集53个程序员励志名言
  8. 好消息,scott的asp.net 2.0数据导航系列全部出版了
  9. 批量打印软件导入Excel时如何保留两位小数
  10. 国内外电商平台反爬虫机制报告
  11. lv_canvas 画布
  12. 动态规划(DP)小结
  13. ABI and ISA
  14. linux 实验心得体会
  15. GBase基本查询操作
  16. 高效能创业者的七项习惯
  17. Oracle远程连接数据库显示无监听程序
  18. 局域网文件文本在线传输助手
  19. swal弹窗_swal的几种用法
  20. ubuntu重置密码忘记_在2分钟或更短时间内重置您忘记的Ubuntu密码

热门文章

  1. 洛谷 P1605 迷宫(DFS模板)
  2. 新入行的软件测试工程师必须知道这7点...
  3. 大华nvr服务器返回消息错误,GB/T28181协议EasyGBS问题解决对接大华硬盘录像机NVR时查询录像失败...
  4. eclipse解决js提示
  5. Redis 安装部署教程
  6. K-Means集群算法
  7. 【学习记录】Python零基础入门(五)
  8. 利用百度AI开放平台的语言处理基础技术(Python)
  9. Vue天地图之图层类型切换
  10. mac上Apk反编译工具合集整理与资源