R语言数据挖掘实战系列(2)

二、R语言简介

R语言是一种为统计计算和图形显示而设计的语言环境,具有免费、多平台支持,同时可以从各种类型的数据源中导入数据,具有较高的开放性以及高水准的制图功能。R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。R在数据分析、数据挖掘领域具有特别优势。

R安装

R可在其主页(https://www.r-project.org/)上获得,根据所选择的平台进行下载安装。安装完成之后启动R。为了方便使用R,可使用免费的图形界面编辑器RStudio,可从https://www.rstudio.com/下载安装。

R使用入门

R软件界面与其他编程软件相类似,是由一些菜单和快捷按钮组成。

“文件”菜单可以实现:输入R代码、建立新的程序脚本、打开程序脚本、显示文件、载入工作空间、保存工作空间、载入历史、保存历史、改变当前目录、打印、保存到文件以及退出功能;“编辑”菜单可以实现复制、粘贴、清楚控制台和数据编辑等功能;“查看”菜单可以选择是否显示工具栏;“其他”菜单可以实现中断目前计算、缓冲输出及列出目标对象等功能;“程序包”菜单可以实现载入程序包,设置CRAN镜像、安装以及更新程序包等功能;“窗口”菜单可以选择将所有窗口层叠或平铺;“帮助”菜单提供R的常见问答和帮助途径。

工具栏从左至右依次为打开程序脚本、载入映像、保存映像、复制、粘贴、复制和粘贴、终止目前计算以及打印的操作。

命令窗口中“>”是命令提示符,表示R处于准备编辑的状态,用户可以直接在命令提示符后输入命令语句,按“Enter”键执行。

RStudio介绍

RStudio窗口如下,由代码编辑、命令控制台、资源栏和其他栏组合而成。

R常用操作

(1)help

功能:提供R函数和R文件的在线式帮助。

在命令窗口输入help(函数名),或?函数名,按“Enter”键执行,或者在R的帮助(Help)菜单下的Search Help弹出框输入函数名,都可以打开帮助浏览器。

使用帮助中主要包括6个部分内容:Description(函数说明)部分描述函数的主要功能;Usage(用法)部分给出了函数的调用方法;Arguments(参数)部分给出了输入参数的详细解释,包括输入参数的取值范围、数据格式等;Detail(详情)部分给出了和该函数相关的信息;See Also(其他)部分则提供了与该函数相关的其他函数的链接;Examples(例子)部分给出了函数的常用例子,用户可以直接运行示例程序得到结果,得到对该函数的一个直观的印象。有些函数的帮助文档还包括:Value(输出参数)部分给出了输出参数的详细描述;Reference(参考文献)部分给出了有关学者对该函数的研究文献。

(2)Ctrl+L

功能:清除命令窗口中的所有显示内容。

(3)rm(list=ls())

功能:清除R工作空间中的内存变量。一般利用rm(list=ls())命令与gc()命令,清除内存变量并释放内存空间。

(4)install.packages、library

功能:install.packages()用来下载和安装程序包;library()函数不仅可以显示库中有哪些包,还可以载入所下载的包,进而在会话中使用包。

(5)getwd()、setwd()

功能:获取或设置当前工作目录的位置。

(6)save、load

功能:save将R工作空间中的指定对象保存到执行的文件中;load从磁盘文件读取一个工作空间到当前会话中。

(7)read.table、write.table、read.csv、write.csv

功能:read.table、read.csv读取EXCEL、TXT或CSV文件到当前工作空间;write.table、write.csv把当前工作空间的数据写入到EXCEL、TXT或者CSV文件中。

(8)odbcConnect、sqlFetch、sqlQuery

功能:odbcConnect建立一个到ODBC数据库的连接;sqlFetch读取ODBC数据库中的某个表到R的一个数据框中;sqlQuery相ODBC数据库提交一个查询并返回结果。

(9)source、sink

功能:source(“filename”)可在当前会话中执行一个脚本;sink("filename")将输出重定向到文件filename中。

(10)plot

功能:画图,可以设置参数进行定制的图像绘制。

R数据分析包

R包主要包含的类别有空间数据分析类、机器学习与统计学习类、多元统计类、药物动力学数据分析类、计量经济类、金融分析类、并行计算类、数据库访问类。

功能 函数及加载包
分类 nnet()需要加载BP神经网络nnet包;randomForest()需要加载随机森林randomForest包;svm()需要加载e1071包;tree()需要加载CART决策树tree包等
聚类 hclust()函数、kmeans()函数
关联规则 apriori()需要加载arules包
时间序列 arima()需要加载forecast、tseries包

转载于:https://blog.51cto.com/ccnupxz/1930462

R语言数据挖掘实战系列(2)相关推荐

  1. R语言数据挖掘实战系列(4)

    R语言数据挖掘实战系列(4)--数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具.数据预处理的主要内容包括数据清洗.数据集成.数据变换和数据规约. 一. ...

  2. R语言应用实战系列(一)-基于R对QQ群聊天记录数据分析

    前言 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! MATLAB-30天带你从入门到精通 MATLAB深入理解高级教程(附源码) tableau可视化数据 ...

  3. R语言应用实战系列(五)-朴素贝叶斯算法以及ROC和PR曲线

    前言 朴素贝叶斯(Naviebayes)的原理很简单:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为该代分项属于哪个类别? 以下是我为大家准备的几个精品专栏,喜欢的小伙 ...

  4. R语言应用实战系列(三)-智能推荐模型的构建

    一.基本概念和原理 智能推荐的方法有很多,包括基于内容推荐,协同过滤推荐,基于关联规则,基于知识推荐,基于效用推荐和组合推荐. 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我 ...

  5. R语言应用实战系列(二)-基于R语言的方差分析

    前言 回归分析重点考察变量间的相关关系或因果关系,当包含因子是解释变量时,关注点通常是从变量间的关系转向组与组之间的差异分析,这种分析样本组之间的区别的方法称为方差分析(Analysis of Var ...

  6. R语言应用实战系列(六)-基于R的人工神经网络ANN算法和KNN算法(k-Nearest Neighbour)

    一.神经网络 人工神经网络算法(ANN),是一种模仿生物神经网络的结构和功能的数学模型和计算模型.神经网络由大量的人工神经元联结进行计算.大多数情况下,人工神经网络能在外在信息的基础上改变内部结构,是 ...

  7. R语言应用实战系列(四)-Apriori算法的相关内容(附案例源代码)

    前言 关联规则反映一个事物与其他事物之间的关联性,关联规则分析是从事事物数据库,关系数据库和其他信息存储中大量数据的项集之间发现有趣,频繁的格式,关联和相关性.更确切地说,关联规则通过量化的数字进行描 ...

  8. 数据挖掘r语言和python知乎_Hellobi Live |R语言爬虫实战案例分享:网易云课堂、知乎live、今日头条、B站视频...

    课程名称 R语言爬虫实战案例分享:网易云课堂.知乎live.今日头条.B站视频 网络数据抓取是数据科学中获取数据中的重要途径,但是一直以来受制于高门槛,都是专业程序员的专属技能.直到R语言和Pytho ...

  9. R语言ETL工程系列:排序(arrange)

    作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘.社交网络分析和机器学习等.希望与大家分享学习经验,推广并加深R语言在业界的应用. 邮箱:huang.tian-yuan@qq.com 前言 上篇介 ...

  10. 三十四、R语言数据分析实战

    @Author : By Runsen @Date : 2020/5/14 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大学沉迷日语,Python, Java和一系列数据分析软件.导致翘 ...

最新文章

  1. C++走向远洋——39(指向学生类的指针)
  2. 数字图像的表示与类型(学习篇)
  3. sklearn——CountVectorizer详解
  4. Tensorflow— 下载google图像识别网络inception-v3并查看结构
  5. cii框架PHP,CII. POSIX Functions - PHP 5 中文文档
  6. Pytorch教程(十三):reshape、squeeze、flatten
  7. [Xcode 实际操作]六、媒体与动画-(6)使用UIBlurEffect给图片添加模糊效果
  8. chrome扩展程序获取当前页面URL和HTML内容
  9. MySql command line client 命令系列
  10. 线性代数 : 矩阵乘法和矩阵的逆
  11. dell服务器开机蓝屏无限重启,戴尔电脑不停蓝屏重启怎么办
  12. 树的遍历 ALDS1_7_C: Tree Walk
  13. 即时通讯系统集成开发
  14. linux编译ace tao,ACE_TAO的编译
  15. 线上连锁线下整合 连锁店电商解决方案
  16. matalab三维画图
  17. 【转】Chrome浏览器截全屏
  18. 高边坡监测主要监测的内容
  19. 环境变量LC相关设置
  20. Windows 11 即将问世 | Windows 10 和 Windows 11 该如何抉择

热门文章

  1. 解决了跨域POST的问题
  2. 计算机中的颜色VI——从色相值到纯色的快速计算
  3. .sln文件和.suo文件的解释
  4. javaweb四种域对象的应用
  5. Spring整合Struts2,Hibernate的xml方式
  6. mongo(删除操作)
  7. 递归函数 二分查找法 的一些用法
  8. Ubuntu 15.04下安装Docker
  9. MVC @Html.TextBox 添加属性和样式
  10. VC++显示文件或文件夹属性