RHadoop安装和使用
环境 hortonworks 2.3版本,ambari2.1.1, hadoop版本2.7.1
1. 下载RHadoop相关软件包
从地址(https://cran.r-project.org/src/base/R-3/)下载R语言的tar包
我下载的是:
https://cran.r-project.org/src/base/R-3/R-3.2.3.tar.gz
https://github.com/RevolutionAnalytics/rmr2/releases/download/3.3.1/rmr2_3.3.1.tar.gz
https://github.com/RevolutionAnalytics/rhdfs/blob/master/build/rhdfs_1.0.8.tar.gz
https://github.com/RevolutionAnalytics/rhbase/blob/master/build/rhbase_1.2.1.tar.gz
2. centos6.5 上安装R
然后安装相关依赖包:
#yum install gcc-gfortran
#yum install gcc gcc-c++
#yum install readline-devel
#yum install libXt-devel
# tar xvf R-3.2.3.tar.gz
# cd R-3.2.3
# ./configure
# make
# make install
3:确认Java环境变量
RHadoop依赖于rJava包,安装rJava前确认已经配置了Java环境变量,然后进行R对jvm建立连接。
[root@dataserver R-3.2.3]# cat /etc/profile结尾添加
########################################
export JAVA_HOME=/usr/java/jdk1.7.0_79
export JRE_HOME=/usr/java/jdk1.7.0_79/jre
export PATH=/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
export CLASSPATH=.:/lib/dt.jar:/lib/tool.jar
export HADOOP_CMD=/usr/bin/hadoop
export HADOOP_STREAMING=/usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming.jar
export HADOOP_HOME=/usr/hdp/current/hadoop-client
export JAVA_HOME JRE_HOME PATH CLASSPATH
########################################
[root@dataserver R-3.2.3]# R CMD javareconf
4:安装相关的依赖包,确保RHadoop软件包能正常使用
[root@dataserver R-3.2.3]# R
> install.packages("rJava")
> install.packages("reshape2")
> install.packages("Rcpp")
> install.packages("iterators")
> install.packages("itertools")
> install.packages("digest")
> install.packages("RJSONIO")
> install.packages("functional")
> install.packages("bitops")
> install.packages("caTools")
> quit()
或者
install.packages(c("rJava", "Rcpp", "RJSONIO", "bitops", "digest", "functional", "stringr", "plyr", "reshape2", "caTools"))
5:安装RHadoop软件包
[root@dataserver R-3.2.3]# export HADOOP_CMD=/usr/bin/hadoop
[root@dataserver R-3.2.3]# export HADOOP_STREAMING=/usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming.jar
[root@dataserver R-3.0.2]# R CMD INSTALL rhdfs_1.0.8.tar.gz
[root@dataserver R-3.0.2]# R CMD INSTALL rmr2_3.3.1.tar.gz
[root@dataserver R-3.0.2]# R CMD INSTALL rhbase_1.2.1.tar.gz
6:使用RHadoop软件包
[root@dataserver R-3.2.3]# R
> library(rhdfs)
> hdfs.init()
> hdfs.ls("/")
[root@dataserver R-3.2.3]# export HADOOP_HOME=/usr/hdp/current/hadoop-client
> library(rmr2)
普通的R语言程序:
> small.ints = 1:10
> sapply(small.ints, function(x) x^2)
MapReduce的R语言程序:
> small.ints = to.dfs(1:10)
> mapreduce(input = small.ints, map = function(k, v) cbind(v, v^2))
> from.dfs("/tmp/RtmpWnzxl4/file5deb791fcbd5")
如果出现如下异常:
Caused by: java.io.IOException: Cannot run program "Rscript": error=2, No such file or directoryat java.lang.ProcessBuilder.start(ProcessBuilder.java:1048)at org.apache.hadoop.streaming.PipeMapRed.configure(PipeMapRed.java:209)... 23 more
Caused by: java.io.IOException: error=2, No such file or directoryat java.lang.UNIXProcess.forkAndExec(Native Method)at java.lang.UNIXProcess.<init>(UNIXProcess.java:248)at java.lang.ProcessImpl.start(ProcessImpl.java:134)at java.lang.ProcessBuilder.start(ProcessBuilder.java:1029)... 24 more
需要做个链接:
ln -s /usr/local/bin/Rscript /usr/bin/Rscript
如果在centos7上安装R就简单多了:
步骤如下:
yum install epel-release
yum install R
RHadoop安装和使用相关推荐
- RHadoop实验 – 统计邮箱出现次数
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...
- RHadoop培训 之 R基础课
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...
- 数据分析-R语言资料整理
独家分享--48页PPT解密数据可视化! Excel图表快捷操作小技巧 基于随机森林的分类与回归 R语言制作网页 ggplot2:可视化设计师的神器,了解一下 [译]R包介绍:Online Rando ...
- R语言为Hadoop注入统计血脉
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...
- R语言和hadoop
Hadoop的家族如此之强大,为什么还要结合R语言? a. Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算),成为了可能. b. R语言的强大之处,在于统计分析 ...
- R语言中文社区2018年终文章整理(作者篇)
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习,python,R等数据领域感兴趣的同学 ...
- R语言与hadoop之间的千万柔情
Hadoop的家族如此之强大,为什么还要结合R语言? a. Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算),成为了可能. b. R语言的强大之处,在于统计分析, ...
- 精心整理 | R语言中文社区历史文章整理(类型篇)
2018年过去一半了~又到了盘点的时间~感谢长时间来各位好友的关注,我们的成长与你们的爱护是分不开的.更感谢各位老师的投稿,支撑起了我们的这个社区,让更多R语言的爱好者和从业者获得最棒的知识!本文选取 ...
- linux安装R包的安装
首先在linux系统下,需要安装好R语言,由于依赖环境较多,一般会通过第三方软件库进行安装,比如说miniconda等 R包分以下几种: 镜像包:一般安装方式为:install.packages('' ...
- r语言工作路径linux,R语言实用基础知识_工作路径-注释-安装和卸载R包_2019-12-01...
R语言的实用基础知识有很多,都是我在工作和学习中所整理的,有的是看书整理的,也有的是从网络上的各种博客.各种资源获取的,所以我采用日更的方式进行支持整理和更新,希望能够帮到屏幕前的你! 今天是我日更的 ...
最新文章
- windows7下安装MongoDB数据库
- 技巧.自己学会取名字,学会欣赏
- Laravel 的数据库迁移
- AutoIT 实现Firefox下载
- C++ OpenGL透明纹理源码
- 数据库兼容级别对数据备份还原的影响
- 关于启动 SecureCRT 遇到一个致命的错误且必须关闭
- 前端:JS几种常见的排序
- leetcode 214 Shortest Palindrome
- android 显示canvas,【报Bug】部分情况下,安卓canvas不显示
- php监考,科学网—监考与被监考 - 张珑的博文
- 201409-1-相邻数对
- 太原理工大学这两年程序设计等竞赛奖牌统计
- 【风电功率预测】基于matlab灰狼算法优化LSTM风电功率预测【含Matlab源码 1392期】
- 用Html制作网页简单例子
- 初中计算机课件flash,初中数学flash课件(共100个)
- 重庆交通大学计算机科学与技术怎么样,计算机科学与技术 大学实力哪家强?(干货)...
- leetcode LCP 03. 机器人大冒险 -java
- elasticsearch api 调用
- android edittext 输入法表情,Android开发中EditText禁止输入Emoji表情符
热门文章
- ruoyi(若依)框架使用说明(前后端分离)
- 【OpenCV 例程 300 篇】101. 自适应中值滤波器
- JavaWeb - GET 请求中 URL 的最大长度限制(附:解决方案)
- iOS 之 OBJECTC 调用C、OBJECTC调用C++
- Axure的使用---原型图
- 大数据入门介绍和学习路线
- dmx512 java_DMX512协议(示例代码)
- nsis出错_怎样解决NSIS错误
- 代码版本管理软件Git的优势和用法
- 什么原数据更容易平稳_时序数据处理难题攻略(上)