环境 hortonworks 2.3版本,ambari2.1.1, hadoop版本2.7.1

1. 下载RHadoop相关软件包

从地址(https://cran.r-project.org/src/base/R-3/)下载R语言的tar包

我下载的是:

https://cran.r-project.org/src/base/R-3/R-3.2.3.tar.gz

https://github.com/RevolutionAnalytics/rmr2/releases/download/3.3.1/rmr2_3.3.1.tar.gz

https://github.com/RevolutionAnalytics/rhdfs/blob/master/build/rhdfs_1.0.8.tar.gz

https://github.com/RevolutionAnalytics/rhbase/blob/master/build/rhbase_1.2.1.tar.gz

2. centos6.5 上安装R

然后安装相关依赖包:

#yum install gcc-gfortran

#yum install gcc gcc-c++

#yum install readline-devel

#yum install libXt-devel

# tar xvf R-3.2.3.tar.gz

# cd R-3.2.3

# ./configure

# make

# make install

3:确认Java环境变量

RHadoop依赖于rJava包,安装rJava前确认已经配置了Java环境变量,然后进行R对jvm建立连接。

[root@dataserver R-3.2.3]# cat /etc/profile结尾添加

########################################

export JAVA_HOME=/usr/java/jdk1.7.0_79

export JRE_HOME=/usr/java/jdk1.7.0_79/jre

export PATH=/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

export CLASSPATH=.:/lib/dt.jar:/lib/tool.jar

export HADOOP_CMD=/usr/bin/hadoop

export HADOOP_STREAMING=/usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming.jar

export HADOOP_HOME=/usr/hdp/current/hadoop-client

export JAVA_HOME JRE_HOME PATH CLASSPATH

########################################

[root@dataserver R-3.2.3]# R CMD javareconf

4:安装相关的依赖包,确保RHadoop软件包能正常使用

[root@dataserver R-3.2.3]# R

> install.packages("rJava")

> install.packages("reshape2")

> install.packages("Rcpp")

> install.packages("iterators")

> install.packages("itertools")

> install.packages("digest")

> install.packages("RJSONIO")

> install.packages("functional")

> install.packages("bitops")

> install.packages("caTools")

> quit()

或者

install.packages(c("rJava", "Rcpp", "RJSONIO", "bitops", "digest", "functional", "stringr", "plyr", "reshape2", "caTools"))

5:安装RHadoop软件包

[root@dataserver R-3.2.3]# export HADOOP_CMD=/usr/bin/hadoop

[root@dataserver R-3.2.3]# export HADOOP_STREAMING=/usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming.jar

[root@dataserver R-3.0.2]# R CMD INSTALL rhdfs_1.0.8.tar.gz

[root@dataserver R-3.0.2]# R CMD INSTALL rmr2_3.3.1.tar.gz

[root@dataserver R-3.0.2]# R CMD INSTALL rhbase_1.2.1.tar.gz

6:使用RHadoop软件包

[root@dataserver R-3.2.3]# R

> library(rhdfs)

> hdfs.init()

> hdfs.ls("/")

[root@dataserver R-3.2.3]# export HADOOP_HOME=/usr/hdp/current/hadoop-client

> library(rmr2)

普通的R语言程序:

> small.ints = 1:10

> sapply(small.ints, function(x) x^2)

MapReduce的R语言程序:

> small.ints = to.dfs(1:10)

> mapreduce(input = small.ints, map = function(k, v) cbind(v, v^2))

> from.dfs("/tmp/RtmpWnzxl4/file5deb791fcbd5")

如果出现如下异常:

Caused by: java.io.IOException: Cannot run program "Rscript": error=2, No such file or directoryat java.lang.ProcessBuilder.start(ProcessBuilder.java:1048)at org.apache.hadoop.streaming.PipeMapRed.configure(PipeMapRed.java:209)... 23 more
Caused by: java.io.IOException: error=2, No such file or directoryat java.lang.UNIXProcess.forkAndExec(Native Method)at java.lang.UNIXProcess.<init>(UNIXProcess.java:248)at java.lang.ProcessImpl.start(ProcessImpl.java:134)at java.lang.ProcessBuilder.start(ProcessBuilder.java:1029)... 24 more

需要做个链接:

ln -s /usr/local/bin/Rscript /usr/bin/Rscript

如果在centos7上安装R就简单多了:

步骤如下:

yum install epel-release

yum install R

RHadoop安装和使用相关推荐

  1. RHadoop实验 – 统计邮箱出现次数

    RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...

  2. RHadoop培训 之 R基础课

    RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...

  3. 数据分析-R语言资料整理

    独家分享--48页PPT解密数据可视化! Excel图表快捷操作小技巧 基于随机森林的分类与回归 R语言制作网页 ggplot2:可视化设计师的神器,了解一下 [译]R包介绍:Online Rando ...

  4. R语言为Hadoop注入统计血脉

    RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现.有了RHad ...

  5. R语言和hadoop

     Hadoop的家族如此之强大,为什么还要结合R语言? a. Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算),成为了可能. b. R语言的强大之处,在于统计分析 ...

  6. R语言中文社区2018年终文章整理(作者篇)

    欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习,python,R等数据领域感兴趣的同学 ...

  7. R语言与hadoop之间的千万柔情

    Hadoop的家族如此之强大,为什么还要结合R语言? a. Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算),成为了可能. b. R语言的强大之处,在于统计分析, ...

  8. 精心整理 | R语言中文社区历史文章整理(类型篇)

    2018年过去一半了~又到了盘点的时间~感谢长时间来各位好友的关注,我们的成长与你们的爱护是分不开的.更感谢各位老师的投稿,支撑起了我们的这个社区,让更多R语言的爱好者和从业者获得最棒的知识!本文选取 ...

  9. linux安装R包的安装

    首先在linux系统下,需要安装好R语言,由于依赖环境较多,一般会通过第三方软件库进行安装,比如说miniconda等 R包分以下几种: 镜像包:一般安装方式为:install.packages('' ...

  10. r语言工作路径linux,R语言实用基础知识_工作路径-注释-安装和卸载R包_2019-12-01...

    R语言的实用基础知识有很多,都是我在工作和学习中所整理的,有的是看书整理的,也有的是从网络上的各种博客.各种资源获取的,所以我采用日更的方式进行支持整理和更新,希望能够帮到屏幕前的你! 今天是我日更的 ...

最新文章

  1. windows7下安装MongoDB数据库
  2. 技巧.自己学会取名字,学会欣赏
  3. Laravel 的数据库迁移
  4. AutoIT 实现Firefox下载
  5. C++ OpenGL透明纹理源码
  6. 数据库兼容级别对数据备份还原的影响
  7. 关于启动 SecureCRT 遇到一个致命的错误且必须关闭
  8. 前端:JS几种常见的排序
  9. leetcode 214 Shortest Palindrome
  10. android 显示canvas,【报Bug】部分情况下,安卓canvas不显示
  11. php监考,科学网—监考与被监考 - 张珑的博文
  12. 201409-1-相邻数对
  13. 太原理工大学这两年程序设计等竞赛奖牌统计
  14. 【风电功率预测】基于matlab灰狼算法优化LSTM风电功率预测【含Matlab源码 1392期】
  15. 用Html制作网页简单例子
  16. 初中计算机课件flash,初中数学flash课件(共100个)
  17. 重庆交通大学计算机科学与技术怎么样,计算机科学与技术 大学实力哪家强?(干货)...
  18. leetcode LCP 03. 机器人大冒险 -java
  19. elasticsearch api 调用
  20. android edittext 输入法表情,Android开发中EditText禁止输入Emoji表情符

热门文章

  1. ruoyi(若依)框架使用说明(前后端分离)
  2. 【OpenCV 例程 300 篇】101. 自适应中值滤波器
  3. JavaWeb - GET 请求中 URL 的最大长度限制(附:解决方案)
  4. iOS 之 OBJECTC 调用C、OBJECTC调用C++
  5. Axure的使用---原型图
  6. 大数据入门介绍和学习路线
  7. dmx512 java_DMX512协议(示例代码)
  8. nsis出错_怎样解决NSIS错误
  9. 代码版本管理软件Git的优势和用法
  10. 什么原数据更容易平稳_时序数据处理难题攻略(上)