2019独角兽企业重金招聘Python工程师标准>>>

服务器上已经有了 hadoop2.7.2环境,这次只用配置spark1.6就可以。

服务器操作系统为centOS6.5

1、安装Scala

下载地址:http://www.scala-lang.org/download/

注:我下载的是scala-2.11.8.tgz

将压缩上传至/usr/local 目录

  • 解压缩

tar -zxvf scala-2.11.8.tgz
  • 做软联接

ln -s scala-2.11.8 scala 
  • 设置环境变量

vim /etc/profile
#追加如下内容
export SCALA_HOME=/usr/scala/scala-2.11.7
export PATH=$PATH:$SCALA_HOME/bin
  • 使环境变量生效

source /etc/profile
  • 测试环境变量设置

scala -version

2、Spark安装与配置

下载: http://spark.apache.org/downloads.html

下载的版本:spark-1.6.1-bin-hadoop2.6.tgz

将压缩文件上传至/usr/local 目录

  • 解压缩
tar -zxvf spark-1.6.1-bin-hadoop2.6.tgz
  • 做软联接
ln -s spark-1.6.1-bin-hadoop2.6.tgz spark
  • 设置环境变量
vim /etc/profile
#追加如下内容
export SPARK_HOME=/usr/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
  • 使环境变量生效
source /etc/profile
  • 测试环境变量设置
spark-shell --version
  • 配置Spark

  • 修改spark-env.sh
cd /usr/local/spark/conf/
cp spark-env.sh.template spark-env.sh
vi spark-env.sh
#追加如下内容
export SCALA_HOME=/usr/local/scala
export JAVA_HOME=/usr/local/jdk
export SPARK_MASTER_IP=192.168.31.213
export SPARK_WORKER_MEMORY=1024m
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
  • 启动Spark
start-all.sh
#停止命令 stop-all.sh 
  • 提交任务到Spark集群

spark-submit --master spark://192.168.31.213:7077 --class 主函数入口 --name 自己起个名称  jar包的全路径
例:spark-submit --master spark://192.168.31.213:7077 --class cn.crxy.dataming.tfidf.TFIDF  --name tfidf tfidf.jar 
  • 提交任务到yarn中
spark-submit  --master yarn-cluster --class cn.crxy.dataming.tfidf.TFIDF  --name tfidf tfidf.jar 
  • 使用web查看任务运行状态   http://192.168.31.213:8088/

转载于:https://my.oschina.net/xiaoluobutou/blog/675897

搭建 Hadoop2.7.2 + Spark1.6环境相关推荐

  1. 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境

    近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...

  2. 搭建hadoop2.6.0集群环境

    一.规划 (一)硬件资源 10.171.29.191 master 10.171.94.155  slave1 10.251.0.197 slave3 (二)基本资料 用户:  jediael 目录: ...

  3. Hadoop实战(6)_搭建Apache Hadoop的Eclipse开发环境

    系列目录: Hadoop实战(1)_阿里云搭建Hadoop2.x的伪分布式环境 Hadoop实战(2)_虚拟机搭建Hadoop的全分布模式 Hadoop实战(3)_虚拟机搭建CDH的全分布模式 Had ...

  4. windows下搭建hadoop-2.6.0本地idea开发环境

    概述 本文记录windows下hadoop本地开发环境的搭建: OS:windows hadoop执行模式:独立模式 安装包结构: Hadoop-2.6.0-Windows.zip- cygwinIn ...

  5. Windows8.1+Eclipse搭建Hadoop2.7.2本地模式开发环境

    下面介绍如何在Windows8.1上搭建hadoop2.7.2的本地模式开发环境,为后期做mapreduce的开发做准备. 在搭建开发环境之前,首先选择开发工具,就是大家都很熟悉的Eclipse(本人 ...

  6. Hadoop2.2.0伪分布式环境搭建(附:64位下编译Hadoop-2.2.0过程)

    Hadoop2.2.0伪分布式环境搭建: 写在前面:Hadoop2.2.0默认是支持32位的OS,如果想要在64位OS下运行的话,可以通过在64位OS下面编译Hadoop2.2.0来实现,编译的操作步 ...

  7. # 从零開始搭建Hadoop2.7.1的分布式集群

    Hadoop 2.7.1 (2015-7-6更新),Hadoop的环境配置不是特别的复杂,可是确实有非常多细节须要注意.不然会造成很多配置错误的情况.尽量保证一次配置正确防止重复改动. 网上教程有非常 ...

  8. [Hadoop][笔记]4个节点搭建Hadoop2.x HA测试集群

    为什么80%的码农都做不了架构师?>>>    搭建Hadoop2.x HA 1.机器准备 虚拟机 4台 10.211.55.22 node1 10.211.55.23 node2 ...

  9. Linux上搭建Hadoop2.6.3集群以及WIN7通过Eclipse开发MapReduce的demo

    随笔 - 70  文章 - 0  评论 - 88 Linux上搭建Hadoop2.6.3集群以及WIN7通过Eclipse开发MapReduce的demo 近期为了分析国内航空旅游业常见安全漏洞,想到 ...

最新文章

  1. 人脸检测--Supervised Transformer Network for Efficient Face Detection
  2. this指向总结(无栗子)
  3. FisherVector编码的来龙去脉
  4. Tomcat虚拟主机
  5. android从服务检查,android开发分享Android:你如何检查是否启用了特定的AccessibilityService...
  6. java-Comparable和Comparator的用法
  7. Mono 的Virtual PC 虚拟机
  8. linux 自动登录
  9. 我在项目中运用 IOC(依赖注入)--入门篇
  10. 线程同步之条件变量和信号量(生产者消费者模型)
  11. c++ 覆盖、重载与隐藏
  12. mysql学生管理系统背景_学生基本系统管理
  13. aforge java_基于Aforge摄像头调用简单实例
  14. Matlab实现snn代码,SNN系列|神经元模型篇(3)SRM
  15. Mac更新Moterey后Alfred无法使用有道词典workflow
  16. Rest Stops
  17. 网店推广之百度百科推广
  18. 常见的文件头信息对照表
  19. CTF基础知识-Web
  20. 【LINUX】libgd-GD库安装

热门文章

  1. boost::contract模块实现base types的测试程序
  2. Boost:将帧传输到GPU以及如何应用用OpenCL编写的naive optical flow
  3. ITK:计算图像在特定方向上的导数
  4. VTK:可视化算法之HeadSlice
  5. VTK:PolyData之MergePoints
  6. OpenCV视频中的人脸标志检测
  7. OpenGL多光源Multiple lights
  8. QT的QGLShaderProgram类的使用
  9. C++ 接口(抽象类)
  10. matlab的svm工具箱的安装