hue 集成spark+livy

一.先决条件

安装hue、hadoop。

二.spark on yarn 安装

1.添加环境变量 vim /etc/profile

SCALA_HOME=/opt/scala

SPARK_HOME=/opt/spark

2.配置spark; vim conf/spark-env.sh

#服务器域名

SPARK_LOCAL_IP=node7

#master 地址

SPARK_MASTER_HOST=node7

#master 端口

SPARK_MASTER_PORT=7077#spark ui 端口

SPARK_MASTER_WEBUI_PORT=8080#hadoop 配置目录

export HADOOP_CONF_DIR=/opt/hadoop-2.7.4/etc/hadoop/

3.配置spark ;vim conf/spark-defaults.conf

#spark 依赖的jar包

spark.yarn.jars=hdfs://node7:9010/user/sparkJars/jars/*

hdfs://node7:9010/user/sparkJars/jars/* 该路径的由来:

1. 找到spark程序目录的jars目录,如下图:

2.将该路径的jars包上传到hdfs的目录 (本例子中的hdfs路径是:/user/sparkJars/jars)

注:如果不配置该路径,那么每次提交spark 程序时就会上传jars包,这样会影响提交程序的效率,同时会占用hdfs的磁盘空间。

4.测试部署

使用spark-shell打开scala客户端。

./bin/spark-shell --master yarn --deploy-mode client

如果yarn 后台上面出现下图的记录,则表示部署成功。

三.安装livy

1. 下载livy 安装包

2.设置环境变量

vim /etc/profile

#spark程序目录

export SPARK_HOME=/opt/spark

#hadoop 配置目录

export HADOOP_CONF_DIR=/opt/hadoop-2.7.4/etc/hadoop/

再执行source profile命令,让环境变量生效

3.解压zip包

unzip livy-0.5.0-incubating-bin.zip

mvlivy-0.5.0-incubating-bin.zip livy-0.5.0

4.配置livy

vi livy.conf

#livy服务端口

livy.server.port= 8998#spark程序部署使用yarn集群

livy.spark.master=yarn

#spark 程序使用客户端模式

livy.spark.deploy-mode =client

四.配置hue

1.配置hue.ini

vim hue.ini

[spark]

# livy 服务器域名

livy_server_host=node8

# livy 服务器端口

## livy_server_port=8998# Configure Livy to startin local 'process' mode, or 'yarn'workers.

livy_server_session_kind=yarn

五.验证配置是否正确

1.登录hue后台,打开scala编辑页,执行以下scala代码

var counter = 0val data= Array(1, 2, 3, 4, 5)

var rdd=sc.parallelize(data)//Wrong: Don't do this!!

rdd.map(x=>x+1).collect()

出现如下结果,则证明集成成功。

六.可能出现的问题

1. 在执行spark on yarn部署阶段,执行“spark-shell --master yarn --deploy-mode client” 命令,出现异常:spark on yarn Another instance of Derby may have already booted the database

则执行ps -ef |grep spark-shell ,找到进程号,执行 命令:“kill -9 进程号”,杀死spark-shell进程,再次执行“spark-shell --master yarn --deploy-mode client” 就解决了。

2.再执行spark on yarn部署阶段,执行“spark-shell --master yarn --deploy-mode client” 命令,出现:Spark on yarn Container beyond virtual memory limits

解决方法:修改hadoop 的yarn-site.xml ,新增如下配置

yarn.nodemanager.vmem-check-enabled

false

livy使用样例_hue 集成spark+livy相关推荐

  1. livy使用样例_livy提交spark应用

    spark-submit的使用shell时时灵活性较低,livy作为spark提交的一种工具,是使用接口或者java客户端的方式提交,可以集成到web应用中 1.客户端提交的方式 核心代码 LivyC ...

  2. livy使用样例_使用Spark的REST服务Livy

    Apache Livy简介 Apache Livy是由Cloudera Labs贡献的基于Apache Spark的开源REST服务,它不仅以REST的方式代替了Spark传统的处理交互方式,同时也提 ...

  3. livy使用样例_[Spark]使用Spark的REST服务Livy

    Apache Livy简介 Apache Livy是由Cloudera Labs贡献的基于Apache Spark的开源REST服务,它不仅以REST的方式代替了Spark传统的处理交互方式,同时也提 ...

  4. livy使用样例_黑猴子的家:利用 livy 远程提交 spark作业

    livy是cloudera开发的通过REST来连接.管理spark的解决方案,此文记录在使用livy中遇到的一些问题 1.livy的下载 livy安装不多赘述,可以从github上自己build,也可 ...

  5. livy使用样例_在 Amazon EMR 中使用 Apache Knox 实现边界安全

    边界安全可帮助提升Apache Hadoop 集群的安全性,防止用户从集群外访问过程中带来的威胁.它与 Apache Hadoop 集群的 REST 和 HTTP 交互启用了单个的访问点的方式,简化了 ...

  6. 使用SALT-API进入集成开发的简单样例

    测试的时候,可以CURL -K,但真正作集成的时候,却是不可以的. 必须,不可以让TOKEN满天飞吧. 现在进入这个阶段了.写个样例先: import salt import salt.auth im ...

  7. spark报错 Unable to find encoder for type 你的样例类名

    spark样例类 为什么报错没有spark的Encoder // _ooOoo_ // o8888888o // 88" . "88 // (| -_- |) // O\ = /O ...

  8. SpringBoot专栏:集成mybatis以及restful风格样例演示(第8讲)

    重点讲解下restfull风格,然后快速集成下mybatis,最后会提供下项目实战中一年应用的样例,欢迎点评 什么是REST 一种软件架构风格.设计风格,而不是标准,只是提供了一组设计原则和约束条件. ...

  9. 浅谈Spark Livy

    Spark Livy 什么是Livy Livy的特点 Livy的运作流程阐述 Livy的安装.启动.访问 Livy的使用 1. 什么是Livy livy是cloudera开发的通过REST来连接.管理 ...

最新文章

  1. 如何利用python3创建数据表_python3创建表及表数据;
  2. (转)浅析CSS——元素重叠及position定位的z-index顺序
  3. 马云给20万女医护送礼物:花呗额度翻倍和3年分期免息
  4. 英伟达为全自动驾驶汽车打造AI计算机,计算力达上代10倍
  5. [知识竞赛策划方案] 【图】关于知识竞赛抢答器的问题
  6. VISUAL STUDIO 与 MATLAB实现混合编程
  7. 位说法的由来_南方土地庙有榕树的原因,为何会有榕树不容人的说法?
  8. 单片机c语言仿真,单片机c语言教程:C51表达式语句及仿真器
  9. 90后男屌丝如何让淘宝客日赚10万滴
  10. Mac电脑快速断网详细
  11. 4.SQL常用函数汇总
  12. drop python_用Python做自己的AirDrop 1 - 环境搭建
  13. 一个简单到令人发指的 ADRCI 工具操作方法
  14. 是配置在计算机硬件上的最基本的系统软件,试题库
  15. 集中式存储和分布式存储
  16. 基于 shell 的自动邮件任务监测器
  17. 2011款的Mac Air 只装Windows 7 怎么把开机的咣的声音关掉
  18. 苹果库乐队怎么玩_自制手机铃声(苹果)
  19. 水利专业学计算机吗,大学哪些专业最易被误解?计算机专业居榜首,水利学生气到不行!...
  20. 面了20家,原来大厂面试的套路是……

热门文章

  1. 【conda安装pytorch总是下载cpu版本的问题】
  2. 0error,0warning保佑
  3. java 周总结_Java本周总结1
  4. vue移动端表格,超出横向滚动,固定第一列
  5. 【数仓】数据仓库—数据集成
  6. 碰撞盒使用-MeshCollider
  7. git (master|MERGING)合并冲突
  8. HBase基本架构及原理
  9. 【搞定左神算法初级班】第4节:二叉树及相关常见面试题
  10. MAPPO:The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games