livy使用样例_hue 集成spark+livy
hue 集成spark+livy
一.先决条件
安装hue、hadoop。
二.spark on yarn 安装
1.添加环境变量 vim /etc/profile
SCALA_HOME=/opt/scala
SPARK_HOME=/opt/spark
2.配置spark; vim conf/spark-env.sh
#服务器域名
SPARK_LOCAL_IP=node7
#master 地址
SPARK_MASTER_HOST=node7
#master 端口
SPARK_MASTER_PORT=7077#spark ui 端口
SPARK_MASTER_WEBUI_PORT=8080#hadoop 配置目录
export HADOOP_CONF_DIR=/opt/hadoop-2.7.4/etc/hadoop/
3.配置spark ;vim conf/spark-defaults.conf
#spark 依赖的jar包
spark.yarn.jars=hdfs://node7:9010/user/sparkJars/jars/*
hdfs://node7:9010/user/sparkJars/jars/* 该路径的由来:
1. 找到spark程序目录的jars目录,如下图:
2.将该路径的jars包上传到hdfs的目录 (本例子中的hdfs路径是:/user/sparkJars/jars)
注:如果不配置该路径,那么每次提交spark 程序时就会上传jars包,这样会影响提交程序的效率,同时会占用hdfs的磁盘空间。
4.测试部署
使用spark-shell打开scala客户端。
./bin/spark-shell --master yarn --deploy-mode client
如果yarn 后台上面出现下图的记录,则表示部署成功。
三.安装livy
1. 下载livy 安装包
2.设置环境变量
vim /etc/profile
#spark程序目录
export SPARK_HOME=/opt/spark
#hadoop 配置目录
export HADOOP_CONF_DIR=/opt/hadoop-2.7.4/etc/hadoop/
再执行source profile命令,让环境变量生效
3.解压zip包
unzip livy-0.5.0-incubating-bin.zip
mvlivy-0.5.0-incubating-bin.zip livy-0.5.0
4.配置livy
vi livy.conf
#livy服务端口
livy.server.port= 8998#spark程序部署使用yarn集群
livy.spark.master=yarn
#spark 程序使用客户端模式
livy.spark.deploy-mode =client
四.配置hue
1.配置hue.ini
vim hue.ini
[spark]
# livy 服务器域名
livy_server_host=node8
# livy 服务器端口
## livy_server_port=8998# Configure Livy to startin local 'process' mode, or 'yarn'workers.
livy_server_session_kind=yarn
五.验证配置是否正确
1.登录hue后台,打开scala编辑页,执行以下scala代码
var counter = 0val data= Array(1, 2, 3, 4, 5)
var rdd=sc.parallelize(data)//Wrong: Don't do this!!
rdd.map(x=>x+1).collect()
出现如下结果,则证明集成成功。
六.可能出现的问题
1. 在执行spark on yarn部署阶段,执行“spark-shell --master yarn --deploy-mode client” 命令,出现异常:spark on yarn Another instance of Derby may have already booted the database
则执行ps -ef |grep spark-shell ,找到进程号,执行 命令:“kill -9 进程号”,杀死spark-shell进程,再次执行“spark-shell --master yarn --deploy-mode client” 就解决了。
2.再执行spark on yarn部署阶段,执行“spark-shell --master yarn --deploy-mode client” 命令,出现:Spark on yarn Container beyond virtual memory limits
解决方法:修改hadoop 的yarn-site.xml ,新增如下配置
yarn.nodemanager.vmem-check-enabled
false
livy使用样例_hue 集成spark+livy相关推荐
- livy使用样例_livy提交spark应用
spark-submit的使用shell时时灵活性较低,livy作为spark提交的一种工具,是使用接口或者java客户端的方式提交,可以集成到web应用中 1.客户端提交的方式 核心代码 LivyC ...
- livy使用样例_使用Spark的REST服务Livy
Apache Livy简介 Apache Livy是由Cloudera Labs贡献的基于Apache Spark的开源REST服务,它不仅以REST的方式代替了Spark传统的处理交互方式,同时也提 ...
- livy使用样例_[Spark]使用Spark的REST服务Livy
Apache Livy简介 Apache Livy是由Cloudera Labs贡献的基于Apache Spark的开源REST服务,它不仅以REST的方式代替了Spark传统的处理交互方式,同时也提 ...
- livy使用样例_黑猴子的家:利用 livy 远程提交 spark作业
livy是cloudera开发的通过REST来连接.管理spark的解决方案,此文记录在使用livy中遇到的一些问题 1.livy的下载 livy安装不多赘述,可以从github上自己build,也可 ...
- livy使用样例_在 Amazon EMR 中使用 Apache Knox 实现边界安全
边界安全可帮助提升Apache Hadoop 集群的安全性,防止用户从集群外访问过程中带来的威胁.它与 Apache Hadoop 集群的 REST 和 HTTP 交互启用了单个的访问点的方式,简化了 ...
- 使用SALT-API进入集成开发的简单样例
测试的时候,可以CURL -K,但真正作集成的时候,却是不可以的. 必须,不可以让TOKEN满天飞吧. 现在进入这个阶段了.写个样例先: import salt import salt.auth im ...
- spark报错 Unable to find encoder for type 你的样例类名
spark样例类 为什么报错没有spark的Encoder // _ooOoo_ // o8888888o // 88" . "88 // (| -_- |) // O\ = /O ...
- SpringBoot专栏:集成mybatis以及restful风格样例演示(第8讲)
重点讲解下restfull风格,然后快速集成下mybatis,最后会提供下项目实战中一年应用的样例,欢迎点评 什么是REST 一种软件架构风格.设计风格,而不是标准,只是提供了一组设计原则和约束条件. ...
- 浅谈Spark Livy
Spark Livy 什么是Livy Livy的特点 Livy的运作流程阐述 Livy的安装.启动.访问 Livy的使用 1. 什么是Livy livy是cloudera开发的通过REST来连接.管理 ...
最新文章
- 如何利用python3创建数据表_python3创建表及表数据;
- (转)浅析CSS——元素重叠及position定位的z-index顺序
- 马云给20万女医护送礼物:花呗额度翻倍和3年分期免息
- 英伟达为全自动驾驶汽车打造AI计算机,计算力达上代10倍
- [知识竞赛策划方案] 【图】关于知识竞赛抢答器的问题
- VISUAL STUDIO 与 MATLAB实现混合编程
- 位说法的由来_南方土地庙有榕树的原因,为何会有榕树不容人的说法?
- 单片机c语言仿真,单片机c语言教程:C51表达式语句及仿真器
- 90后男屌丝如何让淘宝客日赚10万滴
- Mac电脑快速断网详细
- 4.SQL常用函数汇总
- drop python_用Python做自己的AirDrop 1 - 环境搭建
- 一个简单到令人发指的 ADRCI 工具操作方法
- 是配置在计算机硬件上的最基本的系统软件,试题库
- 集中式存储和分布式存储
- 基于 shell 的自动邮件任务监测器
- 2011款的Mac Air 只装Windows 7 怎么把开机的咣的声音关掉
- 苹果库乐队怎么玩_自制手机铃声(苹果)
- 水利专业学计算机吗,大学哪些专业最易被误解?计算机专业居榜首,水利学生气到不行!...
- 面了20家,原来大厂面试的套路是……
热门文章
- 【conda安装pytorch总是下载cpu版本的问题】
- 0error,0warning保佑
- java 周总结_Java本周总结1
- vue移动端表格,超出横向滚动,固定第一列
- 【数仓】数据仓库—数据集成
- 碰撞盒使用-MeshCollider
- git (master|MERGING)合并冲突
- HBase基本架构及原理
- 【搞定左神算法初级班】第4节:二叉树及相关常见面试题
- MAPPO:The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games