在CDH sandbox中安装并测试livy
安装部分
1、下载Livy安装包,如livy-0.5.0-incubating-bin.zip
2、上传到/opt/livy目录
3、解压安装包 unzip livy-0.5.0-incubating-bin.zip
4、配置Livy使用需要的spark环境变量
export SPARK_HOME=/usr/lib/sparkexport HADOOP_CONF_DIR=/etc/hadoop/conf
5、启动livy
cd /opt/livy/livy-0.5.0-incubating-bin/bin./livy-server start
Livy默认使用端口8998,可以查看http://<IP>:8998/ui
测试部分(通过livy使用spark-shell)
1、创建pyspark会话
[root@quickstart ~]# curl -X POST --data '{"kind": "pyspark"}' -H "Content-Type:application/json" localhost:8998/sessions
{"id":1,"appId":null,"owner":null,"proxyUser":null,"state":"starting","kind":"pyspark","appInfo":{"driverLogUrl":null,"sparkUiUrl":null},"log":["stdout: ","\nstderr: "]}
2、查看会话状态
[root@quickstart ~]# curl localhost:8998/sessions/1 | python -m json.tool% Total % Received % Xferd Average Speed Time Time Time CurrentDload Upload Total Spent Left Speed
107 1290 107 1290 0 0 43949 0 --:--:-- --:--:-- --:--:-- 75882
{"appId": null, "appInfo": {"driverLogUrl": null, "sparkUiUrl": null}, "id": 1, "kind": "pyspark", "log": ["18/11/25 22:54:38 INFO spark.SparkContext: Added JAR file:/opt/livy/livy-0.5.0-incubating-bin/repl_2.10-jars/livy-repl_2.10-0.5.0-incubating.jar at spark://192.168.64.154:55570/jars/livy-repl_2.10-0.5.0-incubating.jar with timestamp 1543215278500", "18/11/25 22:54:38 INFO executor.Executor: Starting executor ID driver on host localhost", "18/11/25 22:54:38 INFO executor.Executor: Using REPL class URI: spark://192.168.64.154:55570/classes", "18/11/25 22:54:38 INFO util.Utils: Successfully started service 'org.apache.spark.network.netty.NettyBlockTransferService' on port 51955.", "18/11/25 22:54:38 INFO netty.NettyBlockTransferService: Server created on 51955", "18/11/25 22:54:38 INFO storage.BlockManagerMaster: Trying to register BlockManager", "18/11/25 22:54:38 INFO storage.BlockManagerMasterEndpoint: Registering block manager localhost:51955 with 534.5 MB RAM, BlockManagerId(driver, localhost, 51955)", "18/11/25 22:54:38 INFO storage.BlockManagerMaster: Registered BlockManager", "18/11/25 22:54:38 INFO driver.SparkEntries: Spark context finished initialization in 6592ms", "18/11/25 22:54:41 INFO driver.SparkEntries: Created SQLContext."], "owner": null, "proxyUser": null, "state": "idle"
}
state为idle表示该会话存活,已经准备就绪,可以向该会话提交任务了
3、提交任务
[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"1 + 1"}'
{"id":0,"code":"1 + 1","state":"waiting","output":null,"progress":0.0}
从返回可以看出,生成了一个statement,id为0,我们可以查看该statement的运行状态以及结果。
4、查看任务结果
[root@quickstart ~]# curl localhost:8998/sessions/1/statements/0
{"id":0,"code":"1 + 1","state":"available","output":{"status":"ok","execution_count":0,"data":{"text/plain":"2"}},"progress":1.0}
5、继续提交任务
[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"a = 10"}'
{"id":1,"code":"a = 10","state":"available","output":{"status":"ok","execution_count":1,"data":{"text/plain":""}},"progress":1.0}
从返回可以看出,生成了一个statement,id为1
6、执行a+1操作
[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"a + 1"}'
{"id":2,"code":"a + 1","state":"available","output":{"status":"ok","execution_count":2,"data":{"text/plain":"11"}},"progress":1.0}
从返回可以看出,生成了一个statement,id为2,执行的代码为a+1,返回的结果为11
也可以通过如下接口查看执行结果
[root@quickstart bin]# curl localhost:8998/sessions/1/statements/2
{"id":2,"code":"a + 1","state":"available","output":{"status":"ok","execution_count":2,"data":{"text/plain":"11"}},"progress":1.0}
其它
1、通过livy还可以提交spark代码、执行python文件等,详细请参考 https://blog.csdn.net/dockj/article/details/53328800
2、在livy界面中查看session列表
3、查看session 1 的详细信息
4、在postman中通过rest API查看
在CDH sandbox中安装并测试livy相关推荐
- 在ubuntu14.04中安装及测试OpenCV
本文记录ubuntu下安装opencv过程,步骤来自 opencv官网 1.安装opencv所需的库(编译器.必须库.可选库) 转载请说明 http://www.cnblogs.com/llxrl/p ...
- 在Ubuntu中部署并测试Fabric 1.0 Beta
[更新:1.0Beta已经是过去式了,现在出了1.0.0的正式版,请大家参照 http://www.cnblogs.com/studyzy/p/7437157.html 安装Fabric 1.0.0 ...
- cdh 安装_0623-6.2.0-如何在CDH中安装CFM
1.文档编写目的 2019年4月15日,Cloudera在其官网宣布GA两款新的产品Cloudera Flow Management和Cloudera Edge Management,即CFM和CEM ...
- 0623-6.2.0-如何在CDH中安装CFM
Fayson的github: https://github.com/fayson/cdhproject 推荐关注微信公众号:"Hadoop实操",ID:gh_c4c535955d0 ...
- 在Windows家庭版中安装Windows Sandbox(Windows 沙盒)
Windows的版本 Windows有很多版本,例如企业版.专业版和家庭版,而企业版和专业版中的一些功能是家庭版没有的,接下来我将尝试在Windows 11家庭版中安装Windows沙盒 开始了 首先 ...
- jenkins学习笔记2-在centos中安装jenkins master测试环境
在centos中安装jenkins 1)安装目录 pwd (/home/AAA) 2)检查java是否安装 [AAA@Centos_AAA jenkins]$ java -version java v ...
- Ambari在离线环境中安装Hadoop集群
2019独角兽企业重金招聘Python工程师标准>>> http://www.hackbase.com/article-973-1.html (WJW)Ambari在离线环境中安装H ...
- shell中竖线的作用_如何在 Linux 中安装、配置和使用 Fish Shell?
每个 Linux 管理员都可能听到过 shell 这个词.你知道什么是 shell 吗? 你知道 shell 在 Linux 中的作用是什么吗? Linux 中有多少个 shell 可用? -- Ma ...
- 如何在Windows中安装Python?
如何在Windows中安装Python? 1. Python的安装 官网下载:https://www.python.org/downloads/windows/ 点开上面的链接,会发现有很多版本. 首 ...
最新文章
- 【系统分析与设计】业务流程图绘制方法
- const成员或者引用成员必须使用构造函数初始化列表的方式
- 数据用压缩 bcd 码 java_IT职场新人选python,go还是java?用数据来说话
- vue点击按钮之后置成不可用_Vue 动态改变 button 的 disabled 状态
- 13-mysql-子查询
- Laravel——通过邮件找回密码
- python字符串截取后拼接_Python字符串拼接、截断、搜索、替换,python,截取,查找
- python3 在线加密_Python3非对称加密算法RSA实例详解
- RazorPage介绍(一)
- 动态数据源,帆软报表同一个sql语句,根据不同的角色使用不同的连接
- 如何与亦敌亦友的 null 说拜拜?大神原来是这么做的!
- Google地图开发API
- Win10微软拼音使用小鹤双拼方案
- 2018最新手机号码正则表达式
- Win8.1 KB2919355更新无法正常安装完成,解决办法?
- 浅层与深层、局部与全局、低级与高级特征的辨析
- 数据网络卡顿怎么处理_电信数据网络卡顿怎么办 电信iptv卡顿解决方法
- 【2018.12.28】百度网盘永久保存2T容量办法
- 翼支付杯大数据建模大赛-季军方案
- flex android开发中关于请求报文技术操作问题
热门文章
- 化工企业数据分析平台项目之应收款分析
- FFmpeg安卓平台编译
- docker容器使用-图解
- linux查看java进程_linux中查看java进程
- 主板刷安卓 联发科_魅蓝2—来自2015年的青年良品,在2020刷个安卓9.0,起死回生(附教程及资源)...
- java线程池_Java 线程池 8 大拒绝策略,面试必问!
- asp.net oracle 问号,ASP.NET中文变问号问题解决方案
- PyTorch中常用Module和Layer的学习笔记~
- NumPy——生成随机数的学习笔记~
- 【Java】内存解析