安装部分

1、下载Livy安装包,如livy-0.5.0-incubating-bin.zip
2、上传到/opt/livy目录
3、解压安装包 unzip livy-0.5.0-incubating-bin.zip
4、配置Livy使用需要的spark环境变量

   export SPARK_HOME=/usr/lib/sparkexport HADOOP_CONF_DIR=/etc/hadoop/conf

5、启动livy

    cd  /opt/livy/livy-0.5.0-incubating-bin/bin./livy-server start

Livy默认使用端口8998,可以查看http://<IP>:8998/ui

测试部分(通过livy使用spark-shell)

1、创建pyspark会话

[root@quickstart ~]# curl -X POST --data '{"kind": "pyspark"}' -H "Content-Type:application/json" localhost:8998/sessions
{"id":1,"appId":null,"owner":null,"proxyUser":null,"state":"starting","kind":"pyspark","appInfo":{"driverLogUrl":null,"sparkUiUrl":null},"log":["stdout: ","\nstderr: "]}

2、查看会话状态

[root@quickstart ~]# curl localhost:8998/sessions/1 | python -m json.tool% Total    % Received % Xferd  Average Speed   Time    Time     Time  CurrentDload  Upload   Total   Spent    Left  Speed
107  1290  107  1290    0     0  43949      0 --:--:-- --:--:-- --:--:-- 75882
{"appId": null, "appInfo": {"driverLogUrl": null, "sparkUiUrl": null}, "id": 1, "kind": "pyspark", "log": ["18/11/25 22:54:38 INFO spark.SparkContext: Added JAR file:/opt/livy/livy-0.5.0-incubating-bin/repl_2.10-jars/livy-repl_2.10-0.5.0-incubating.jar at spark://192.168.64.154:55570/jars/livy-repl_2.10-0.5.0-incubating.jar with timestamp 1543215278500", "18/11/25 22:54:38 INFO executor.Executor: Starting executor ID driver on host localhost", "18/11/25 22:54:38 INFO executor.Executor: Using REPL class URI: spark://192.168.64.154:55570/classes", "18/11/25 22:54:38 INFO util.Utils: Successfully started service 'org.apache.spark.network.netty.NettyBlockTransferService' on port 51955.", "18/11/25 22:54:38 INFO netty.NettyBlockTransferService: Server created on 51955", "18/11/25 22:54:38 INFO storage.BlockManagerMaster: Trying to register BlockManager", "18/11/25 22:54:38 INFO storage.BlockManagerMasterEndpoint: Registering block manager localhost:51955 with 534.5 MB RAM, BlockManagerId(driver, localhost, 51955)", "18/11/25 22:54:38 INFO storage.BlockManagerMaster: Registered BlockManager", "18/11/25 22:54:38 INFO driver.SparkEntries: Spark context finished initialization in 6592ms", "18/11/25 22:54:41 INFO driver.SparkEntries: Created SQLContext."], "owner": null, "proxyUser": null, "state": "idle"
}

state为idle表示该会话存活,已经准备就绪,可以向该会话提交任务了

3、提交任务

[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"1 + 1"}'
{"id":0,"code":"1 + 1","state":"waiting","output":null,"progress":0.0}

从返回可以看出,生成了一个statement,id为0,我们可以查看该statement的运行状态以及结果。

4、查看任务结果

[root@quickstart ~]# curl localhost:8998/sessions/1/statements/0
{"id":0,"code":"1 + 1","state":"available","output":{"status":"ok","execution_count":0,"data":{"text/plain":"2"}},"progress":1.0}

5、继续提交任务

[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"a = 10"}'
{"id":1,"code":"a = 10","state":"available","output":{"status":"ok","execution_count":1,"data":{"text/plain":""}},"progress":1.0}

从返回可以看出,生成了一个statement,id为1

6、执行a+1操作

[root@quickstart ~]# curl localhost:8998/sessions/1/statements -X POST -H 'Content-Type: application/json' -d '{"code":"a + 1"}'
{"id":2,"code":"a + 1","state":"available","output":{"status":"ok","execution_count":2,"data":{"text/plain":"11"}},"progress":1.0}

从返回可以看出,生成了一个statement,id为2,执行的代码为a+1,返回的结果为11
也可以通过如下接口查看执行结果

[root@quickstart bin]# curl localhost:8998/sessions/1/statements/2
{"id":2,"code":"a + 1","state":"available","output":{"status":"ok","execution_count":2,"data":{"text/plain":"11"}},"progress":1.0}

其它

1、通过livy还可以提交spark代码、执行python文件等,详细请参考 https://blog.csdn.net/dockj/article/details/53328800

2、在livy界面中查看session列表

3、查看session 1 的详细信息

4、在postman中通过rest API查看

在CDH sandbox中安装并测试livy相关推荐

  1. 在ubuntu14.04中安装及测试OpenCV

    本文记录ubuntu下安装opencv过程,步骤来自 opencv官网 1.安装opencv所需的库(编译器.必须库.可选库) 转载请说明 http://www.cnblogs.com/llxrl/p ...

  2. 在Ubuntu中部署并测试Fabric 1.0 Beta

    [更新:1.0Beta已经是过去式了,现在出了1.0.0的正式版,请大家参照 http://www.cnblogs.com/studyzy/p/7437157.html  安装Fabric 1.0.0 ...

  3. cdh 安装_0623-6.2.0-如何在CDH中安装CFM

    1.文档编写目的 2019年4月15日,Cloudera在其官网宣布GA两款新的产品Cloudera Flow Management和Cloudera Edge Management,即CFM和CEM ...

  4. 0623-6.2.0-如何在CDH中安装CFM

    Fayson的github: https://github.com/fayson/cdhproject 推荐关注微信公众号:"Hadoop实操",ID:gh_c4c535955d0 ...

  5. 在Windows家庭版中安装Windows Sandbox(Windows 沙盒)

    Windows的版本 Windows有很多版本,例如企业版.专业版和家庭版,而企业版和专业版中的一些功能是家庭版没有的,接下来我将尝试在Windows 11家庭版中安装Windows沙盒 开始了 首先 ...

  6. jenkins学习笔记2-在centos中安装jenkins master测试环境

    在centos中安装jenkins 1)安装目录 pwd (/home/AAA) 2)检查java是否安装 [AAA@Centos_AAA jenkins]$ java -version java v ...

  7. Ambari在离线环境中安装Hadoop集群

    2019独角兽企业重金招聘Python工程师标准>>> http://www.hackbase.com/article-973-1.html (WJW)Ambari在离线环境中安装H ...

  8. shell中竖线的作用_如何在 Linux 中安装、配置和使用 Fish Shell?

    每个 Linux 管理员都可能听到过 shell 这个词.你知道什么是 shell 吗? 你知道 shell 在 Linux 中的作用是什么吗? Linux 中有多少个 shell 可用? -- Ma ...

  9. 如何在Windows中安装Python?

    如何在Windows中安装Python? 1. Python的安装 官网下载:https://www.python.org/downloads/windows/ 点开上面的链接,会发现有很多版本. 首 ...

最新文章

  1. 【系统分析与设计】业务流程图绘制方法
  2. const成员或者引用成员必须使用构造函数初始化列表的方式
  3. 数据用压缩 bcd 码 java_IT职场新人选python,go还是java?用数据来说话
  4. vue点击按钮之后置成不可用_Vue 动态改变 button 的 disabled 状态
  5. 13-mysql-子查询
  6. Laravel——通过邮件找回密码
  7. python字符串截取后拼接_Python字符串拼接、截断、搜索、替换,python,截取,查找
  8. python3 在线加密_Python3非对称加密算法RSA实例详解
  9. RazorPage介绍(一)
  10. 动态数据源,帆软报表同一个sql语句,根据不同的角色使用不同的连接
  11. 如何与亦敌亦友的 null 说拜拜?大神原来是这么做的!
  12. Google地图开发API
  13. Win10微软拼音使用小鹤双拼方案
  14. 2018最新手机号码正则表达式
  15. Win8.1 KB2919355更新无法正常安装完成,解决办法?
  16. 浅层与深层、局部与全局、低级与高级特征的辨析
  17. 数据网络卡顿怎么处理_电信数据网络卡顿怎么办 电信iptv卡顿解决方法
  18. 【2018.12.28】百度网盘永久保存2T容量办法
  19. 翼支付杯大数据建模大赛-季军方案
  20. flex android开发中关于请求报文技术操作问题

热门文章

  1. 化工企业数据分析平台项目之应收款分析
  2. FFmpeg安卓平台编译
  3. docker容器使用-图解
  4. linux查看java进程_linux中查看java进程
  5. 主板刷安卓 联发科_魅蓝2—来自2015年的青年良品,在2020刷个安卓9.0,起死回生(附教程及资源)...
  6. java线程池_Java 线程池 8 大拒绝策略,面试必问!
  7. asp.net oracle 问号,ASP.NET中文变问号问题解决方案
  8. PyTorch中常用Module和Layer的学习笔记~
  9. NumPy——生成随机数的学习笔记~
  10. 【Java】内存解析