spark  history Server产生背景

  以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息;但该WEBUI随着Application的完成(成功/失败)而关闭,也就是说,Spark Application运行完(成功/失败)后,将无法查看Application的历史记录;

  Spark history Server就是为了应对这种情况而产生的,通过配置可以在Application执行的过程中记录下了日志事件信息,那么在Application执行结束后,WEBUI就能重新渲染生成UI界面展现出该Application在执行过程中的运行时信息;

  Spark运行在yarn或者mesos之上,通过spark的history server仍然可以重构出一个已经完成的Application的运行时参数信息(假如Application运行的事件日志信息已经记录下来);

spark  history Server的配置

 1. 在Spark的conf目录下/usr/local/spark-1.6.0-bin-hadoop2.6/conf,将spark-defaults.conf.template改名为spark-defaults.conf
      mv spark-defaults.conf.template spark-defaults.conf   

  

spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6$ ls
bin data examples licenses NOTICE README.md work
CHANGES.txt derby.log lib logs python RELEASE
conf ec2 LICENSE metastore_db R sbin
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6$ cd conf/
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$ ls
docker.properties.template metrics.properties.template spark-env.sh
fairscheduler.xml.template slaves
log4j.properties.template spark-defaults.conf.template
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$ mv spark-defaults.conf.template spark-defaults.conf
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$ ls
docker.properties.template metrics.properties.template spark-env.sh
fairscheduler.xml.template slaves
log4j.properties.template spark-defaults.conf
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$

  

 2. 对spark-defaults.conf 配置

spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$ vim spark-defaults.conf

spark.eventLog.enabled           true
spark.eventLog.dir hdfs://SparkSingleNode:9000/historyserverforSpark
spark.history.ui.port            18080
spark.history.fs.logDirectory    hdfs://SparkSingleNode:9000/historyserverforSpark

 3.启动history-server

spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6/conf$ cd ..
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6$ sbin/start-history-server.sh
starting org.apache.spark.deploy.history.HistoryServer, logging to /usr/local/spark/spark-1.5.2-bin-hadoop2.6/sbin/../logs/spark-spark-org.apache.spark.deploy.history.HistoryServer-1-SparkSingleNode.out
failed to launch org.apache.spark.deploy.history.HistoryServer:
full log in /usr/local/spark/spark-1.5.2-bin-hadoop2.6/sbin/../logs/spark-spark-org.apache.spark.deploy.history.HistoryServer-1-SparkSingleNode.out
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6$ jps
6816 Jps
3876 Worker
6772 HistoryServer
3174 NameNode
5990 CoarseGrainedExecutorBackend
3703 Master
3453 SecondaryNameNode
3293 DataNode
5887 SparkSubmit
spark@SparkSingleNode:/usr/local/spark/spark-1.5.2-bin-hadoop2.6$

 

4、spark-env.sh

5.在web浏览器中查看http://SparkSingleNode:18080/ 显示页面

1.6.0 History Server

Event log directory: hdfs://Master:9000/historyserverforSpark

成功!

Spark history-server 配置 !运维人员的强大工具相关推荐

  1. Spark History Server配置及其启动

    Spark history Server产生背景 以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该WEB ...

  2. 【网址收藏】Spark History Server配置及使用

    https://blog.csdn.net/xiligey1/article/details/82457302

  3. Spark入门 - History Server配置使用

    问题描述 在Spark安装成功后,无论是通过spark-submit工具还是通过Intellij IDEA提交任务,只要在Spark应用程序运行期间,都可以通过WebUI控制台页面来查看具体的运行细节 ...

  4. vue打包后供运维人员配置

    方便部署人员配置md5加密 public文件打包不会乱 所以新建pas.js文件 ismd5 = false; public里的index页面引入 在需要页面引用 data里声明  window: w ...

  5. 运维人员处理云服务器故障的方法总结

    2019独角兽企业重金招聘Python工程师标准>>> 我们团队为Ucloud云计算服务提供专家技术支持,每天都要碰到无数的用户故障,毕竟IAAS涉及比较底层的东西,不管设计的是大客 ...

  6. 运维人员的补丁盛宴 四月修复微软Adobe漏洞合计过百!

    运维人员的补丁盛宴 四月修复微软Adobe漏洞合计过百! 文/图 王文文 北京时间2010年4月14日,微软发布了四月安全公告,共11个,用于修复Windows操作系统及Office等软件的大约92个 ...

  7. Linux运维人员共用root帐户权限审计

    在中小型企业,公司不同运维人员基本都是以root 账户进行服务器的登陆管理,缺少了账户权限审计制度.不出问题还好,出了问题,就很难找出源头. 这里介绍下,如何利用编译bash 使不同的客户端在使用ro ...

  8. docker 厂商 容器_疫情期间,Docker让运维人员雪上加霜

    2020疫情原因,公司业绩下滑严重,于是决定给团队瘦身,经过激烈的讨论,最终决定先从运维人员开始.原因是我们引入了Docker.它部署项目相比之前要简单许多.运维的工作完全可以被开发替代.当然我们小公 ...

  9. 运维人员必备的Linux系统命令汇总

    运维人员必备的Linux系统命令汇总 线上查询及帮助命令 文件和目录操作 查看文件及内容处理 文件压缩及解压缩 信息显示 搜索文件 用户管理 基础网络操作 深入网络操作 有关磁盘与文件系统 系统权限及 ...

最新文章

  1. LNMP(nginx php-fpm mysql) 环境部署——mysql
  2. 一套Semantic-UI的前端界面
  3. 不是你无法入门自然语言处理(NLP),而是你没找到正确的打开
  4. 【ArcGIS风暴】ArcGIS获取线段上等间距的点
  5. 【完成整理】45套很酷的长影影 LOGO 设计
  6. “约见”面试官系列之常见面试题第二十四篇之vue-router使用(建议收藏)
  7. {ACL2020}In Layman’s Terms: Semi-Open Relation Extraction from Scientific Texts(关系抽取,半开放关系抽取)
  8. 子恩域名授权系统2.0全解无加密无授权版盗版入库源码
  9. C++根据系统时间生成不重复的随机数
  10. 云图说|OLAP开源引擎的一匹黑马,MRS集群组件之ClickHouse
  11. 746.使用最小花费爬楼梯
  12. 软件测试_Loadrunner_APP测试_性能测试_脚本优化_脚本回放
  13. 关于高德地图自定义地图样式只显示中国的解决方案
  14. 计算机关机又自动重启,电脑关机后自动重启是什么原因?Win10关机变重启原因及解决方法...
  15. google注册账号使用手机号提示注册此号码无法用于验证
  16. Supported media formats (支持的媒体格式)
  17. 利用机器学习算法挖掘群控网络黑产设备
  18. 罗切斯特大学计算机博士,罗切斯特大学生物博士排名,千万得慎重点看清
  19. python行星名称输出_用python绘制行星轨道
  20. 2、JavaScript快速入门

热门文章

  1. 测量不确定度matlab,基于MATLAB用蒙特卡洛法评估测量不确定度简介,目录书摘
  2. java随机抽题系统_什么样的考试场景需要使用随机试卷模式?
  3. 有效解决OneNote同步问题
  4. 微信小程序获取windowHeight出现不同页面高度不一致问题及解决方案
  5. python异常处理与导入模块与导入包
  6. 【Windows 10 v1703】解决桌面出现Removable Storage Devices的问题
  7. Hybrid App技术批量制作APP应用与跨平台解决方案
  8. html2canvas+jspdf 完美解决html导出且分页 解决图片显示不全问题
  9. 解决问题:swiper动态加载图片后无法滑动
  10. jQuery hasAttr检查元素是否有属性[重复]