Spark 提供了 Web UI 来对 Spark 应用进行监控。

每个 SparkContext 会启动一个 web UI,默认是在 4040 端口。它显示了应用相关的有用的信息,包括:

  • 一系列的 scheduler stage 和 task
  • RDD 大小和内存占用的概要
  • 环境信息
  • 正在运行的 executor 的一些信息

只要打开 http://:4040 就可以看到该页面。如果有多个 SparkContext 运行在同一个主机上,将会从端口 4040,4041, 4042 依次占用。

不过默认情况下,只在有应用运行期间这些信息才会存在。应用执行完毕,就无法查看了。如果想要在应用执行完毕后还能够查看 web UI,需要在启动应用前设置 spark.eventLog.enabled 为 true。这个选项会将 web UI 的信息进行持久化。

将以下信息写入到 etc/spark-defaults.conf

spark.eventLog.enabled true
spark.eventLog.dir     file:/home/hadoop/data/spark/spark-logs
spark.history.fs.logDirectory file:/home/hadoop/data/spark/spark-logs                          

需要注意的是:

  • spark.eventLog.dirspark.history.fs.logDirectory 两个选项的路径必须相同,否则无效。
  • 设置的路径,比如例中的 /home/hadoop/data/spark/spark-logs ,无论是本地目录,还是 HDFS ,都需要先行创建好在启动应用,如果启动 Spark 时该目录不存在,会报错。

比如在 HDFS 中存储,hdfs dfs -mkdir /eventLog 在 HDFS 中创建目录,然后设置 spark-defaults.conf:

spark.eventLog.enabled true
spark.eventLog.dir     hdfs://Master:9000/eventLog
spark.history.fs.logDirectory hdfs://Master:9000/eventLog         

参考:

  • Monitoring and Instrumentation
  • https://hadoophard.wordpress.com/2016/09/07/spark-history-server-not-working/

Spark History Server 没有生效相关推荐

  1. Spark History Server配置及其启动

    Spark history Server产生背景 以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该WEB ...

  2. YARN, MR History Server和Spark History Server

    转载来自:http://blog.csdn.net/cymvp/article/details/52090348 YARN, MR History Server和Spark History Serve ...

  3. Spark History Server和Event Log详解

    前言 Spark如何持久化event SHS启动参数 SHS工作流程 DiskCache 读取eventlog 参考 前言 这篇文章会overall的介绍一下Spark History Server和 ...

  4. spark history server内存不足服务自动挂掉

    版本:Spark 1.5.2 built for Hadoop 2.4.0 今天spark的history server自己挂掉了,查看日志: 16/05/13 14:12:30 WARN DFSCl ...

  5. Spark history server 启动报错:History server ui acls disabled; users with admin permissions

    报错原因:hadoop没启动 在启动前,需要先启动 hadoop 和 zookeeper 报错信息: FsHistoryProvider:54 - History server ui acls dis ...

  6. 【网址收藏】Spark History Server配置及使用

    https://blog.csdn.net/xiligey1/article/details/82457302

  7. Spark入门 - History Server配置使用

    问题描述 在Spark安装成功后,无论是通过spark-submit工具还是通过Intellij IDEA提交任务,只要在Spark应用程序运行期间,都可以通过WebUI控制台页面来查看具体的运行细节 ...

  8. Spark: history Server

    1.Spark history Server产生背景 以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该W ...

  9. spark on yarn 配置history server

    spark在yarn模式下配置history server 1.建立hdfs文件 – hadoop fs -mkdir /user/spark – hadoop fs -mkdir /user/spa ...

  10. spark job server原理

    配置相关 settings.sh 功能:配置环境变量 APP_USER/APP_GROUP:作业提交用户和组 JMX_PORT:java jmx端口,通常在aws或者其他容器里打开 INSTALL_D ...

最新文章

  1. oracle查看被锁的表和解锁
  2. PCL中PFH、FPFH理论
  3. Scikit-Learn 机器学习笔记 -- MNIST
  4. 安卓学习 之 Activity(二)
  5. 若川知乎高赞:有哪些必看的 JS 库?
  6. 几种常见的电话光端机连接图以及电话光端机的连接方式
  7. One2One主键关联的实现
  8. 打破10倍速软件工程师神话
  9. dell服务器硬件参数提升速度,DELL R620服务器配置
  10. webdriver爬虫#document问题
  11. C语言实现(小米面试题)给定一个句子(只包含字母,空格,逗号和句号), 将句子中的单词位置反转,符号不变。(使用指针)
  12. 数据库视图view简介
  13. 鸿蒙系统1004无标题,win10 10041更新提示错误怎么处理
  14. 苹果硬改手机底层udid无限新机技术
  15. AltiumDesigner中如何将原理图导成黑白色图
  16. 一个屌丝程序猿的人生(九十)
  17. springcloud-微服务
  18. 在线计算机词典,精编英汉计算机词典.pdf
  19. ssm+jsp计算机毕业设计大媛小南美味佳肴网站8p0nh(程序+LW+源码+远程部署)
  20. Microsoft 登陆微软账号一直加载不进去 解决方案整理

热门文章

  1. 打开本地html加载网页慢,网页打开慢怎么办 影响网页打开速度因素有哪些【解决方法】...
  2. Connectable high duty cycle directed advertising
  3. SAP PO的结算状态
  4. Chinese-ELECTRA ‘adam_m not found in checkpoint ‘
  5. Online Convex Making Gradient Descent Optimal for Strongly Convex Stochastic Optimization
  6. Mysql优化-02
  7. Faulty Odometer(进制转化)
  8. python自动上传图片_Python+selenium自动上传博客图片至新浪微博相册
  9. 数据结构(Java)-排序算法-插入排序
  10. 神探狄仁杰是一个Debug高手