作业的提交和监控

Job为作业提交者提供了作业的视图,允许用户管理作业,提交作业,控制作业的执行和查询作业状态,比如跟踪map和reduce任务的执行进度。该类提供的set方法只有在作业已经被提交后才生效,否则将会抛出IllegalStateException异常。作业的提交过程包括:

1.       检查作业的输入输出规范。

2.       计算作业InputSplit的值。

3.       如果必要,设置作业的DistributedCache 的必需计费信息。

4.       拷贝作业的jar文件和配置管理文件到MapReduce在文件系统的目录中。

5.       提交作业到JobTracker并可选地监控其状态。

作业的历史文件被记录到由hadoop.job.history.user.location 指定的目录中,默认值为作业的输出目录,文件被存储到指定目录下的_logs/history/中。因此,默认情况,历史文件将被存放在mapred.output.dir/_logs/history中。用户可以通过将hadoop.job.history.user.location的值设置为none阻止记录日志。

用户可以使用下面的命令浏览指定目录下的历史日志摘要:$ bin/hadoop job -history output-dir 。该命令将会打印作业的详细信息,失败和被杀死的作业的详细信息。更多关于作业的详细信息,比如成功的任务和每个任务的尝试次数可以以使用下面的命令浏览:$ bin/hadoop job -history all output-dir 。用户可以使用

Hadoop学习之MapReduce(五)相关推荐

  1. Hadoop学习之MapReduce

    Hadoop学习之MapReduce 目录 Hadoop学习之MapReduce 1 MapReduce简介 1.1 什么是MapReduce 1.2 MapReduce的作用 1.3 MapRedu ...

  2. 第三节 Hadoop学习案例——MapReduce课程设计 好友推荐功能

    提示:文章内容主要以案例为主 目录 前言 项目说明 一,程序需求 1.需求 2.数据 二,编码操作 1.项目建包目录 2.FriendsRecommend.java 3.FriendsRecommen ...

  3. Hadoop学习之MapReduce(三)

    在学习过MapReduce框架的几个关键类和接口后(只是简单的说明了类或者接口的作用及使用方式,要想深入了解如何工作的就需要深入研究源代码了,这也是计划中的学习任务),接下来看看任务的执行和环境,主要 ...

  4. Hadoop学习之Mapreduce执行过程详解

    一.MapReduce执行过程 MapReduce运行时,首先通过Map读取HDFS中的数据,然后经过拆分,将每个文件中的每行数据分拆成键值对,最后输出作为Reduce的输入,大体执行流程如下图所示: ...

  5. Hadoop学习之MapReduce(四)

    接下来是跟MapReduce目录结构有关的参数.首先看两个参数,分别为在core-default.xml中定义的hadoop.tmp.dir,其默认值为/tmp/hadoop-${user.name} ...

  6. Hadoop学习之MapReduce(二)

    在通过WordCount的例子直观地了解了MapReduce框架的作业如何编写后,现在对MapReduce框架中的关键接口或者类进行深入地地探索和学习.主要讲解Hadoop1.x中的接口和类,也就是o ...

  7. Hadoop学习之MapReduce(一)

    在学习过了HDFS架构和Hadoop的配置管理后,现在学习MapReduce应用程序的编写和管理.首先简单介绍一下MapReduce框架. MapReduce是一个易于编写程序的软件框架,这些应用程序 ...

  8. Hadoop学习之MapReduce分布式计算框架

    目录 一.本地模式 1.新建一个本地maven项目 2.修改prom依赖(maven) 3.新建一个包mapreduce,在该包中新建三个包 4.写mapper组件 5.写Reducer组件 6.写D ...

  9. Hadoop学习之路(五):Hadoop交互关系型数据库(MySQL)

    内容简介 一.Hadoop与数据库交互简介 二.操作前的准备 1.创建表 2.将数据插入表words中 2.将MySQL的驱动分发到所有的Hadoop节点 三.Hadoop与MySQL交互实现 1.创 ...

最新文章

  1. jdk安装和环境变量的配置
  2. STM32 基础系列教程 1- CubeMX+GPIO
  3. 【项目管理】聊聊项目管理几点实践和理解(1)
  4. 两点坐标间距离的算法以及验证【转】
  5. javascript 不让成为nan_这10个JavaScript面试题,看看你会几个?
  6. php 文件内容对比,php 比较两个文件是否相同
  7. html中两个图片叠放,CSS实现图片叠放(勾选图标)
  8. 3.SpringBoot+Redis
  9. pip安装第三方库的一些站点
  10. ESXI 7.0封装Intel网卡驱动
  11. 命令行LOGO在线生成网站
  12. 回合制游戏指令的执行机制
  13. 静态变量(static variable)
  14. SpringBoot项目访问jsp页面500问题处理
  15. QSS 控件背景渐变色
  16. 适用于 Android 初学者的 Dagger 2 - DI 第二部分
  17. linux笔记-系统修复
  18. 数字化资产的时代,如何使用软件工具管理知识资产,这6款工具别错过!
  19. 声音领域的算法库一般有librosa、essentia、torchaudio、深度学习等
  20. Linux中移动光标cw什么意思,linux常用指令详解

热门文章

  1. TCP/IP协议中常用端口表
  2. cygwin不能执行make
  3. 算法提高课-搜索-最短路模型-AcWing 1100. 抓住那头牛:bfs
  4. 塔菲尔曲线斜率的大小_分段函数函数值(自变量)大小(范围)的六种题型
  5. 知识图谱前端插件_大型前端项目可持续演进开发的思考
  6. 怎么看空调定时成功_风管机和中央空调傻傻分不清?看了你就明白怎么选了
  7. python编程快速上手-----让繁琐工作自动化_每周一书《Python编程快速上手 让繁琐工作自动化》分享!...
  8. php代码返回404,php--------返回404状态
  9. 3种团队分组适应项目_暴利生意:3种适合农村夫妻创业致富的项目,年赚10多万...
  10. 计算机视觉编程——图像聚类