hadoop1.2.1 tasktracker容错机制分析
1.job级别黑名单
每个Job都会维护自己的黑名单。如果tasktracker被加入该黑名单,则该Job不会再分配给这个节点分配task。流程图如下:

加入黑名单的条件:
1).已经被加入黑名单的数量 < 0.25(常量) * 集群大小
2).该Job在该节点失败的task数 > mapred.max.tracker.failures(默认为4)
2.jobtracker级别的灰名单
在0.20.203版本以前,加入灰名单的tasktracker在不久后会加入到jobtracker级别的黑名单,加入黑名单后jobtracker不为该tasktracker分配lunchtask,只有重启tasktracker才能恢复。在0.20.203版本开始,合并了yahoo的代码之后,tasktracker加入灰名单后没有什么特殊的操作。
加入灰名单的条件:
1)在一定时间内(mapred.jobtracker.blacklist-fault-timeout-window默认180分钟),tasktracker被job加入黑名单的次数 >= mapred.max.tracker.blacklists
2)被job加入黑名单的次数 > 平均每个tasktracker被加入黑名单的次数*(1+50%)
3)已经加入灰名单的tasktracker数 < 总tasktracker数的50%
3.jobtracker级别的黑名单
加入jobtracker级别黑名单的tasktracker,将不会被分配task,直到重启了该tasktracker。把tasktracker加入黑名单的唯一途径 就是:tasktracker执行健康监控脚本,得到tasktracker不健康,通过心跳反馈给jobtracker,jobtracker则把它加入黑名单
以后再贴代码。

鉴于1.2.1中没有使用到tasktracker的灰名单,能否去掉灰名单机制,从而提高jobtracker处理heartbeat的效率。

Hadoop1.2.1 tasktracker容错机制分析,黑名单与灰名单相关推荐

  1. 深入理解 Flink 容错机制

    本文作者:Paul Lin 本文链接: 2019/07/28/深入理解-Flink-容错机制/ 版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 CN 许可协议.转载请注 ...

  2. 《循序渐进学Spark》一3.5 容错机制及依赖

    本节书摘来自华章出版社<循序渐进学Spark>一书中的第3章,第3.5节,作者 小象学院 杨 磊,更多章节内容可以访问云栖社区"华章计算机"公众号查看. 3.5 容错机 ...

  3. qprocess回调_QT进程间通信详细介绍及QProcess机制分析

    1.QT通信机制 为了更好的实现QT的信息交互,在QT系统中创建了较为完善的通信机制.QT的通信可分为QT内部通信和外部通信两大类.对于这两类通信机制及应用场合做如以下分析: (1)QT内部对象间通信 ...

  4. Flink的容错机制

    文章目录 检查点 检查点的保存 从检查点恢复状态 检查点算法 检查点配置 1.启动检查点 2.检查点存储 3.其他高级配置 保存点 1.保存点的用途 2.使用保存点 状态一致性 一致性的概念和级别 端 ...

  5. dubbo的常用容错机制

    容器机制分析 FailoverClusterInvoker (dubbo默认的容错机制)失败重试机制.失败自动切换,当出现失败,重试其它服务器.支持重试的,查询接口,支持幂等的写接口 Failsafe ...

  6. 代码行为异常容错机制与自我调节

    目录 1.吧啦吧啦吧啦 1.1.代码自我意识 1.2.代码功能安全 1.3.代码保密性 1.4.代码执行完整性 1.5.代码的容错机制与自我调节 2.设计观与方法论 2.1 设计观与代码容错机制.自我 ...

  7. Flink核心篇,四大基石、容错机制、广播、反压、序列化、内存管理、资源管理...

    Flink基础篇,基本概念.设计理念.架构模型.编程模型.常用算子 大纲: 1.Flink的四大基石包含哪些? 2.讲一下Flink的Time概念? 3.介绍下Flink窗口,以及划分机制? 4.介绍 ...

  8. Flink中容错机制 完整使用 (第十章)

    Flink中容错机制 完整使用 一.容错机制 1.检查点(Checkpoint) 1. 检查点的保存 1. 周期性的触发保存 2. 保存的时间点 3. 保存的具体流程 2.从检查点恢复状态 (1)重启 ...

  9. Flink教程(14)- Flink高级API(容错机制)

    文章目录 01 引言 02 Checkpoint 2.1 Checkpoint VS State 2.2 Checkpoint 执行流程 2.2.1 简单流程 2.2.2 复杂流程 2.3 State ...

最新文章

  1. php mysqli参数,PHP5 mysqli 绑定参数
  2. 《转》atomic assign retain
  3. android interview 2
  4. insert 语句_CTF从入门到提升(七)insert 等数据表相关操作注入及例题分享
  5. HTTP请求头中各字段解释
  6. SAP用户出口(exit)问题--数据源增强
  7. 连发Science和Nature, 王二涛研究员:推倒教科书里的“围墙”
  8. javacc解析json报错
  9. 常见十大排序算法--python3实现
  10. stc流水灯c语言程序,求51单片机流水灯跑马灯程序设计 (STC89C52RC)??
  11. 牛逼的电商运营为什么不自己开店铺要去打工?(知乎精选)
  12. 从零学Java(10)之方法详解,喷打野你真的没我6!
  13. 【网站】比较知名的大型公司官网清单可以收藏关注一下,欢迎您来补充
  14. Linux 内核签名(签名内核模块)、linux 驱动签名
  15. 【linux3.10】内存反向映射中的anon_vma是per process的吗?
  16. 如何在网站里插入视频
  17. CentOS7 阻止笔记本合盖时休眠
  18. 【网红流水线车间】“制造”李佳琦们的神秘组织,到底是怎么让网红火起来的?...
  19. nginx server name “*“ has suspicious symbols
  20. VB 2010 (52)Connection对象

热门文章

  1. linux 内核版本 4.4,Linux Kernel 4.4 正式发布下载
  2. 三星手机语音测试软件,三星 Galaxy Buds Pro获软件更新 提升语音检测功能的切换速度...
  3. mkdir命令(主要是mkdir的参数)
  4. 中信国健临床通讯2011年6月期目录
  5. switch动森amiibo数据_switch日报:动森amiibo卡中文化!波斯王子爆NS版
  6. eclipse无法生成class文件,servlet修改后未更新,总是重启服务器
  7. html css前端框架,14个最佳的HTML/CSS设计和开发框架
  8. 金品网站项目第一步:网站策划
  9. 一般来说,GET产生一个TCP数据包;POST产生两个TCP数据包。
  10. Linux下Redis使用RPM方式安装