MapReduce当中的计数器

计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计
计数器还可辅助诊断系统故障。
如果需要将日志信息传输到map 或reduce 任务, 更好的方法通常是看能否用一个计数器值来记录某一特定事件的发生。
对于大型分布式作业而言,使用计数器更为方便。除了因为获取计数器值比输出日志更方便,还有根据计数器值统计特定事件的发生次数要比分析一堆日志文件容易得多。
hadoop内置计数器列表

名称 包名
MapReduce任务计数器 org.apache.hadoop.mapreduce.TaskCounter
文件系统计数器 org.apache.hadoop.mapreduce.FileSystemCounter
FileInputFormat计数器 org.apache.hadoop.mapreduce.lib.input.FileInputFormatCounter
FileOutputFormat计数器 org.apache.hadoop.mapreduce.lib.output.FileOutputFormatCounter
作业计数器 org.apache.hadoop.mapreduce.JobCounter

每次mapreduce执行完成之后,都会看到一些日志记录出来,其中最重要的一些日志记录如下截图

MapReduce当中的计数器相关推荐

  1. 实验七 MapReduce实验:计数器

    实验指导: 7.1 实验目的 基于MapReduce思想,编写计数器程序. 7.2 实验要求 能够理解MapReduce编程思想,然后会编写MapReduce版本计数器程序,并能执行该程序和分析执行过 ...

  2. MapReduce的自定义计数器

    1. 在map端使用计数器进行统计: import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; impor ...

  3. MapReduce当中自定义输出:多文件输出MultipleOutputs

    自定义输出:多文件输出MultipleOutputs 对于刚才的单独订单topN的问题, 如果需要把单独的订单id的记录放在自己的一个文件中,并以订单id命名.怎么办?multipleOutputs可 ...

  4. MapReduce-计数器

    MapReduce 中的计数器 计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计.计数器还可辅助诊断系统故障.如果需要将日志信息传输到 map 或 reduce 任务, 更好的方法通常 ...

  5. Hadoop分布式存储和计算MapReduce的使用以及Hive数据仓库等内容精讲

    一,zookeeper环境搭建 ZooKeeper致力于为分布式应用提供一个高性能.高可用,且具有严格顺序访问控制能力的分布式协调服务 服务器IP 主机名 myid的值 192.168.186.133 ...

  6. 【Hadoop离线基础总结】MapReduce增强(上)

    MapReduce增强 MapReduce的分区与reduceTask的数量 概述 MapReduce当中的分区:物以类聚,人以群分.相同key的数据,去往同一个reduce. ReduceTask的 ...

  7. 2021年大数据Hadoop(二十二):MapReduce的自定义分组

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 MapReduce的自定义分组 需求 分析 实现 第一步: ...

  8. 第2节 mapreduce深入学习:4, 5

    第2节 mapreduce深入学习:4.mapreduce的序列化以及自定义排序 序列化(Serialization)是指把结构化对象转化为字节流. 反序列化(Deserialization)是序列化 ...

  9. MapReduce 中文版论文(转载)

    之前已经给贴了GFS和BigTable的论文,今天就把Google三大利器之一MapReduce中文版论文也发一下,原文地址,中文版原址,并在这里谢谢译者Alex,这个不是easy job. 摘要 M ...

最新文章

  1. 为什么很努力进步却不明显
  2. linux udevd服务 设备管理工具 简介
  3. 云服务器怎么查看文件目录结构,查看云服务器目录结构图
  4. spring缓存_有关Spring缓存性能的更多信息
  5. 前端学习(662):逻辑运算符练习
  6. HTTP----HTTP2.0新特性
  7. python opengl_从Python开始,学习OpenGL(一)
  8. LOCK TABLES
  9. 《C++ Primer》读书笔记
  10. [POI2006]Tet-Tetris 3D
  11. 检测PYthon标识符合法性脚本
  12. 费曼:微积分是上帝的语言 | 书摘
  13. 一帆风顺幼儿园管理软件 v3.01 bt
  14. .net framework 3.5win10无法安装,一招解决win10无法安装.NET Framework 3.5
  15. jenkins Pipline 庖丁解牛
  16. 第 11 章 进度条媒体对象和 Well 组件
  17. 复试编程训练真题——C语言,统计各单词(字符)出现的次数,并将各单词(字符)和其出现的次数输出到屏幕和文件中
  18. 计算器软件测试数据,计算器软件测试报告.doc
  19. Windows系统管理和网络服务笔记生涯 源于BENET2.0课程(S1)
  20. HTML_06(Dom(03))

热门文章

  1. JVM架构、JVM垃圾回收机制、垃圾回收算法、垃圾回收器、JMM(内存模型)
  2. 鸟哥的linux私房菜_linux磁盘与文件系统管理
  3. 成都拓嘉启远:拼多多直通车推广怎么做才能有开好
  4. 网盘的暴力营销,你们的脸遮遮掩掩
  5. 【时间序列】ICDE 2021丨时间序列相关研究论文汇总
  6. python根据参数判断性别准吗_根据数据能判断男宝或女宝概率么?
  7. 使用Photoshop辅助线制作ps切片教程
  8. 计算机毕业设计ssm校园招聘管理系统968b0系统+程序+源码+lw+远程部署
  9. Excel VBA高级编程-微信群发消息工具
  10. 什么时候要进行大小端字节序的转换?