1、Reducer类 , 由Map过程输出的一组键值对【(k2;v2)】将被进行合并处理,将同样主键下的不同value合并到一个列表【v2】中,因此Reduce的输入为(k2;【v2】)。Reducer对传入的中间结果列表数据进行某种整理或进一步的处理,并产生最终的某种形式的结果输出【(k3;v3)】

一个示例 Reducer类的基本定义

public static class IntSumReducer extend Reducer<Text, IntWritable , Text, IntWritable>

抽象类Reducer位于 org.apache.hadoop.mapreduce.Reducer<KEYIN , VALUEIN, KEYOUT, VALUEOUT> 主要方法

protected void cleanup(Context context);
protexted void reduce(KEYIN key, Iterable<VALUEIN> values, Context context);
public void run(Context context);
protected void setup(Context context);

2//  reduce()方法

protected void reduce(KEYIN key ,Iterable<VALUEIN> values , Context context)throws IOException,  InterruptedException{}

其中,输入参数key是传入reduce的键值,values是对应键值的value值的列表,context是环境对象参数,供程序访问Hadoop的环境对象

3、setup()和cleanup()方法

Reducer类——hadoop相关推荐

  1. MapReduce框架Mapper和Reducer类源码分析

    一:Mapper类 在Hadoop的mapper类中,有4个主要的函数,分别是:setup,cleanup,map,run.代码如下: protected void setup(Context con ...

  2. OutputFormat类——Hadoop

    转:http://blog.csdn.net/u014470581/article/details/51498325 1.OutputFormat是一个用于描述MapReduce作业的输出格式和规范的 ...

  3. eclipse远程连接hadoop_1个文件,3个类,mapreduce就是这么简单,动手搭建Hadoop(8)...

    01 ssh免密安装 02 jdk安装 03 hadoop伪分布式安装 04 hadoop全分布式 05 hadoop高可用 06 用hadoop的sdk进行开发 07 搭建yarn 上次在hdfs上 ...

  4. 027_编写MapReduce的模板类Mapper、Reducer和Driver

    模板类编写好后写MapReduce程序,的模板类编写好以后只需要改参数就行了,代码如下: 1 package org.dragon.hadoop.mr.module; 2 3 import java. ...

  5. 2021年大数据Hadoop(二十二):MapReduce的自定义分组

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 MapReduce的自定义分组 需求 分析 实现 第一步: ...

  6. 初学Hadoop之图解MapReduce与WordCount示例分析

    Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算. HDFS是Google File System(GFS) ...

  7. [ZZ]Map/Reduce hadoop 细节

    转自:Venus神庙原文:http://www.cnblogs.com/duguguiyu/archive/2009/02/28/1400278.html 分布式计算(Map/Reduce) 分布式计 ...

  8. Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别

    Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...

  9. Hadoop 4、Hadoop MapReduce的工作原理

    一.MapReduce的概念 MapReduce是hadoop的核心组件之一,hadoop要分布式包括两部分,一是分布式文件系统hdfs,一部是分布式计算框就是mapreduce,两者缺一不可,也就是 ...

  10. Hadoop Intellij IDEA 建demo

    Hadoop Intellij IDEA本地开发环境搭建 原文:http://blog.csdn.net/u010171031/article/details/53024516 首先我们需要新建一个j ...

最新文章

  1. 程序员面试题精选100题(61)-数对之差的最大值
  2. 凸函数和非凸函数---and why
  3. 这可能是Python面向对象编程的最佳实践
  4. Cell Reports:去除宿主和胞外DNA以提高微生物基因组得率(痰液样本)
  5. 【集训队互测2015】最大异或和
  6. Funtion:POPUP_TO_DECIDE_LIST
  7. php浏览器类型检测工具,php检测客户端浏览器类型的简单示例
  8. Virtualbox 无缝整合linux和windows双系统
  9. 程序员面试金典 - 面试题 08.10. 颜色填充(BFS/DFS)
  10. 转 windows查看端口占用命令
  11. 【夏虫语冰】visio2013安装出错,您输入的产品密钥无法在此计算机上使用,错误25004
  12. 2020软考软件设计师--基础知识实战培训视频-任铄-专题视频课程
  13. hdu 5510 strstr/find/KMP
  14. Springboot毕设项目电商系统设计与实现t32la(java+VUE+Mybatis+Maven+Mysql)
  15. 机械祭天法力无边:C++primer之书店程序包含Sales_item.h源码
  16. 主成分分析(PCA)原理及推导
  17. 【月刊】在四月奔跑起来,即使道路泥泞,也会收获遍野的烂漫
  18. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks
  19. GMap.NET入门详细教程【2】-------- 初始化并加载一张地图
  20. android handle 用法

热门文章

  1. JProfiler安装、激活
  2. 华为机试真题 C++ 实现【竖直四子棋】
  3. 几何画板如何制作文氏图
  4. 排序算法总结(Python实现)——(一)
  5. eclipse的安装及最大子数组求和
  6. 时尚圈美女撰文主攻方向
  7. 计算机财务函数pmt,《5个财务函数FV、PV、PMT、NPER与RATE》.docx
  8. 台式计算机蓝牙在哪,台式电脑蓝牙在哪里打开(台式电脑连接蓝牙教程分享)...
  9. 图书-旅行-十年徒步中国:《信念:十年徒步中国》
  10. 高阶篇:4.1.2.2)产品部件级别的QFDII