然后我们再开始去,编写Reducer去,可以看到上面,跟mapper一样,这个reducer一定要导入

hadoop.mapreduce,这个才是hadoop2.x,hadoop3.x版本的,那个hadoop.mapred是,之前的hadoop1.x时候的

旧版本的.

然后我们再去看,Reducer的各个参数,可以看到这里

KEYIN,VALUEIN:这里我们说mapper的输出,其实就是reducer的输入,所以这里我们把mapper的输出类型拿过来就可以了

KEYOUT,VALUEOUT:对于KEYOUT,VALUEOUT,我们说我们想聚合后变成

比如atguigu atguigu 文章中有这两个单词,那么最后统计出来就是atguigu,2 所以

KEYOUT,VALUEOUT 的类型就是,Text 和IntWritable

大数据之-Hadoop3.x_MapReduce_WordCount编写_Reducer---大数据之hadoop3.x工作笔记0090相关推荐

  1. 大数据_Flink_流式处理_简介_Flink的特点---Flink工作笔记0006

    然后我们再来看一下flink的特点 我们可以先看一下传统的左边的数据处理过程,其实就类似我们做的传统的web应用, 也可以想一下netty处理数据的过程, 可以把请求看成一个事件,可以看到,服务器启动 ...

  2. 大数据之-Hadoop3.x_MapReduce_WordCount编写_Mapper---大数据之hadoop3.x工作笔记0089

    我们开始去写wordcount这个MapReduce程序的mapper去,可以看到我们的mapper,需要继承Mapper,这个hadoop 提供给我们的一个父类. 可以看到我们输入Mapper以后有 ...

  3. 大数据之-Hadoop3.x_MapReduce_WordCount编写_Driver---大数据之hadoop3.x工作笔记0091

    然后我们再去写Driver这个类,这个类用来将,我们写的mapper,和reducer类,结合起来,最终 实现MapReduce功能. 首先我们去看一下,这个Driver中的过程,分为7步 然后首先我 ...

  4. 大数据之-Hadoop3.x_MapReduce_WordCount案例需求分析---大数据之hadoop3.x工作笔记0087

    然后我们在写这个word count 这个MapReduce程序之前,我们先来分析一下 比如上面我们有个hello.txt文件,里面有一堆的单词.最终我们系统得到上面,期望输出数据那样的结果. 这里这 ...

  5. 大数据_Flink_数据处理_流处理API_Source_自定义测试数据源---Flink工作笔记0028

    然后我们来看,一般情况下,从文件中读取数据,用的,不如 从kafka,中读取数据用的多. 然后我们再来看一种,自定义数据源,这个主要是我们可以在上线之前模拟很多的数据来进行测试对吧. 这里我们新写一个 ...

  6. 大数据_Flink_流式处理_简介_Flink是什么---Flink工作笔记0001

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 是一个框架,分布式的处理引擎,对有状态的计算,有界无界,这个后面咱们说是什么意思. 用于对有界和无 ...

  7. 大数据_MapperReduce_Hbase配置参数说明_以及部分源码说明---Hbase工作笔记0031

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 然后我们接着去看,这里我们主要看一些参数,以及对一些参数的源码说明 首先我们看这个他的master ...

  8. 大数据_Hbase-API访问_Java操作Hbase_MR-数据迁移-代码测试---Hbase工作笔记0017

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 然后我们继续写,我们要通过mapper,把数据从一个表中查询出来,然后,再把数据, 弄成put,然 ...

  9. 大数据_Hbase-API访问_Java操作Hbase_MR-数据迁移-开发代码---Hbase工作笔记0016

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 我们可以通过MapReduce从hbase中插入数据,或者获取数据. 注意hadoop要执行Map ...

最新文章

  1. 在数据库组件中用业务规则剖析挑选数据
  2. feign直接走熔断_【121期】面试官:什么是熔断?什么是服务降级?
  3. Docker + gunicron + supervisord 部署python应用
  4. 生成Base58格式的UUID(Hibernate Base64格式的UUID续)
  5. uva 558 Wormholes
  6. 【Visual C++】游戏开发笔记之五——游戏画面绘图(二)绘制位图
  7. 纽瓦克市政厅电脑遭勒索软件劫持,部分公共服务被迫瘫痪
  8. linux进程管理命令实验,实验2Linux进程管理.doc
  9. axios 注册拦截器 cdn引用_PicGo+jsDelivr+GitHub搭建免费cdn加速的图床
  10. navicat for mysql 亲测好用的 中文破解版
  11. APISpace 万年历API
  12. MFC SDL FFmpeg视频播放器开发教程(一)
  13. imx6 linux 开发环境,从0搭建imx6ul开发环境
  14. WCF 项目应用连载[4] - 自定义配置 扩展ServiceHost - LServiceHost
  15. mysql 介绍 怎么下载 驱动jar包 各种细节问题大详解
  16. Qt TCP/IP(多客户端连接服务器)多个客户端同时登陆的聊天室示例
  17. ETCD教程(一) 通过docker安装etcd集群
  18. termios的例子
  19. 《调教命令行09》磁盘很廉价,放小电影最合适了
  20. 物联网开放平台使用总结

热门文章

  1. 安川机器人位置变量要素_安川机器人变量分配(维修)
  2. 数据库主备_数据库周刊40丨OceanBase官网上线开发者社区;人民日报关注易鲸捷;数据库迁移经验分享…...
  3. win2008MySQL双主_MySQL双主配置
  4. android 模拟crash_Android 收集Crash信息及用户操作步骤
  5. nginx 发送动态内容注意事项
  6. STM32单片机一个定时器输出不同频率PWM波
  7. Linux学习笔记---使用MfgTool工具烧写自己的系统(二)
  8. Spring IoC、DI、Bean和自动装配的理解
  9. IDEA连接Git后类的颜色含义
  10. linux内存管理(八)-不连续页分配和页表