然后我们去根据上一节我们分析的需求去写代码实现,首先我们新建一个package,outputformat

然后我们新建一个mapper,LogMapper,可以看到继承系统的hadoop3.1.3的mapper,然后

输入的key,value分别是行号和一行的内容,所以用LongWritable,Text,

然后输出的内容是Text,NullWritable,其中Text,也就是key是一行的内容,然后value我们没用

就用NullWritable补空就可以了.

然后我们先去看看准备的输入的数据.

大数据之-Hadoop3.x_MapReduce_自定义outputformat案例mapperreducer---大数据之hadoop3.x工作笔记0122相关推荐

  1. 大数据之-Hadoop3.x_MapReduce_自定义outputformat案例完善执行---大数据之hadoop3.x工作笔记0123

    然后我们继续看看,实现,我们上面一节的需求, 我们把一堆的网址字符串,包含atguigu的放到一个文件夹中去,包含前他内容的放到另一个文件夹中去. 可以看到我们用自定义的outputformat来试下 ...

  2. 大数据之-Hadoop3.x_MapReduce_自定义分区案例---大数据之hadoop3.x工作笔记0112

    1.可以看到上面就是分区的案例,需求. 2.可以看到我们要实现上面的需求,我们把136开头的放到分区0,文件1,137开头的放到分区1,文件1, 138开头的放到分区2,文件2,139开头的放到分区3 ...

  3. 大数据之-Hadoop3.x_MapReduce_数据压缩_案例实现---大数据之hadoop3.x工作笔记0139

    然后我们再来看看如何是hadoop MapReduce中使用压缩 为了支持多种压缩,解压算法那,hadoop引入了编码 解码器 首先我们看如果在输入端,采用压缩怎么配置,首先 要在core-site. ...

  4. 自定义OutputFormat案例实操

    自定义OutputFormat案例实操 文章目录 1)需求 2)需求分析 3)编程实现 1.创建Mapper类 2.创建Reducer类 3.创建OutputFormat类 4.创建RecordWri ...

  5. 喜报丨神策数据喜获信通院“星河”案例——行业大数据应用优秀案例

    近日,神策数据在由中国信息通信研究院.中国通信标准化协会.中国互联网协会联合举办的"2020 数据资产管理大会"上,喜获"行业大数据应用优秀案例".这也是神策数 ...

  6. 神策数据喜获信通院“星河”案例——行业大数据应用优秀案例

     近日,神策数据在由中国信息通信研究院.中国通信标准化协会.中国互联网协会联合举办的"2020 数据资产管理大会"上,喜获"行业大数据应用优秀案例".这也是神策 ...

  7. 大数据之-Hadoop3.x_MapReduce_全排序案例---大数据之hadoop3.x工作笔记0115

    然后我们来看一个全排序的案例,我们还是利用之前我们那个程序, 之前我们,有一堆的手机号,每个手机号,都有对应的,上行流量,下行流量,总流量,而且还有重复的手机号,我们就是把比如: 1356757585 ...

  8. 大数据之-Hadoop3.x_MapReduce_自定义序列化步骤---大数据之hadoop3.x工作笔记0095

    前面我们说了java的序列化和hadoop的序列化的区别,现在我们再来看, 我们如果让我们自己写的一个类,我们自己的数据,通过网络传输到hadoop集群的 不同的机器上,这样我们自己写的类就需要,实现 ...

  9. 大数据之-Hadoop3.x_MapReduce_区内排序案例---大数据之hadoop3.x工作笔记0117

    然后我们继续看,上一节,我们用二次排序,对,按照总流量倒序的基础上,如果总流量一样,我们 按照上行流量的升序又排序了一下,然后,这一次我们又有了新的需求,我们希望, 我们136开头的,放到一个分区文件 ...

最新文章

  1. OpenCV中图像Mat存储格式和MATLAB中图像Mat存储格式的区别
  2. 二丶Linux安装xdd-plus教程及必备依赖的安装+青龙对接xdd
  3. Java 基础【12】 日期类型
  4. 您自己的MicroProfile Config来源
  5. Spring的PropertyPlaceholderConfigurer应用
  6. Nat Biotechnol | 杨弋团队报道RNA光遗传学工具,可时空精确操纵活细胞RNA代谢与功能...
  7. 润乾单查日期特别慢_SQL编写不合理导致历史日志查询特别慢
  8. “3D几何与视觉技术”全球在线研讨会第五期~隐式3D形状表示学习
  9. 【Unity3D自学记录】Unity3D网络之Socket聊天室初探
  10. .net知识和学习方法系列(前言)
  11. Unable to read TLD META-INF/c.tld from JAR file
  12. 一键将RHEL的YUM源更换为CentOS源
  13. 目标检测(三) Fast R-CNN
  14. 创建Excel,加柱状图
  15. 回顾过去。。展望未来
  16. PHP微信公众号开发
  17. 持续不定期更新:CFDC++之拟一维喷管流动的数值解(2)
  18. 三进制 四进制计算机原理,基因编码为何选择了“四进制”,而不是计算机系统的“二进制”?...
  19. QT——Qt QtCreator 官方下载地址
  20. 本机与虚拟机WIN7之间互传文件

热门文章

  1. 获取客户端ip_获取客户端访问真实IP
  2. 如何找到python的安装路径_在cmd中查看python的安装路径方法
  3. STM8学习笔记---点亮LED灯
  4. linux内存管理(八)-不连续页分配和页表
  5. 梯度下降法参数更新公式的推导
  6. Java对象的serialVersionUID在序列化和反序列化的用途
  7. Python基础----列表
  8. Android Studio开发-高效插件强烈推荐
  9. 基于 HTML5 WebGL 的 3D 机房
  10. 《社交网站界面设计(原书第2版)》——3.2 注册