对输入文件中的数据进行排序,输入文件中每行为一个数字。输出的每行为2个间隔的数字,第一个代表序号,第二个代表原始数字。

输入:

2
7
5
1
7
6
8
7

输出:

1 1
2 2
3 5
4 6
5 7
6 7
7 7
8 8

1、设计思路

在map过程中就有排序,因此利用这个默认的排序。并将其作为key值输出。reduce得到<Key,value-list>,将key值作为value输出,根据value-list的个数确定输出次数。此外还需要输出num,表示次序。

代码如下:

[java]

hadoop学习--数据排序相关推荐

  1. hadoop 实现数据排序

    前言 在很多业务场景下,需要对原始的数据读取分析后,将输出的结果按照指定的业务字段进行排序输出,方便上层应用对结果数据进行展示或使用,减少二次排序的成本 在hadoop的MapReduce中,提供了对 ...

  2. Hadoop学习笔记—11.MapReduce中的排序和分组

    Hadoop学习笔记-11.MapReduce中的排序和分组 一.写在之前的 1.1 回顾Map阶段四大步骤 首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出 ...

  3. 大数据之Hadoop学习——动手实战学习MapReduce编程实例

    文章目录 一.MapReduce理论基础 二.Hadoop.Spark学习路线及资源收纳 三.MapReduce编程实例 1.自定义对象序列化 需求分析 报错:Exception in thread ...

  4. 大数据hadoop新手快速入门视频教程 Hadoop学习视频教程

    最新在学习hadoop .storm大数据相关技术,发现网上hadoop .storm 相关学习视频少之又少,我这里整理了hadoop学习视频,给大家学习. 视频下载地址:http://demo.li ...

  5. hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶

    hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶 一.回顾知识 1.myschool数据库和数据表的创建 (1)创建数据库 (2)数据库模型图 (3)创建数据表grand (4) ...

  6. Hadoop大数据——mapreduce中的Combiner/序列化/排序初步

    mapreduce中的Combiner (1)combiner是MR程序中Mapper和Reducer之外的一种组件 (2)combiner组件的父类就是Reducer (3)Combiner和red ...

  7. Hadoop 大数据学习笔记

    Hadoop 大数据学习笔记1 大数据部门组织架构 Hadoop Hadoop是什么 Hadoop的优势 Hadoop的组成 HDFS架构 YARN架构 MapReduce 大数据技术生态体系![在这 ...

  8. Hadoop学习之路(7)MapReduce自定义排序

    本文测试文本: tom 20 8000 nancy 22 8000 ketty 22 9000 stone 19 10000 green 19 11000 white 39 29000 socrate ...

  9. Java学习案例:字符串中的数据排序

    案例:字符串中的数据排序 需求:有一个字符串:"91 27 46 38 50",请写程序实现最终输出结果是:"27 38 46 50 91" 思路: 1.定义一 ...

最新文章

  1. [笔记].关于在Quartus II 11.0无法正常使用SignalTap的解决方法
  2. rp软件app流程图_如何开发app软件,流程怎样
  3. 亚洲综合竞争力排名发布:韩国位居第1,中国第9,大家怎么看?
  4. 全自动采集新闻站源码-单站自动采集新闻源码(seo标题伪原创)
  5. 函数式反应型编程(FRP)
  6. Win10开启IPv6
  7. Hive 建表语句详解
  8. SPSS卡方检验结果解读详解
  9. 如何从表象深入IPFS本质?Filenet诠释公链底层难题
  10. 在线客服机器人交互功能开发总结
  11. DirectX 12 3D 游戏开发与实战第五章内容
  12. 《人月神话》第十一弹
  13. CAD如何快速标注尺寸?CAD标注尺寸教程
  14. Android硬件通信之 蓝牙通信
  15. 什么是服务器集群?海外服务器集群的优势?
  16. 为什么SpringBoot jar包中的文件读取不到?
  17. 浙师大OJ2494走楼梯问题
  18. Linux - 拨号上网
  19. asp毕业设计——基于asp+access的电子政务档案管理系统设计与实现(毕业论文+程序源码)——电子政务档案管理系统
  20. Watershed算法

热门文章

  1. h3c telnet
  2. Documentum常见问题2—压力测试时一旦用户数超过一定数量就不能登录了
  3. 为SharePoint网站创建自定义导航菜单
  4. Java API帮助文档怎么查找?
  5. PAT甲级1017 Queueing at Bank:[C++题解]字符串、结构体、最小堆
  6. 简单选择排序 c代码
  7. 计算机组成原理精品课程申报书,【计算机科学与技术专业】【毕业设计】计算机组成原理精品课程平台的设计与实现...
  8. 新闻与传播c刊_新闻传播类c刊有哪些
  9. 漫游飞行_美术课|一年级下漫游飞行世界
  10. Cortex-M3的工作模式和特权级别