先看视频。

【赵强老师】MapReduce编程案例之求工资总额

Hadoop MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归约)”,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

MapReduce擅长处理大数据,它为什么具有这种能力呢?MapReduce的思想就是“分而治之”。

Mapper负责“分”,即把复杂的任务分解为若干个“简单的任务”来处理。“简单的任务”包含三层含义:

  • 一是数据或计算的规模相对原任务要大大缩小;

  • 二是就近计算原则,即任务会分配到存放着所需数据的节点上进行计算;

  • 三是这些小任务可以并行计算,彼此间几乎没有依赖关系。

Reducer负责对map阶段的结果进行汇总。至于需要多少个Reducer,用户可以根据具体问题,通过在mapred-site.xml配置文件里设置参数mapred.reduce.tasks的值,缺省值为1。

【赵强老师】MapReduce编程案例之求工资总额相关推荐

  1. MapReducer——MapReduce编程案例:求部门的工资总额(2)

    MapReduce编程案例:求部门的工资总额 1.员工表  SQL:select deptno,sum(sal) from emp group by deptno; 2.分析数据处理的过程 3.开发程 ...

  2. 视频教程-赵强老师:Oracle数据库从10g到11g(4)PL/SQL编程基础-Oracle

    赵强老师:Oracle数据库从10g到11g(4)PL/SQL编程基础 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblo ...

  3. redis 发布订阅实际案例_【赵强老师】Redis的消息发布与订阅

    欢迎关注赵强老师微信公众号:myitshare Redis 作为一个publish/subscribe server,起到了消息路由的功能.订阅者可以通过subscribe和psubscribe命令向 ...

  4. 视频教程-赵强老师:大数据从入门到精通(6)MapReduce-Hadoop

    赵强老师:大数据从入门到精通(6)MapReduce 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblogic)和大数据H ...

  5. 视频教程-赵强老师:大数据从入门到精通(7)HBase-Hbase

    赵强老师:大数据从入门到精通(7)HBase 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblogic)和大数据Hadoo ...

  6. 赵强老师:大数据从入门到精通(20)Spark RDD-赵强老师-专题视频课程

    赵强老师:大数据从入门到精通(20)Spark RDD-116人已学习 课程收益     本系列课程将基于RedHat Linux 7.4版本.Hadoop 2.7.3.Spark 2 版本全面介绍大 ...

  7. 视频教程-赵强老师:Oracle数据库从10g到11g(6)管理方案对象-Oracle

    赵强老师:Oracle数据库从10g到11g(6)管理方案对象 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblogic) ...

  8. 视频教程-赵强老师:大数据从入门到精通(1)Linux基础-Linux

    赵强老师:大数据从入门到精通(1)Linux基础 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblogic)和大数据Had ...

  9. 视频教程-赵强老师:大数据从入门到精通(15)Storm-大数据

    赵强老师:大数据从入门到精通(15)Storm 毕业于清华大学,拥有超过13年的工作经验. Oracle认证讲师,拥有6年以上授课经验.精通Oracle数据库.中间(Weblogic)和大数据Hado ...

最新文章

  1. 模糊推理 控制 易于实现_代码“易于推理”是什么意思?
  2. php5.6 和apache2.2的相互配置
  3. grub error:unknown filesystem的解决方案
  4. genymotion报错Your CPU is incompatible with virtualization technologies
  5. 基于IntelVt技术的Linux内核调试器 - 2
  6. 学Java怎么样?学Java从业前景如何呢?
  7. Deep Reinforcement Learning: Pong from Pixels
  8. python access 源码_连接的微软Access数据库,这是一个轻量级的Python模块(MDB格式)...
  9. Laravel测试驱动开发--功能测试 1
  10. OpenCV-绘制简易直方图DrawHistImg
  11. systemd(CentOS7)启动zookeeper
  12. pytorch关系抽取框架OpenNRE源码解读与实践:PCNN ATT
  13. DelayQueue初学
  14. 全面解析《嵌入式程序员应该知道的16个问题》
  15. 向量点乘(即内积)和叉乘(即外积、向量积)区别与意义分析
  16. Opengl glm配置出错
  17. 三体 读后思考-泰勒展开/维度打击/黑暗森林
  18. python少儿趣味编程多少钱一节_学费昂贵的少儿编程课,为什么被追捧?
  19. 解决树莓派4B 3.5MM耳机接口没有声音的方法
  20. Fone Monkey的配置

热门文章

  1. 文件上传——无验证(ctfhub 文件上传-无限制)
  2. vslam rgbd + lidar
  3. c常用头文件——sys/socket.h
  4. 思科AP1832me和2702升级记录
  5. 回顾2011,展望2012
  6. 一个google高手写的心得体会
  7. 【证件照】证件照处理合集(换颜色、排版、美化)
  8. 解决echarts5中国地图只显示南海问题,及china.js china.json下载
  9. vue可以编辑发布多长的视频_vue可以拍多长的视频_vue怎么注册
  10. DS18B20测量温度数码管显示