文章目录

  • 目录
    • 1.Hadoop的发展与优化
      • 1.1 Hadoop1.0 的不足与局限
      • 1.2 Hadoop2.0 的改进与提升
    • 2.HDFS2.0 的新特性
      • 2.1 HDFS HA
      • 2.2 HDFS Federation
    • 3. 新一代的资源管理器YARN
      • 3.1 MapReduce1.0 缺陷
      • 3.2 YARN的设计思路
      • 3.3 YARN 体系结构
      • 3.4 YARN工作流程
      • 3.5 YARN框架与MapReduce1.0框架进行对比
      • 3.6 YARN的发展目标
    • 4.Hadoop2.0 生态中具有代表性的功能组件
      • 4.1 Pig
      • 4.2 Tez
      • 4.3 Spark
      • 4.4 Kafka

目录

1.Hadoop的发展与优化

1.1 Hadoop1.0 的不足与局限

主要针对于Hadoop1.0中两大核心组件:MapReduce和HDFS有以下几点不足:

  • 抽象层次低,需要人工编码(MapReduce需要人为的写map和reduce函数)
  • 表达能力有限(MapReduce)
  • 开发者自己管理作业之间的依赖关系(MapReduce)
  • 难以看清程序的整体逻辑(MapReduce)
  • 执行迭代操作效率低(MapReduce每次迭代写磁盘)
  • 资源浪费(map-slot与reduce-slot不能共用)
  • 实时性差(适用于批处理,不支持实时交互)

1.2 Hadoop2.0 的改进与提升


hdfs fedration只是提供管理多个命名空间,每个节点还是存在单点故障的问题,所以需要集合HDFS HA一起使用,即对HDFS Fedration中的每个节点创建一个附属的名称节点,作为单个节点的热备份。
Hadoop1.0 中的第二名称节点不是一个热备份的功能,湿冷备份,具体请查看之前的博客。

2.HDFS2.0 的新特性

2.1 HDFS HA



HDFS HA

2.2 HDFS Federation



3. 新一代的资源管理器YARN

3.1 MapReduce1.0 缺陷

3.2 YARN的设计思路

在Hadoop1.0 中,MapReduce既是一个大数据计算框架,又是一个资源和任务调度管理框架。

3.3 YARN 体系结构





3.4 YARN工作流程

3.5 YARN框架与MapReduce1.0框架进行对比

3.6 YARN的发展目标


4.Hadoop2.0 生态中具有代表性的功能组件

4.1 Pig





4.2 Tez



Tez是对MapReduce中的map和reduce过程进行优化,所以只要最终只要转换为map和reduce操作的都可以使用Tez进行优化。

4.3 Spark

4.4 Kafka

大数据学习(09)--Hadoop2.0介绍相关推荐

  1. 大数据学习系列:Hadoop3.0苦命学习(一)

    传送门: 大数据学习系列:Hadoop3.0苦命学习(一) 大数据学习系列:Hadoop3.0苦命学习(二) 大数据学习系列:Hadoop3.0苦命学习(三) 大数据学习系列:Hadoop3.0苦命学 ...

  2. 大数据学习系列:Hadoop3.0苦命学习(七)

    传送门: 大数据学习系列:Hadoop3.0苦命学习(一) 大数据学习系列:Hadoop3.0苦命学习(二) 大数据学习系列:Hadoop3.0苦命学习(三) 大数据学习系列:Hadoop3.0苦命学 ...

  3. 大数据学习系列:Hadoop3.0苦命学习(五)

    传送门: 大数据学习系列:Hadoop3.0苦命学习(一) 大数据学习系列:Hadoop3.0苦命学习(二) 大数据学习系列:Hadoop3.0苦命学习(三) 大数据学习系列:Hadoop3.0苦命学 ...

  4. 大数据学习笔记:Hadoop生态系统

    文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...

  5. 大数据学习规划(新手入门)

    前言: 一.背景介绍 二.大数据介绍 正文: 一.大数据相关的工作介绍 二.大数据工程师的技能要求 三.大数据学习规划 四.持续学习资源推荐(书籍,博客,网站) 五.项目案例分析(批处理+实时处理) ...

  6. 大数据学习路线详解,零基础学大数据学习路线

    在大数据蓬勃发展的现今,大家都看到了大数据未来不可限量的发展前景,跟着科技发展的潮流,不断学习新的技术知识,科多大数据相信,成为人生赢家不在话下. 大数据的三个发展方向,平台搭建/优化/运维/监控.大 ...

  7. 大数据系列(一)之hadoop介绍及集群搭建

    大数据系列(一)之hadoop介绍及集群搭建 文章最早发布来源,来源本人原创初版,同一个作者: https://mp.weixin.qq.com/s/fKuKRrpmHrKtxlCPY9rEYg 系列 ...

  8. 2021最全大数据学习路线(建议收藏)

    个人简介:非科班双一流硕士,CAE仿真方向转行大数据,现杭州某大厂大数据工程师! 我可以给你提供最全的[大数据学习路线]:帮助你搭建大数据知识体系,从入门到精通:亲自指导你大数据工程师面试的简历该如何 ...

  9. 大数据学习之路(转载)

    #大数据学习之路(转载) 博文地址https://blog.csdn.net/zys_1997/article/details/78358992 看到一个博主写的大数据学习路线,看了比较心动,想着自己 ...

  10. 大数据学习心得、技术路径、生无可恋的朋友加油吧!明天就是你的天下

    申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学. 前言: 一.背景介绍 二.大数据介绍 正文: 一. ...

最新文章

  1. Android studio中2种build.gradle文件介绍
  2. node mysql 连接池 超时,关于NodeJS中mysql连接池卡死问题
  3. 突发,Log4j2 爆出远程代码执行漏洞,各大厂纷纷中招!
  4. 混编ObjectiveC++
  5. 问题引发由于与GI相关的python脚本中的错误,Gnome终端无法启动
  6. .NET (c#)序列化和反序列化
  7. 经典Java编程面试题分析
  8. Gartner发布2022年政府行业重要业务趋势:数字化与创新、基础设施等
  9. jtag引脚定义_从逆向分析的角度学习硬件调试技巧JTAG,SSD和固件提取
  10. 5月23 注册审核
  11. 《Cracking the Coding Interview》——第10章:可扩展性和存储空间限制——题目1
  12. 【Shell】sed实例之第三部分
  13. Markdown 调整图片位置与大小
  14. 在计算机网络中vc是,计算机网络——第一章 体系
  15. centos7系统下postgresql12离线安装
  16. c语言中引用sqrt需要cmath嘛,c语言根号(c语言中根号怎么输入)
  17. 路由器关闭DHCP之后连接不到路由器设置界面?
  18. 有一个3×4的矩阵,要求编程序求出其中值最大的那个元素的值,以及其所在的行号和列号
  19. lpk劫持方式粘滞键后门后门T00ls Lpk Sethc v3.0 正式版下载
  20. java程序运行机制

热门文章

  1. c语言学习自我评价,学习自我评价4篇
  2. java监听机制_详解java的事件监听机制和观察者设计模式
  3. 抖音最强python_装逼篇 | 抖音超火的九宫格视频是如何生成的,Python 告诉你答案...
  4. arcgis导出access数据库能打开的文件
  5. 【转】WCF Data Service 使用小结 (一)—— 了解OData协议
  6. 关于DateTime的一点记录 ToString(yyyy-MM-dd HH:mm:ss)
  7. 文带你深入了解 Redis 内存模型
  8. jar 退出run_Java终止线程的三种方式
  9. Qt开发技巧:编写.pro文件,在构建流程中加入命令行的方法
  10. 【LeetCode-SQL每日一题】——183. 从不订购的客户