转载:http://blog.csdn.net/sinat_31726559/article/details/52103229  点击阅读原文

--------------------------------------

1. Hadoop3.0简介

Hadoop 2.0是基于JDK 1.7开发的,而JDK 1.7在2015年4月已停止更新,这直接迫使Hadoop社区基于JDK1.8重新发布一个新的Hadoop版本,而这正是hadoop 3.0。
Hadoop 3.0的alpha版预计今年夏天发布,GA版本11月或12月发布。
Hadoop 3.0中引入了一些重要的功能和优化,包括HDFS 可擦除编码、多Namenode支持、MR NativeTask优化、YARN基于cgroup的内存和磁盘IO隔离、YARN container resizing等。

2. Hadoop3.0新特性

Hadoop 3.0在功能和性能方面,对hadoop内核进行了多项重大改进,主要包括:

2.1 HadoopCommon
(1)精简Hadoop内核,包括剔除过期的API和实现,将默认组件实现替换成最高效的实现(比如将FileOutputCommitter缺省实现换为v2版本,废除hftp转由webhdfs替代,移除Hadoop子实现序列化库org.apache.hadoop.Records
(2)Classpath isolation以防止不同版本jar包冲突,比如googleGuava在混合使用Hadoop、HBase和Spark时,很容易产生冲突。(https://issues.apache.org/jira/browse/HADOOP-11656)
(3)Shell脚本重构。 Hadoop3.0对Hadoop的管理脚本进行了重构,修复了大量bug,增加了新特性,支持动态命令等。[url=]https://issues.apache.org/jira/browse/HADOOP-9902[/url]
2.2 HadoopHDFS
(1)HDFS支持数据的擦除编码,这使得HDFS在不降低可靠性的前提下,节省一半存储空间。(https://issues.apache.org/jira/browse/HDFS-7285)
(2)多NameNode支持,即支持一个集群中,一个active、多个standbynamenode部署方式。注:多ResourceManager特性在hadoop 2.0中已经支持。(https://issues.apache.org/jira/browse/HDFS-6440)
2.3 HadoopMapReduce
(1)Tasknative优化。为MapReduce增加了C/C++的map outputcollector实现(包括Spill,Sort和IFile等),通过作业级别参数调整就可切换到该实现上。对于shuffle密集型应用,其性能可提高约30%。(https://issues.apache.org/jira/browse/MAPREDUCE-2841)
(2)MapReduce内存参数自动推断。在Hadoop2.0中,为MapReduce作业设置内存参数非常繁琐,涉及到两个参数:mapreduce.{map,reduce}.memory.mb和mapreduce.{map,reduce}.java.opts,一旦设置不合理,则会使得内存资源浪费严重,比如将前者设置为4096MB,但后者却是“-Xmx2g”,则剩余2g实际上无法让javaheap使用到。(https://issues.apache.org/jira/browse/MAPREDUCE-5785)
2.4 HadoopYARN
(1)基于cgroup的内存隔离和IO Disk隔离(https://issues.apache.org/jira/browse/YARN-2619)
(2)用curator实现RM leader选举(https://issues.apache.org/jira/browse/YARN-4438)
(3)containerresizing(https://issues.apache.org/jira/browse/YARN-1197)
(4)Timelineserver next generation([url=]https://issues.apache.org/jira/browse/YARN-2928[/url])
3.  Hadoop3.0总结
Hadoop 3.0的alpha版预计今年夏天发布,GA版本11月或12月发布。
Hadoop 3.0中引入了一些重要的功能和优化,包括HDFS 可擦除编码、多Namenode支持、MR NativeTask优化、YARN基于cgroup的内存和磁盘IO隔离、YARN container resizing等。

-------------

更多的Java,Angular,Android,大数据,J2EE,Python,数据库,Linux,Java架构师,:

http://www.cnblogs.com/zengmiaogen/p/7083694.html

Hadoop3.0的新特性相关推荐

  1. .NET 4.0 Interop新特性ICustomQueryInterface (转载)

    .NET 4.0 Interop新特性ICustomQueryInterface 在.NET Framework v4.0发布的新功能中,在名字空间System.Runtime.InteropServ ...

  2. .NET Framework 4.0的新特性

    本文将揭示.NET 4.0中的3个新特性:图表控件.SEO支持以及ASP.NET 4可扩展的输出缓存. 图表控件 微软向开发者提供了大量可免费下载的图表控件,可以在.NET 3.5 ASP.NET或W ...

  3. mysql 5.0 php_PHP 5.0的新特性

    PHP 5.0的新特性 最近,读者可以从PHP 4.x版本转移到PHP 5.0版本.正如读者期望的那样,在一个新的主要版本中,它做出了一些重要变更.在这个版本中,PHP后台的Zend引擎经过了完全的重 ...

  4. Tensorflow 2.0的新特性

    Tensorflow 2.0的新特性 几天前,Tensorflow刚度过自己的3岁生日,作为当前最受欢迎的机器学习框架,Tensorflow在这个宝座上已经盘踞了近三年.无论是成熟的Keras,还是风 ...

  5. java 7.0 特性_JDK7.0语法新特性

    JDK7.0语法新特性 1,菱形语法(泛型实例化类型自动推断) List list = new ArrayList<>(); // <>这个真的很像菱形 2,在目前版本中,不可 ...

  6. 盘点Greenplum 6.0六大新特性及展望

    导读:本文介绍Greenplum 6.0的新特性. 作者:王春波 来源:大数据DT(ID:hzdashuju) Greenplum 6.0于2019年9月4日正式发布,内核版本从PostgreSQL ...

  7. C# 8.0 的新特性概览和讲解

    本文转自 https://blog.csdn.net/hez2010/article/details/84036742 C# 8.0 的新特性概览和讲解 前言 新的改变 可空引用类型(Nullable ...

  8. jdk5.0的新特性

    jdk的版本在1.4后变化很大,所以叫jdk5.0 下面是总结jdk5.0的新特性: (1)泛型(***)  泛型简介 泛型是J2SE 5.0最重要的特性.他们让你写一个type(类或接口)和创建一个 ...

  9. 《iOS9开发快速入门》——第2章,第2.1节Xcode 7.0的新特性

    本节书摘来自异步社区<iOS9开发快速入门>一书中的第2章,第2.1节Xcode 7.0的新特性,作者 刘丽霞 , 邱晓华,更多章节内容可以访问云栖社区"异步社区"公众 ...

最新文章

  1. 在Ubuntu 14.04 64bit上下载更新x265源码
  2. 基于Sql Server 2008的分布式数据库的实践(五)
  3. MySQL数据库修改用户登录密码的三种方式
  4. kindeditor上传图片编辑框乱码问题
  5. 小米——系统升级失败,不断重启解决+刷xposed(lsposed)+刷recovery+刷magisk
  6. 绘图板应用讲解计算机,计算机绘图应用教程——caxa电子图板xp.pptx
  7. CentOS7(Linux)详细安装教程
  8. python爬取头条视频_Python爬虫:爬取某日头条某瓜视频,有/无水印两种方法
  9. APP支付支付签名验证失败
  10. 复杂电路简化经典例题_复杂电路简化练习题
  11. html+显示平方米,平方米符号怎么打【四种方法】
  12. 【整理】getopt和getopt_long函数
  13. 04_frp内网穿透实例
  14. CF850D Tournament Construction
  15. 文件上传:避免重复上传
  16. 做谷歌广告投放关键字英文,只懂英文可以吗?
  17. 什么是函数?怎么了解函数?为什么需要函数呢?我来给你解答(上)
  18. ngrok搭建+阿里云SSL证书+低成本搭建微信小程序本地调试环境
  19. html导出excel 隐藏部分,html导出Excel方法
  20. vs2015卸载问题解决方案.vs2013编译缺少cscui.dll 及 Delphi 编译报ToolsVersion “14.0“错误

热门文章

  1. real time linux pdf,【整理】ubuntu real time Linux
  2. java query包,有没有Java的http_build_query函数的Java等价物?
  3. SpringCloud学习之路(一)-简单Demo
  4. 是什么牌子_水晶项链什么牌子好
  5. 一个android工程生成两个aar,android studio生成aar包并在其他工程引用aar包(示例代码)...
  6. java反射 获取参数类型_Java反射带参构造创建对象时如何自动转换参数类型
  7. html的id不能有.吗,html – 哪些DOM元素不能接受id?
  8. oracle数据库连接名是什么,连接到Oracle数据库的几种命名方式
  9. RAID阵列基础知识
  10. 第 11 章 日志管理 - 089 - 初探 ELK