Hadoop的介绍以及发展历史

Hadoop之父Doug Cutting :

咳咳,开始讲解Hadoop,各位同学请认真听讲


1. Hadoop最早起源于lucene下的Nutch
Nutch的设计目标是构建一个大型的全网搜索引擎
包括网页抓取、索引、查询等功能但随着抓取网页数量的增加
遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题


2. 2003年,2004年谷歌发表的三篇论文为该问题提供了可行的解决方案。

  • ——分布式文件系统(GFS),可用于处理海量网页的存储
  • ——分布式计算框架MAPREDUCE,可用于处理海量网页的索引计算问题
  • ——分布式的结构化数据存储系统Bigtable,用来处理海量结构化数据

3. Doug Cutting基于这三篇论文完成了相应的开源实现HDFSMAPREDUCE,并从Nutch中剥离成为独立项目HADOOP,到2008年1月,HADOOP成为Apache顶级项目(同年,cloudera公司成立),迎来了它的快速发展期。
为什么叫Hadoop? Logo为什么是黄色的大象?
狭义上来说,Hadoop就是单独指代Hadoop这个软件(HDFS+MAPREDUCE)
广义上来说,Hadoop指代大数据的一个生态圈(Hadoop生态圈),包括很多其他的软件

Hadoop的历史版本介绍

0.x系列版本:Hadoop当中最早的一个开源版本,在此基础上演变而来的1.x以及2.x的版本
1.x版本系列:Hadoop版本当中的第二代开源版本,主要修复0.x版本的一些bug等
2.x版本系列:架构产生重大变化,引入了yarn平台等许多新特性

Hadoop三大公司发型版本介绍

目标:了解最出名的三个Hadoop版本

免费开源版本 apache

请允许我介绍一下Hadoop之父Doug Cutting以及Hadoop历史版本相关推荐

  1. Hadoop之父Doug Cutting:Lucene到Hadoop的开源之路

    Hadoop之父Doug Cutting:Lucene到Hadoop的开源之路 Doug Cutting,凭借自己对工作的热情和脚踏实地的态度,开创了Lucene和Nutch两个成功的开源搜索引擎项目 ...

  2. Hadoop之父Doug Cutting

    生活中,可能所有人都间接用过他的作品,他是Lucene.Nutch .Hadoop等项目的发起人.是他,把高深莫测的搜索技术形成产品,贡献给普罗大众:还是他,打造了目前在云计算和大数据领域里如日中天的 ...

  3. Hadoop详解以及历史版本介绍

    Hadoop详解 Hadoop的介绍以及发展历史 Hadoop之父Doug Cutting Hadoop最早起源于lucene下的Nutch.Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页 ...

  4. Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来

    上次见到(膜拜)Hadoop之父Doug Cutting是在2年前,2014中国大数据技术大会上.今年Hadoop10岁,刚看到他的Hadoop十周年贺词,感觉时间飞逝.最近CSDN和InfoQ都在制 ...

  5. Doug Cutting—搜索之父

    原文作者:时间的朋友 原文地址:Hadoop之父Doug Cutting Doug Cutting 看到他儿子在牙牙学语时,抱着黄色小象,亲昵的叫 hadoop,他灵光一闪,就把这技术命名为 Hado ...

  6. Hadoop之父祝贺黄色小象十岁生日快乐

    编者按 Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储.处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用.在2016年Ha ...

  7. Hadoop 之父:普通程序员到顶级公司 CTO 的进阶之路

    来自:鸡仔说(微信号:jizaishuo) 做大数据开发的朋友一定用过 Hadoop 这个工具,它是一款支持数据密集型的分布式应用程序.Hadoop 基于分布式档案系统和 MapReduce 技术,通 ...

  8. 与Hadoop之父聊聊天

    作为关注大数据领域的编辑,小编一听说能采访到Hadoop创始人就激动不以.CSDN早在2013年已采访过Cloudera首席架构师Doug Cutting先生,时隔多年,我们在北京Strata Dat ...

  9. Hadoop 之父趣事:用儿子的大象玩偶为大数据项目命名

    作者 | 年素清 责编 | 王晓曼 出品 | 程序人生(ID:coder_life) 道格·卡廷(Doug Cutting)是公认的"Hadoop之父",也是大数据行业的奠基人.十 ...

最新文章

  1. 【系列】EOS开发3 EOS提供的程序和工具
  2. keras 模型用于预测时的注意事项
  3. github--新手使用错误分析
  4. bootstrap jquery alert_bootstrap第七课
  5. SqlServer学习之存储过程
  6. python socket接收图像 数据_python中socket接受数据的三种方法 | 学步园
  7. 统计学习方法 第八章总结
  8. postgresql安装hypopg
  9. android选择图片,通过uri获取路径
  10. 虚拟化技术中,不同层级结构间的虚拟化运用
  11. mt4双线macd_指标小课堂|学院首创!独家手机MT4双线MACD指标设置教程
  12. dell系统重装后无法进入系统_戴尔系统重装进入bios设置方法
  13. 外贸常用术语_常用贸易术语大全
  14. 3. 乱石穿空,惊涛拍岸,卷起千堆雪。 2. 故垒西边,人道是,三国周郎赤壁。 4. 江山.... hai太乱了,我们来写程序排序输出到磁盘文件中
  15. 如何评价B端产品经理的能力
  16. Android判断GPS是否开启和让用户打开GPS
  17. 热点事件情境下微博舆情反转预测
  18. 英雄联盟英雄信息【python爬虫】
  19. java park 和waut_隐秘 ¦ 除了西雅图,美国这些地方从温哥华出发一天内就能玩转!...
  20. c++图像处理入门教程

热门文章

  1. 泊松分布分析足球比赛
  2. 转FLORIAN大神blog之 -那些陌生的C++关键字
  3. C语言中的结构体怎么使用?
  4. 远程安装Linux操作系统
  5. Ubuntu Server系统安装及远程登录
  6. 基于实时ETL的日志存储与分析实践
  7. Web API 开发接口
  8. 这才是你想要的Java学习路线!
  9. 高中毕业从汽修转行自学Python,月薪翻了三倍,我有一份转行秘籍分享给你
  10. StringBuilder删除最后一个字符