Hadoop之父Doug Cutting:Lucene到Hadoop的开源之路

Doug Cutting,凭借自己对工作的热情和脚踏实地的态度,开创了Lucene和Nutch两个成功的开源搜索引擎项目,同时也是当下人气大数据计算框架 Hadoop的创立者。Doug于1985年毕业于美国斯坦福大学,首个在Xerox的实习工作奠定了他日后研究搜索引擎项目以及成功的基础。1997年 底,Doug通过Lucene这个首个提供了全文文本搜索的开源函数库实现了理论到实践的巨大突破。在此基础上,Doug相继实现了Nutch 、Hadoop。为了自身梦想的实现,Doug先后就职于Architext和Yahoo!等企业,直至2009年出任Cloudera的首席架构师。

Lucene&Nutch

Lucene是第一个提供全文文本搜索的函数库,提供了一个简单而强大的应用程序接 口,是一个高性能、可伸缩的信息搜索库。作为一个成熟免费的开源项目,Lucene在Java信息检索程序库中得到了广泛的欢迎。开发者不仅能利用它构建 具体的全文检索应用,同时还能将其集成到各种系统软件中,它提供的很多API函数都能运用到各种实际应用程序中。

Nutch则是Doug在Lucene基础上将开源思想继续深化的成果,是一个真正的应用程序,它是建立在Lucene核心之上的Web搜索的实现,其目的旨在减少人们使用过程中的复杂度,并在花费很少的情况下配置世界一流的Web搜索引擎,实现开箱即用的特性。 站内索引和搜索推广到全球网络的搜索上,就像Google和雅虎一样。

Hadoop

Hadoop是Doug基于谷歌MapReduce system开发的一个开源版本,是一种开源的适合大数据的分布式存储和处理平台,是当下新时代应用程序开发必备技能之一。Hadoop作为一个能够让用户轻松架构和使用的分布式平台,具有以下几个优点:

  • 高可靠性
  • 高扩展性
  • 高效性
  • 高容错性
  • 低成本

Hadoop从最初应用的那一刻起就表现的异常出众,大大提高了网页搜索的速度。Doug的目标是将Hadoop发展成云计算领域的RedHat。纵观当下该计算框架所受到的关注度,Hadoop的成功已完全超脱了Doug的想象。

Doug可以说是云计算和大数据领域的传奇人物,他将高深莫测的搜索技术神奇般的变成了产品。然而,他的成功秘诀却并不神秘——对工作的热情和工作时的认真踏实。然而,正是这众所周知的品质成就了他的成功,也让几乎所有的人都直接或间接的使用过他作品。

转自:http://cda.pinggu.org/view/1679.html

转载于:https://www.cnblogs.com/bonelee/p/6857535.html

Hadoop之父Doug Cutting:Lucene到Hadoop的开源之路相关推荐

  1. 请允许我介绍一下Hadoop之父Doug Cutting以及Hadoop历史版本

    Hadoop的介绍以及发展历史 Hadoop之父Doug Cutting : 咳咳,开始讲解Hadoop,各位同学请认真听讲 1. Hadoop最早起源于lucene下的Nutch. Nutch的设计 ...

  2. Hadoop之父Doug Cutting

    生活中,可能所有人都间接用过他的作品,他是Lucene.Nutch .Hadoop等项目的发起人.是他,把高深莫测的搜索技术形成产品,贡献给普罗大众:还是他,打造了目前在云计算和大数据领域里如日中天的 ...

  3. Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来

    上次见到(膜拜)Hadoop之父Doug Cutting是在2年前,2014中国大数据技术大会上.今年Hadoop10岁,刚看到他的Hadoop十周年贺词,感觉时间飞逝.最近CSDN和InfoQ都在制 ...

  4. Doug Cutting—搜索之父

    原文作者:时间的朋友 原文地址:Hadoop之父Doug Cutting Doug Cutting 看到他儿子在牙牙学语时,抱着黄色小象,亲昵的叫 hadoop,他灵光一闪,就把这技术命名为 Hado ...

  5. Doug Cutting (Lucene-Nutch-Hadoop 创始人简介)

    吃水不忘挖井人,介绍Doug Cutting大牛是十分有必要的. 最早,接触到搜索引擎,知道有个Nutch(开源搜索引擎),于是开始查看Nutch相关的资料,发现了Nutch的创始人Doug Cutt ...

  6. Hadoop 之父趣事:用儿子的大象玩偶为大数据项目命名

    作者 | 年素清 责编 | 王晓曼 出品 | 程序人生(ID:coder_life) 道格·卡廷(Doug Cutting)是公认的"Hadoop之父",也是大数据行业的奠基人.十 ...

  7. Hadoop 之父:普通程序员到顶级公司 CTO 的进阶之路

    来自:鸡仔说(微信号:jizaishuo) 做大数据开发的朋友一定用过 Hadoop 这个工具,它是一款支持数据密集型的分布式应用程序.Hadoop 基于分布式档案系统和 MapReduce 技术,通 ...

  8. Hadoop之父祝贺黄色小象十岁生日快乐

    编者按 Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储.处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用.在2016年Ha ...

  9. 与Hadoop之父聊聊天

    作为关注大数据领域的编辑,小编一听说能采访到Hadoop创始人就激动不以.CSDN早在2013年已采访过Cloudera首席架构师Doug Cutting先生,时隔多年,我们在北京Strata Dat ...

最新文章

  1. 干货丨史上最好记的神经网络结构速记表(经典资源,值得收藏)
  2. 浅谈 Python 的 with 语句
  3. Winform界面中主从表编辑界面的快速处理
  4. Django中遇到的错误集合(持续更新)
  5. dede标签用法(来源网页)
  6. oracle中获取列的值,oracle - Oracle-SQL从具有特定列和值的所有表中获取数据 - SO中文参考 - www.soinside.com...
  7. python视频教程免费 西西-Python基础教程(第2版)
  8. 【Python】Python3.7.3 - Python命令行参数详解
  9. Java9的GI垃圾回收器
  10. 软件项目管理 2.1.项目立项
  11. Docker-docker-compose学习笔记(yaml,实战)
  12. 利用MATLAB视频函数工具箱的…
  13. 微服务与敏捷开发(Scrum/Kanban)的核心思想之我见
  14. 盘点视频剪辑几个场景和技巧分享
  15. 基于数据结构的超市会员管理系统
  16. ComWar3b 魔兽显血改键(版本更新为1.01a) Delphi7
  17. RFSOC(记录二)手册相关
  18. 建议收藏chatGPT说的Python词云教程
  19. Android 中Scheme协议的使用详解唤起Activity或App
  20. layUI表格工具栏事件点击后刷新页面解决办法

热门文章

  1. linux快速还原oracle,linux下恢复误删除oracle的数据文件
  2. 计算机表格计算总积分,Excel函数教程: 根据条件计算成绩表-excel技巧-电脑技巧收藏家...
  3. android 按键kl文件,Android添加新按键
  4. 翟萍python程序设计_Python程序设计(高等学校计算机教育规划教材)
  5. 宝可梦维护服务器,宝可梦大师卡在登录界面进不去,宝可梦大师为啥玩不了
  6. 北航c语言简答题目汇总_2020下半年至2021年【化学/计算机/生物类】国际竞赛汇总!...
  7. 【聊透SpringMVC】自学java和三大框架要多久
  8. 大厂首发:java转算法工程师
  9. 今年最新整理的《高频Java面试题集合》,聪明人已经收藏了!
  10. 【微信小程序企业级开发教程】微信小程序目录结构