一、Hadoop的产生背景

  1. 关于Hadoop的产生背景来源于Nutch,Nutch
    的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,然而随着抓取网页数据的增加,数据的搜索和储存成为了设计人员所要思考的一个关键!

  2. 2003年Google发布了三篇论文,GFS(Google File System),分布式计算框架(MapReduce),分布式数据库(BigTable),系统的阐述了他们在网页产生的大量数据的存储和搜索以及计算的思路!

  3. Nutch项目的开发人员根据这三篇论文提供的思路,利用java实现了这三篇论文的思想,并从Nutch中剥离开来,成立了一个新的项目Hadoop。

二、什么是Hadoop

关于hadoop的几个概念
1、Apache的开源项目
2、Hadoop的功能
3、Hadoop的功能实现

Hadoop的核心功能实现是通过四大核心组件来实现的
A、Common JNDI RPC 基础功能组件,工具包,底层通讯等
B、HDFS(Hadoop File System)谷歌文件系统在Hadoop上的实现
C、MapReduce 分布式计算框架
D、Hbase 分布式数据库

4、事实上广义的hadoop指的是Hadoop生态圈

三、Hadoop生态圈以及各组成部分


重点组件:

HDFS:Hadoop FIle System分布式文件系统
MAPREDUCE:Hadoop分布式计算框架
Hive:基于Hadoop的分布式类SQL数据仓库工具
HBase:分布式数据存储系统
Zookeeper:分布式协调管理工具
Maout:基于 MapReduce/Flink/Spark 等分布式运算框架的机器学习算法库
Oozie/Azkaban:工作流调度引擎
Sqoop:数据迁入迁出工具
Flume:日志采集工具

Hadoop学习第一章:Hadoop概述相关推荐

  1. 计网学习第一章:概述

    "三网"指的是 电信网络,有线电视网络,计算机网络 ①电信网络:向用户提供电话.电报及传真等服务:②有线电视网络:向用户传送各种电视节目:③计算机网络:能够在计算机之间传送数据文件 ...

  2. 第一章 Hadoop启动Shell启动脚本分析--基于hadoop-0.20.2-cdh3u1

    我的新浪微博:http://weibo.com/freshairbrucewoo. 欢迎大家相互交流,共同提高技术. 第一章 Hadoop启动Shell启动脚本分析 第一节 start-all.sh脚 ...

  3. 第一章 Hadoop

    第一章 Hadoop 1.1 Hadoop 简介 Hadoop 是一个适合海量数据的分布式存储和分布式计算的框架. 这里的分布式存储指的是HDFS :分布式计算指的是MapReduce 1.1.1 H ...

  4. 计算机网络(谢希仁第八版)第一章:概述

    1.计算机网络在信息时代的作用 三网:电信网络,有线电视网络,计算机网络. 三网融合:由于涉及多方面的利益和行政管辖权的问题,目前没有实现. Internet(译名:因特网,目前使用最广泛的译名为:互 ...

  5. 第一章 分布式计算概述

    第一章 分布式计算概述 一.分布式计算的概念 分布式计算是计算机科学的重要研究内容,主要研究对象是分布式系统.简单地说,一个分布式系统是由若干通过网络互连的计算机组成的软硬件系统,且这些计算机互相配合 ...

  6. Python入门到精通【精品】第一章 - Python概述

    Python入门到精通[精品]第一章 - Python概述 1. Python语言历史 2. Python语言特点 3. Python的下载和安装 3.1. Python的下载 3.2. Python ...

  7. 第一章Python概述

    第一章Python概述 一.基本概念 1.IDLE:(Integrated Development and Learning Environment)集成开发和学习环境,是Python的集成开发环境. ...

  8. 【liuyubobobo-玩转图论算法】第一章 课程概述

    持续学习&持续更新中- 守破离 [liuyubobobo-玩转图论算法]第一章 课程概述 图论概述 课程特色 课程大纲 图论的应用 参考 <玩转数据结构>是<图论课程> ...

  9. 计算机概述.ppt,第一章 计算机概述.ppt

    <第一章 计算机概述.ppt>由会员分享,可在线阅读,更多相关<第一章 计算机概述.ppt(52页珍藏版)>请在人人文库网上搜索. 1.计算机硬件技术基础,计算机系统概述,教学 ...

最新文章

  1. 关于学习Python的一点学习总结(42->继承list)
  2. 08Factory Method(工厂方法)模式
  3. Elasticsearch Query DSL基础介绍
  4. Java的call by value_call by value or reference ?
  5. java中解密技术是什么_详解Java 加密解密技术的分类和归纳
  6. jquery级试题_腾讯2020前端面试题含答案解析
  7. Hibernate5-一对多双向关联-迫切左外连接-HQL
  8. 数据库内存泄漏——A SQLiteConnection object for database '/data/data/.../databases/....db' was leaked!...
  9. java在捕获异常并弹窗_Java捕获异常的问题
  10. django中设置url或者models中的slug字段
  11. 5天学python_人生苦短,我将学习Python基本句子(第5天),我学,基础,篇,语句,Day5...
  12. 苹果个人开发者账号如何升级成公司账号
  13. hrbust 哈理工oj 2026 势力较量【并查集】
  14. pcl求平面法向量_PCL自动求解平面法向量参数化表示
  15. 什么是平面设计?平面设计主要做什么?
  16. pcap_compile
  17. 【大学总结】迟到但未缺席的大学总结
  18. 98% after emitting CopyPlugin Vue运行到98% after emitting CopyPlugin卡主不动
  19. 瑞格科技IPO被终止:曾拟募资5.6亿 江振翔三兄弟为实控人
  20. write()与 read() 函数用法(C语言)

热门文章

  1. 连接器是什么?连接器有什么作用?
  2. Javascript事件绑定的几种方式
  3. 打包AS中的APK文件
  4. PyQt5 QtChart-折线图
  5. window10如何开启telnet
  6. 前端如何保存图片?并在相册中查看。
  7. docker创建mysql容器
  8. python 文件命令_python中写入文件数据及文件定位操作命令
  9. 计算机操作校本培训教材,小学教师校本培训教材.doc
  10. ssm框架基于javaEE的企业办公OA管理系统