什么是Hadoop

Hadoop 是使用 Java 编写,允许分布在集群,使用简单的编程模型的计算机大型数据集处理的Apache 的开源框架。 Hadoop 框架应用工程提供跨计算机集群的分布式存储和计算的环境。 Hadoop 是专为从单一服务器到上千台机器扩展,每个机器都可以提供本地计算和存储。

Hadoop 可以用单节点模式安装,但是只有多节点集群才能发挥 Hadoop 的优势,我们可以把集群扩展到上千个节点,而且扩展过程中不需要先停掉集群。

Hadoop 由三个关键部分组成:
HDFS:Hadoop 分布式文件系统,它是 Hadoop 数据存储层。
MapReduce:数据计算框架
YARN:负责资源管理和任务调度。

Hadoop 架构

在了解了什么是 Hadoop 之后,再来详细了解一下 Hadoop 的架构。

Hadoop 以主从的方式工作。一个 Master 节点和多个 Slave 节点,slave 节点可以扩招到1000个。Master 节点管理,维护和监控 slave 节点, slave 节点是真正在干活的机器。Master 节点应该部署在配置较高的机器上面,因为它是 hadoop 集群的核心。Maste r存储元数据(即数据的数据),slave 是真正存储数据的机器。客户端通过master 节点来分发任

Hadoop系列之什么是Hadoop(1)相关推荐

  1. Hadoop系列之九:Hadoop集群伪分布式模式的实现详解

    1.Hadoop依赖软件 Hadoop基于Java语言开发,因此其运行严重依赖于JDK(Java Development Kit),并且Hadoop的许多功能依赖于Java 6及以后的版本才提供的特性 ...

  2. Hadoop 系列之 Hive

    Hadoop 系列之 Hive Hive 的官网:http://hive.apache.org/ Hive versions 1.2 onward require Java 1.7 or newer. ...

  3. Hadoop 系列之 HDFS

    Hadoop 系列之 HDFS 花絮 上一篇文章 Hadoop 系列之 1.0和2.0架构 中,提到了 Google 的三驾马车,关于分布式存储,计算以及列式存储的论文,分别对应开源的 HDFS,Ma ...

  4. Hadoop 系列之 1.0 和2.0 架构

    Hadoop 系列之 1.0 和2.0 架构 自学大数据有一段时间了,找工作历时一周,找到一家大厂,下周入职,薪资待遇还不错,公司的业务背景自己也很喜欢.趁着还没有入职,给大家争取先把 Hadoop ...

  5. Hadoop 基础系列一Hadoop 系列之 1.0 和2.0 架构

    精选30+云产品,助力企业轻松上云!>>> Hadoop 系列之 1.0 和2.0 架构 自学大数据有一段时间了,找工作历时一周,找到一家大厂,下周入职,薪资待遇还不错,公司的业务背 ...

  6. hadoop系列三:mapreduce的使用(一)

    一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等. 当前使用的hadoop版本为2.6.4 上一篇:hadoop系列二: ...

  7. hadoop系列四:mapreduce的使用(二)

    转载请在页首明显处注明作者与出处 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等. 当前使用的hadoop版本为2.6 ...

  8. Hadoop系列之-7、Hadoop3.x的介绍

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 大数据系列文章目录 目录 介绍 Hadoop 3.0新特性 介绍 由于Hadoop 2.0是基 ...

  9. 小丸子学Hadoop系列之——部署Hbase集群

    0.集群规划 主机名 ip地址 安装的软件 运行的进程 AI-OPT-HBS01 10.46.52.30 hadoop,hbase namenode,zkfc,resourcemanager AI-O ...

  10. hadoop系列(一)概念、组件介绍、安装环境、配置

    hadoop系列(一)概念.组件介绍.安装环境.配置 一.大数据概念 概念 大数据:解决海量数据的采集.存储.分析计算的能力 大数据特点 Volume(大量) Velocity(高速) Variety ...

最新文章

  1. 一根棉签解决身上各种酸痛,立马感觉无比舒畅!
  2. 神经网络?决策树?都做不到!谁能解决可解释性AI?
  3. 常考数据结构与算法:表达式求值
  4. mysql语句导出数据库文件_通过Mysql命令行语句来导入、导出数据库文件
  5. 交货单批次拆分(BAPI_OUTB_DELIVERY_CHANGE )并更改拣配数量,发货过账(WS_DELIVERY_UPDATE)
  6. python draw.text颜色_python wand:用draw.text()改变文本样式
  7. windows phone 8 使用页面传对象的方式 实现页面间的多值传递
  8. [随笔重写] Python3 的深拷贝与浅拷贝
  9. 类似mysqlhotcopy备份mysql myisam脚本
  10. 华为澄清:公司副总裁未发表中美技术还差两万五千里表述
  11. ubuntu查看python安装路径
  12. 树链剖分(入门学习)
  13. HTML5程序设计 SVG
  14. wsimport 的使用
  15. 大数据和Hadoop培训能否满足市场需求
  16. 花好明月夜,美和易思祝您元宵节快乐!
  17. 完成静态服务器——Node.js摸石头系列之四
  18. 垃圾分类回收APP开发解决方案
  19. MyBatis 大于小于不等于的写法
  20. matlab实习,matlab实习报告

热门文章

  1. 删软件怎么用计算机管理员删除,win10卸载软件需要管理员权限,卸载软件没有管理员权限...
  2. jackson解析泛型的正确写法,解决 in unnamed module of loader ‘app‘
  3. 99 年妹子开发吊打 x 度网盘的开源神器!
  4. 某网站登录接口password参数还原
  5. 七夕表白java代码_身为程序猿的你,七夕表白代码你有get吗
  6. Spring In Action 4 学习笔记(一)Spring概览
  7. Docker容器启动报WARNINGIPv4 forwarding
  8. MySQL八股文连环45问,你能坚持第几问?
  9. 伟大的UHD编解码器的辩论:谷歌VP9与HEVC / H.265
  10. 【数学】微分(Differential)的定义,微分与导数的区别