1、什么是Hadoop?

Hadoop,简单而言,就是一个用于处理海量数据的分布式框架。他是将一堆海量的数据分发至不同的电脑上进行存储和处理分析,这样就避免了因数据量太大,导致在一台电脑处理数据时出现宕机或者崩溃的情况,不仅提高了海量数据的处理速度,还具有极高的安全性。

他解决了两大难题:海量数据的存储和海量数据的处理分析,这也构成了hadoop的两大核心:HDFS和MapReduce。

2、Hadoop的特点

(1)高可靠性:在处理数据时,Hadoop往往会将数据备份多份分发至不同的机器进行保存,这样就避免了在处理数据时,机器宕机导致数据丢失的麻烦,保证了数据的安全性、可靠性。
(2)高扩展性:在处理数据时,如果当前集群的资源(比如存储能力和运算能力)不足以完成数据处理和分析任务,可以通过快速扩充集群规模进行扩容和加强集群的运算能力。
(3)高效性:相比传统的单台机器处理数据,效率是极高的。
(4)高容错性:Hadoop能自动保存数据的多个副本,当某个节点宕机时,它可以自动的将副本复制给其他机器,保证数据的完整性,并且可以将失败的任务重新分发。
(5)低成本:Hadoop集群可以将程序运行在廉价的机器上并发的进行处理,成本低、效率高,是处理海量数据的最佳选择。

3、Hadoop的组件

(1)HDFS:Hadoop Distribute File System,分布式文件系统,用于存储海量数据。
(2)MapReduce:Hadoop的分布式运算框架。
(3)Yarn:分布式资源调度和任务监控和分配的平台。
(4)commons:Hadoop底层的技术支持。

hadoop的概念及特点相关推荐

  1. Hadoop的概念及架构介绍

    Hadoop的概念及架构介绍 Hadoop是大数据开发所使用的一个核心框架.使用Hadoop可以方便的管理分布式集群,将海量数据分布式的存储在集群中(hdfs),并使用分布式程序来处理这些数据.(Ma ...

  2. Hadoop初级之Hadoop基本概念与应用前景

    Hadoop 大数据概念 大数据(big data):指无法在一定时间范围内用常规软件工具(例如java ee 中的mysql)进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞 ...

  3. Hadoop入门概念

    这里写自定义目录标题 1. 概述 1.1 简介 1.2 安装部署 1.3 启动&关闭 2. HDFS 2.1 概述 2.2 HDFS Shell操作 2.3 节点概述 2.4 HDFS写数据流 ...

  4. 初识Hadoop之概念认知篇

    Hadoop作为大数据的支撑,那么我们会有一些疑问,什么是Hadoop,Hadoop能够做些什么,它的优点是什么,它是如何进行海量数据的操作的.相信这些疑问,一定在此时困扰着你,不要担心,下面我们一步 ...

  5. 大数据之Hadoop——1概念

    1 Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构. 2)主要解决海量数据的存储和海量数据的分析计算问题. 3)广义上来说,Hadoop通常是指一个更广泛的概 ...

  6. 【Hadoop】第一天 Hadoop基本概念跟原理以及安装

    所需资源视频及课件 公众号均有哦,可关注获取 大数据概念 大数据概念 大数据(big data):一般值 无法再一定范围时间内用常规软件进行捕捉处理和优化的数据集和,需要新处理模式下才能具有更强的决策 ...

  7. hadoop 各种概念整理

    Hadoop Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS. HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost ...

  8. Hadoop入门 概念

    Hadoop是分布式系统基础架构,通常指Hadoop生态圈 主要解决 1.海量数据的存储 2.海量数据的分析计算 优势 高可靠性:Hadoop底层维护多个数据副本,即使Hadoop某个计算元素或存储出 ...

  9. Hadoop入门(一)概念与单机安装

    一.hadoop的概念 (1)什么是大数据 大数据是不能用传统的计算技术处理的大型数据集的集合.它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域. (2)hadoop的定义 Hadoop是一 ...

最新文章

  1. 高盛:人工智能生态报告 最全AI产业盘点
  2. ios 工具大全,最全框架
  3. 原生js中如果有多个onload事件解决方案
  4. Thymeleaf的Spring数据
  5. (69)信号发生器DDS正弦波设计(一)(第14天)
  6. django框架基础
  7. C++ 链表入门习题
  8. openwrt运行linux软件,使用OpenWrt开发嵌入式Linux(二):先让系统跑起来(使用initramfs)...
  9. Bind 一些有趣的东西 【未完待续】
  10. html5拼音显示,HTML5:给汉字加拼音?收起展开组件?
  11. ansible模块--setup模块
  12. 防关联超级浏览器(超级防关联浏览器)的应用场景和技术原理
  13. 用微信公众号做淘宝优惠券查券搜券和返利机器人的详细配置教程
  14. GBASE 8s DB-Access入门
  15. 西安电子科技大学计算机考研历年分数线,西安电子科技大学历年考研分数线汇总[2012-2021]...
  16. 压力单位PSI,PSIG, PSIA的区别
  17. 怎样将PDF中指定页面方向进行旋转
  18. 困在“墙”里的中年程序员
  19. Java数组讲解(数组,字符串数组,多态数组)
  20. 【Proteus仿真】74HC165功能验证

热门文章

  1. 《机器人爱好者(第3辑)》——与超级电脑比翼齐飞的游戏机
  2. java环境变量设置 win2003,2021-03-09Win10的Java环境配置Win10下Java环境变量配置
  3. 原生js-js类库-js框架-前端框架-区别
  4. 安卓手机加密_分享安卓手机使用点盾云播放百度网盘下载的加密视频
  5. Delphi XE GDI+编程
  6. Kiwi Syslog Web Access 无法登录问题,登录没有反应
  7. jQuery(一)jQuery概述、使用方式、原理、查找元素
  8. C#窗体TextBox只能输入数字
  9. 获5.3亿美金融资,亚马逊、红杉入局,自动驾驶“梦之队”Aurora还藏了哪些秘招?...
  10. 网站策划运营需掌握的14种文档 你会几种?