这就是Hadoop

一天天都在说hadoop,到底什么才是hadoop呢?

1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

1)、 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

2、Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算

Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。
Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。
Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。
Hadoop 还是可伸缩的,能够处理 PB 级数据。
此外,Hadoop 依赖于社区服务,因此它的成本比较低,任何人都可以使用。
3、Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点:


高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。
高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。
高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。
高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。
低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目的软件成本因此会大大降低。

4、Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。Hadoop 上的应用程序也可以使用其他语言编写,比如 C++。

5、hadoop大数据处理的意义
Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储,对例如像ETL这样的批处理操作相对合适,因为类似这样操作的批处理结果可以直接走向存储。Hadoop的MapReduce功能实现了将单个任务打碎,并将碎片任务(Map)发送到多个节点上,之后再以单个数据集的形式加载(Reduce)到数据仓库里。

6、当然,现阶段,只能理解到这个玩意能做什么的程度,如果想要更深入的理解以及应用,只能耐着性子挠着头皮继续学习了。

hadoop到底是什么相关推荐

  1. 小白 也能听懂Hadoop到底是什么!

    缘起 呆在舒适区太久了,最近学了下大数据,正好总结,复习一下,用一个小故事来带出Hadoop是什么 ! 有一天 ,我的朋友 小扬 在看 某老师的视频 ,他刚开始看的时候,查找没什么难度,一般利用搜索引 ...

  2. 大白话告诉你,hadoop到底是个什么鬼

    hadoop是什么? (1)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式.Hadoop=HD ...

  3. 一篇文看懂Hadoop

    我们很荣幸能够见证Hadoop十年从无到有,再到称王.感动于技术的日新月异时,希望通过这篇内容深入解读Hadoop的昨天.今天和明天,憧憬下一个十年. 本文分为技术篇.产业篇.应用篇.展望篇四部分 技 ...

  4. Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

    深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 "昔我十年前,与君始相识." 一瞬间Hadoop也到了要 ...

  5. 【大数据】Hadoop (二) HDFS

    课程链接: 尚硅谷大数据Hadoop 3.x(入门搭建+安装调优)_哔哩哔哩_bilibili (Hadoop到底是干什么用的? - 知乎 (zhihu.com) 资料 Hadoop中文文档 (apa ...

  6. hadoop入门教程免费下载

    Hadoop入门教程免费下载,学习大数据的小伙伴应该都知道Hadoop是必须要接触的,学习大数据,从Hadoop入门教程开始. Hadoop是什么? 首先我们了解到Hadoop是Apache软件基金会 ...

  7. 深度好文丨读完此文,就知道Hadoop了!

    "昔我十年前,与君始相识." 一瞬间Hadoop也到了要初中择校的年龄了. 十年前还没有Hadoop,几年前国内IT圈里还不知道什么是Hadoop,而现在几乎所有大型企业的IT系统 ...

  8. hadoop应用场景总结

    原文地址 我个人接触hadoop仅仅不到一年,因为是业余时间学习,故进度较慢,看过好多视频,买过好多书,学过基本知识,搭建过伪分布式集群,有过简单的教程式开发,恰逢毕业季,面试过相关岗位,自认为路还很 ...

  9. 【大数据】Hadoop (一) 入门

    课程链接: 尚硅谷大数据Hadoop 3.x(入门搭建+安装调优)_哔哩哔哩_bilibili (Hadoop到底是干什么用的? - 知乎 (zhihu.com) 资料 Hadoop中文文档 (apa ...

  10. Hadoop未来展望

    我们很荣幸能够见证Hadoop十年从无到有,再到称王.感动于技术的日新月异时,希望通过这篇内容深入解读Hadoop的昨天.今天和明天,憧憬下一个十年. 本文分为技术篇.产业篇.应用篇.展望篇四部分 技 ...

最新文章

  1. python调用shell命令-Python怎么运行shell脚本
  2. Redkale 技术详解 03 -- Convert高性能序列化
  3. 贪心算法--删数问题
  4. 基于silerlight for embedd 视频播放器的之一的问题
  5. 如何用C#在Excel中生成图表?
  6. java中修饰符的说明
  7. Unity3d打开的时候,卡在loading界面白屏的解决方法
  8. JSR-303 数据校验学习
  9. D-star Lite算法及其动态路径规划实验研究
  10. Ubuntu 18.04安装Eclipse教程
  11. Marshmallow 实现序列化和反序列化
  12. Eclipse Error - Error notifying a preference...
  13. 普通PC通过USB转485串口 ModBus-RTU通信协议控制伺服电机
  14. 品牌连锁店5G/4G无线组网方案
  15. 【跨域】Access-Control-Allow-Origin 简单介绍
  16. USACO 2008 Jan Gold 3.Cell Phone Network 树形dp
  17. 独数,python,C代码实现
  18. ELK继续分析V2EX(我自己搬运我自己)
  19. DirectX 修复工具增强版
  20. FL2440(S3C2440A 芯片) 开发板开发笔记

热门文章

  1. 第四篇:UE4视角切换节点,Possess和Set View Target With Blend的区别
  2. 计算机考试金麦圈编号教程,计算机二级:数据处理.docx
  3. 个子矮s弯如何看点打方向图解_科目二s弯怎么看点打方向技巧图解
  4. 机器学习之用Hog+Svm人脸检测、交通标志和字符识别等(初学者)
  5. ThinkPHP学生作业管理系统
  6. 使用yigo遇到的小问题
  7. 【Linux基础编程】help命令
  8. linux 怎么临时修改ip,linux中临时、永久修改ip(示例代码)
  9. USYD悉尼大学INFO1110 详细作业解析Week4 revision(未更新完)
  10. APtos 简介及机制