Hadoop 大数据学习笔记1

  • 大数据部门组织架构
  • Hadoop
    • Hadoop是什么
    • Hadoop的优势
    • Hadoop的组成
      • HDFS架构
      • YARN架构
      • MapReduce
    • 大数据技术生态体系![在这里插入图片描述](https://img-blog.csdnimg.cn/20191209135301229.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2Z1eWlhcg==,size_16,color_FFFFFF,t_70)

大数据部门组织架构

Hadoop

Hadoop是什么

Hadoop 是一个由Apache基金会所开发的分布式系统基础架构。
主要解决,海量数据的存储和海量数据的分析计算问题。
广义上来说,Hadoop通常是指一个广泛的概念———Hadoop生态圈。

Hadoop的优势

1)高可靠性。
2)高扩展性。
3)高效性。
4)高容错性。

Hadoop的组成

MapReduce(计算)
Yarn(资源调度)
HDFS(数据存储)

HDFS架构

1)NameNode(nn):存储文件的元数据,数据索引。
2)DataNode(dn):数据本身。
3)Secondary NameNode(2nn):用于监控HDFS状态的辅助后台程序,获取HDFS元数据的快照。

YARN架构

MapReduce

1)Map阶段并行处理输入数据。
2)Reduce阶段对Map结果进行汇总。

大数据技术生态体系

Hadoop 大数据学习笔记相关推荐

  1. 大数据学习笔记:Hadoop生态系统

    文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...

  2. 大数据学习笔记第1课 Hadoop基础理论与集群搭建

    大数据学习笔记第1课 Hadoop基础理论与集群搭建 一.环境准备 二.下载JDK 三.安装JDK 四.下载hadoop 五.安装hadoop集群 六.打通3台服务器的免密登录 七.hadoop集群配 ...

  3. 大数据学习笔记(一)

    大数据学习笔记(一)大数据概论 大数据是什么 1大数据概念:(big data ) : 指无法在一定时间内用常规软件工具进行捕捉.管理和处理数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和 ...

  4. 【学习笔记】尚硅谷Hadoop大数据教程笔记

    本文是尚硅谷Hadoop教程的学习笔记,由于个人的需要,只致力于搞清楚Hadoop是什么,它可以解决什么问题,以及它的原理是什么.至于具体怎么安装.使用和编写代码不在我考虑的范围内. 一.Hadoop ...

  5. 大数据学习笔记二:Ubuntu/Debian 下安装大数据框架Hadoop

    文章目录 安装Java 为Hadoop创建用户 安装Hadoop 配置Hadoop 配置环境变量 设置配置文件 格式化namenode 启动hadoop集群 访问hadoop集群 大数据学习系列文章: ...

  6. 大数据学习笔记一:大数据的发展历程--MapReduce,Hive,Yarn,Hadoop,Spark,Flink

    大数据学习系列文章:大数据-博客专栏 今天在学习极客时间专栏:<从0开始学大数据> 从预习 01 | 大数据技术发展史:大数据的前世今生到预习 03 | 大数据应用领域:数据驱动一切,系统 ...

  7. 此文献给正打算入门大数据的朋友:大数据学习笔记1000条(2)

    501.MapReduce计算框架中的输入和输出的基本数据结构是键-值对. 502.Hadoop神奇的一部分在于sort和shuffle过程. 503.Hive驱动计算的"语言"是 ...

  8. 大数据学习笔记-hadoop(1)

    目录 前言 一.什么是大数据? 二.Ubuntu基础配置 1.安装Ubuntu20.04 2.修改系统语言为中文 3.修复vi编辑器 4.使用root账户 5.网络配置 6.配置源 7.更新 三.ss ...

  9. 大数据学习笔记之Hadoop(一):Hadoop入门

    文章目录 大数据概论 一.大数据概念 二.大数据的特点 三.大数据能干啥? 四.大数据发展前景 五.企业数据部的业务流程分析 六.企业数据部的一般组织结构 Hadoop(入门) 一 从Hadoop框架 ...

最新文章

  1. EJB究竟是什么,真的那么神奇吗??
  2. Know about RDBMS market share
  3. python游戏-零基础python教程-用Python设计你的第一个小游戏
  4. python3 redis_python3_redis随手学习笔记
  5. Django从理论到实战(part26)--ORM模型
  6. Moving On Gym - 102222F
  7. section和div有什么区别?
  8. mysql transaction 实践小问题
  9. html5调用静态库,浅谈C++ 动态库与静态库的调用
  10. SQL查询数据以及排序
  11. MacOS上如何将MOV文件转换为MP4
  12. 方舟同步服务器信息,方舟服务器备份和数据库备份
  13. 丸子的技术类文章!!它来了!!!
  14. 青龙面板--花花阅读
  15. 嵌入式Linux驱动学习【9】—— Nor Flash
  16. 微信小程序 如何保持登录状态
  17. 新型微框架磁悬浮飞轮用洛伦兹力磁轴承
  18. 缩水u盘的快速检测方法
  19. 【计算机体系结构】计算机体系结构(6) 并行处理技术(2) 多处理机
  20. 说他又未曾婚娶 操盘手软件

热门文章

  1. 专利申请的注意事项有哪些?
  2. 博客园定制页面(一)——博客园设置相关参考
  3. 篇三:Jmeter察看结果树与保存
  4. 安徽c语言二级真题,安徽省计算机等级二级考试真题C语言
  5. 机器学习:维数约减算法PCA(主成分分析法)原理、实现与应用
  6. C盘被占满原因及解决方法
  7. 安装awvs14.7
  8. IBM SPSS Statistics 与用户自定义 Python 模块的集成及分析
  9. 数据结构与算法 c语言 百度网盘,【资料分享】 数据结构与算法全集(C源代码+详细注释)!...
  10. 申报山西省“专精特新”中小企业需要具备哪些条件?