1、集群的最主要瓶颈

  磁盘IO

2、Hadoop运行模式

  单机版、伪分布式模式、完全分布式模式

3、Hadoop生态圈的组件并做简要描述

  1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。
  2)Flume:一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。
  3)Hbase:是一个分布式的、面向列的开源数据库, 利用Hadoop HDFS作为其存储系统。
  4)Hive:基于Hadoop的一个数据仓库工具,可以将结构化的数据档映射为一张数据库表,并提供简单的sql 查询功能,可以将sql语句转换为MapReduce任务进行运行。
  5)Sqoop:将一个关系型数据库中的数据导进到Hadoop的 HDFS中,也可以将HDFS的数据导进到关系型数据库中。

4、解释“hadoop”和“hadoop 生态系统”两个概念

  Hadoop是指Hadoop框架本身;hadoop生态系统,不仅包含hadoop,还包括保证hadoop框架正常高效运行其他框架,比如zookeeper、Flume、Hbase、Hive、Sqoop等辅助框架。

5、请列出正常工作的Hadoop集群中Hadoop都分别需要启动哪些进程,它们的作用分别是什么?

  1)NameNode:它是hadoop中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问,保存有metadate。
  2)SecondaryNameNode:它不是namenode的冗余守护进程,而是提供周期检查点和清理任务。帮助NN合并editslog,减少NN启动时间。
  3)DataNode:它负责管理连接到节点的存储(一个集群中可以有多个节点)。每个存储数据的节点运行一个datanode守护进程。
  4)ResourceManager(JobTracker):JobTracker负责调度DataNode上的工作。每个DataNode有一个TaskTracker,它们执行实际工作。
  5)NodeManager:(TaskTracker)执行任务。
  6)DFSZKFailoverController:高可用时它负责监控NN的状态,并及时的把状态信息写入ZK。它通过一个独立线程周期性的调用NN上的一个特定接口来获取NN的健康状态。FC也有选择谁作为Active NN的权利,因为最多只有两个节点,目前选择策略还比较简单(先到先得,轮换)。
  7)JournalNode:高可用情况下存放namenode的editlog文件。

Hadoop面试题(一)相关推荐

  1. Hadoop 面试题之Hbase

    Hadoop 面试题之九 16.Hbase 的rowkey 怎么创建比较好?列族怎么创建比较好? 答: 19.Hbase 内部是什么机制? 答: 73.hbase 写数据的原理是什么? 答: 75.h ...

  2. hadoop面试题答案

    hadoop面试题答案 Hadoop 面试题,看看书找答案,看看你能答对多少(2) 1. 下面哪个程序负责 HDFS 数据存储. a)NameNode b)Jobtracker c)Datanode  ...

  3. 大数据面试题(一)----HADOOP 面试题

    "无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.". 大数 ...

  4. Hadoop面试题和答案

    Hadoop面试题和答案 1.什么是 Hadoop? Hadoop是一个分布式计算平台. 它是用 Java 编写的. 它由 Google 文件系统和 MapReduce 等功能组成. 2.运行 Had ...

  5. 100 道常见 Hadoop 面试题及答案解析

    100 道常见 Hadoop 面试题及答案解析 目录 1 单选题 ................................................................... ...

  6. Hadoop面试题汇总-20221031

    Hadoop面试题汇总 HDFS部分 1.请描述HDFS的写流程. 答: 首先由客户端向 NameNode 发起文件上传请求,NameNode 检查文件要上传的目录,并鉴权. 如果上传用户对此目录有权 ...

  7. Hadoop面试题 (网上收集版带答案)

    1.列出安装Hadoop流程步骤 a) 创建hadoop账号 b) 更改ip c) 安装Java 更改/etc/profile 配置环境变量 d) 修改host文件域名 e) 安装ssh 配置无密码登 ...

  8. Hadoop期末试题复习题

    文章目录 单选 多选题 判断题 部分知识点 来源 预判老师的预判,考试了,复习用 单选 目前,Hadoop的最高版本是哪个? A.Hadoop3.x B.Hadoop2.x C.Hadoop4.x D ...

  9. 成为大数据顶尖程序员,先过了这些Hadoop面试题!(附答案解析)

    导读:在大数据开发岗位的需求下,工资待遇水涨船高,不少编程人员在面对职业瓶颈期的时候,会选择转编程方向发展. 你是否已经意识这是你人生中的一个重要转机?能不能抓住这个时代的机遇,就在于你对大数据信息的 ...

  10. hadoop面试题 5 ---有用

    1.0 简要描述如何安装配置apache的一个开源hadoop,只描述即可,无需列出具体步骤,列出具体步骤更好. 答:第一题:1使用root账户登录 2 修改IP 3 修改host主机名 4 配置SS ...

最新文章

  1. Docker如何正确开启 Hyper-V?
  2. MYSQL 开启root远程登录权限
  3. java 协议栈_深入浅出讲解低功耗蓝牙(BLE)协议栈
  4. 搭量化数据库——互联网金融之三
  5. Transformer升级之路:Sinusoidal位置编码追根溯源
  6. LBS核心技术解析(引子)
  7. 开始深入的学习javascript
  8. 2021年11月国产数据库排行榜:openGauss闯入前三,Kingbase流行度与日俱增,TDengine厚积薄发
  9. 解决windows安装mongodb出现dbexit: rc:100错误
  10. Spring Boot-面试题
  11. 电脑虎牙,虎牙助手主播版电脑版
  12. 2020 macbook pro 16寸 前端开发 我的装机软件整理
  13. Uri Herrera 近日宣布 Nitrux 2.1 的发布和普遍可用性
  14. 更改以太网共享属性家庭网络连接值,解决电脑笔记本连接校园网显示无internet无法开热点或开热点手机无ip分配问题
  15. 写给小白的区块链科普文
  16. Cisco Packet Tracer 命令大全 【思科交换机模拟器命令大全】
  17. Vacuum tube 真空管/电子管
  18. 研究揭示人类大脑进化的基因组调控机制
  19. 智能驾驶大数据是什么?传统车企如何升级?
  20. Java打造RPC框架(四):支持zookeeper与负载均衡

热门文章

  1. 光环PMP:超凡IT经理人的“六重修炼”专题讲座
  2. Spring Cloud Eureka Server 源码解析(七)处理客户端增量下载请求、读写锁问题
  3. 国二C语言用编译器做题,C语言编程实例100题——国二国三题库大全(必过).doc
  4. Sybase数据库的备份
  5. Android MTK修改手机型号
  6. 基于python实现Maxwell软件的自动化仿真分析_1
  7. 移动App测试中Android测试和IOS测试有啥区别
  8. 论文的英文文献在哪找(除了知网)?
  9. 《金字塔原理》读书摘记
  10. Spring-Boot开发者工具:自动重启、LiveReload、远程开发、默认的开发时属性值