Hadoop 面试题之九

16.Hbase 的rowkey 怎么创建比较好?列族怎么创建比较好?

答:

19.Hbase 内部是什么机制?

答:

73.hbase 写数据的原理是什么?

答:

75.hbase宕机如何处理?

答:

144. 如果让你设计,你觉得一个分布式文件系统应该如何设计,考虑哪方面内容;

每天百亿数据入hbase,如何保证数据的存储正确和在规定的时间里全部录入完毕,

不残留数据。

答:

149.hbase过滤器实现原则。

答:

164.介绍一下hbase过滤器。

答:

167.hbase集群安装注意事项。

答:

319.Hbase 在进行模型设计时重点在什么地方?一张表中定义多少个Column Family

最合适?为什么?

答:

320.如何提高HBase客户端的读写性能?请举例说明。

答:

353.我们的hbase 大概在公司业务中(主要是网上商城)大概都有几个表,几个表族,大概都存什么样的数据?

答:

354.hbase的并发问题? storm 问题

答:

394.你们用HBASE 存储什么数据?

答:

407.Hbase的体系结构和搭建步骤、shell命令与JavaApi、hbase作为Mapreduce

的输入输出源、高级Javaapi、工作原理(重点是combine和split原理)、行健设计原则、性能优化?

答:

414.现在我们要对oracle 和hbase中的某些表进行更新,你是怎么操作?

提示:disable ‘表名’

alter ’表名’,name=>列名’,versions =>3

enable ‘表名’

答:

415.hbase 接受数据,如果短时间导入数量过多的话就会被锁,该怎么办?集群数16台,高可用性的环境。

参考:

通过调用Htable.setAutoFlush(false)方法可以将htable写客户端的自动flush关闭,这样可以批量写入到数据到hbase。而不是有一条put 就执行一次更新,只有当put填满客户端写缓存时,才实际向Hbase 服务端发起请求。默认情况下auto flush 是开启的。

答:

419.怎样将mysql的数据导入到hbase中?不能使用sqoop,速度太慢了

提示:

A、一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入hbase时,会按照region分区情况,在集群内做数据的负载均衡。

B、hbase 里面有这样一个hfileoutputformat类,他的实现可以将数据转换成hfile格式,通过new一个这个类,进行相关配置,这样会在Hdfs下面产生一个文件,这个时候利用hbase提供的jruby的loadtable.rb脚本就可以进行批量导入。

433.介绍一下Hbase过滤器

参考::http://blog.sina.com.cn/s/blog_ae33b83901017km4.html

435.谈谈Hbase集群安装注意事项?

提示:需要注意的地方是zookeeper的配置,这与hbase-env.sh 文件相关,文集中hbase_managers_zk环境变量用来设置是使用hbase 默认自带的zookeeper 还是使用队里的zookeeper。HBASE_MANGES_ZK=false 时,使用独立的。true是使用默认自带的。

某个节点的hregionserver启动失败,这是由于这3个节点的系统时间不一致相差超过集群的检查时间30s。

477.简述HBase的瓶颈

提示:HBase的瓶颈就是硬传输速度,Hbase 的操作,它可以往数据里面 insert,也可以update一些数据,但update 的实际上也是insert,只是插入一个新的时间戳的一行,delete数据,也是insert,只是insert一行带有delete标记的一行。hbase的所有操作都是追加插入操作。hbase是一种日志集数据库。它的存储方式,像是日志文件一样。它是批量大量的往硬盘中写,通常都是以文件形式的读写。这个读写速度,就取决于硬盘与机器之间的传输有多快。而oracle的瓶颈是硬盘寻到时间。它经常的操作时随机读写。要update一个数据,先要在硬盘中找到这个block,然后把它读入内存,在内存中的缓存中修改,过段时间再回写回去。由于你寻找的block不通,这就存在一个随机的读。硬盘的寻道时间主要由转速来决定。而寻道时间,技术基本没有改变,这就形成了寻道时间瓶颈。

491.HBase如果只向一个RegionServer写入数据,有什么优点?

答:

494.HBase一行数据如何存储?

501.hbase的存储原理

545.hbase协处理器?

421.怎么知道hbase表里哪些做索引?哪些没有做索引?

提示:

有且仅有一个:rowkey,所以hbase得快速查找建立在rowkey的基础的,而不能像一般的关系型数据库那样建立多个索引来达到多条件查找的效果。

24.Hbase过滤器实现原则

----------------------------------------------------------------have done-------------------------------------------------------------

60.描述Hbase搭建过程

1.首先需要hadoop运行环境

2.其次需要zookeeper

3.复制Hadoop的core-site.xml,hdfs-site.xml

4.配置

351.hbase 怎么给web前台提供接口来访问(Htable 可以提供对htable的访问,但是怎么查询同一条记录的多个版本数据?)

答:用javaapi 搞定,查询  多个版本需要指定timestamp

转载于:https://www.cnblogs.com/chaoren399/p/4714814.html

Hadoop 面试题之Hbase相关推荐

  1. hadoop面试题答案

    hadoop面试题答案 Hadoop 面试题,看看书找答案,看看你能答对多少(2) 1. 下面哪个程序负责 HDFS 数据存储. a)NameNode b)Jobtracker c)Datanode  ...

  2. 大数据面试题(一)----HADOOP 面试题

    "无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.". 大数 ...

  3. 100 道常见 Hadoop 面试题及答案解析

    100 道常见 Hadoop 面试题及答案解析 目录 1 单选题 ................................................................... ...

  4. Hadoop面试题 (网上收集版带答案)

    1.列出安装Hadoop流程步骤 a) 创建hadoop账号 b) 更改ip c) 安装Java 更改/etc/profile 配置环境变量 d) 修改host文件域名 e) 安装ssh 配置无密码登 ...

  5. Hadoop学习笔记—15.HBase框架学习(基础知识篇)

    Hadoop学习笔记-15.HBase框架学习(基础知识篇) HBase是Apache Hadoop的数据库,能够对大型数据提供随机.实时的读写访问.HBase的目标是存储并处理大型的数据.HBase ...

  6. 集群节点基于Hadoop集群的HBase集群的配置【2】

    首先声明,我是一个菜鸟.一下文章中现出技术误导情况盖不负责 基于Hadoop集群的HBase集群的配置 1.准备工作 a.经已实现安装的Hadoop集群环境 b.所须要的软件包 zookeeper-3 ...

  7. 大数据学习系列之八----- Hadoop、Spark、HBase、Hive搭建环境遇到的错误以及解决方法

    大数据学习系列之八----- Hadoop.Spark.HBase.Hive搭建环境遇到的错误以及解决方法 参考文章: (1)大数据学习系列之八----- Hadoop.Spark.HBase.Hiv ...

  8. 小丸子学Hadoop系列之——部署Hbase集群

    0.集群规划 主机名 ip地址 安装的软件 运行的进程 AI-OPT-HBS01 10.46.52.30 hadoop,hbase namenode,zkfc,resourcemanager AI-O ...

  9. Hadoop面试题和答案

    Hadoop面试题和答案 1.什么是 Hadoop? Hadoop是一个分布式计算平台. 它是用 Java 编写的. 它由 Google 文件系统和 MapReduce 等功能组成. 2.运行 Had ...

最新文章

  1. Python | 用PrettyPrinter,让Python输出更漂亮,你值得拥有
  2. load data详解
  3. tf.layers.flatten
  4. 《鸿蒙理论知识04》HarmonyOS概述之系统定义
  5. 开篇词:如何轻松获得 Offer
  6. cmd查看某个服务器端口状态,cmd中检测端口是否处于监听状态 | IT博客
  7. springboot 支付宝电脑支付
  8. Android NDK开发:打包so库及jar包供他人使用
  9. 差分硬盘的merge(合并差异)实验分析
  10. 简单比较init-method,afterPropertiesSet和BeanPostProcessor
  11. 【路径规划】基于matlab GUI EKF算法机器人SLAM演示路径规划【含Matlab源码 509期】
  12. php字符串转拼音,php程序如何把中文字符转换为拼音
  13. 微信公众账号api开发
  14. 如何制作多链接二维码?一次性防伪二维码?
  15. 【processing】Daniel Shiffman编程挑战题解、思维介绍及代码(1)穿越星际效果编译
  16. 服务器编程之路:进无止境(上)
  17. 计算机主板系统安装系统安装系统,重装系统_系统重装_电脑重装系统【步骤|图文教程】-太平洋IT百科手机版...
  18. 关于CSS中left:50%; top:50%; margin-left: -150px; margin-top: -75px;
  19. 一个风靡全球的游戏(需要大家来参加)!!!
  20. 基础知识【H5新增知识1】

热门文章

  1. java的socket读取一行就结束运行了?使用这种方法可以读取多行数据!
  2. 需求用例分析之二:级别设置
  3. python爬虫requests源码链家_python的爬虫项目(链家买二手房)
  4. 交大世界大学排名 计算机专业,2018考研:计算机专业全球院校排名公布,上海交通大学竟排第一?...
  5. 【干货下载】大数据分析的四个关键环节
  6. js 小数点 精准算法
  7. 一个完整的 Web 请求到底发生了什么
  8. 几分钟了解阿里云云服务器ECS
  9. Crontab命令格式
  10. java使用JDBC连接数据库的几种方式