HBase 2.x ---- HBase简介

  • 1. HBase定义
  • 2. HBase数据模型
    • 1. HBase逻辑结构
    • 2. HBase物理存储结构
    • 3. 数据模型
  • 3. HBase基本架构

1. HBase定义

Apache HBase 是以 hdfs 为数据存储的,一种分布式、可扩展的 NoSQL 数据库。(非关系型数据库)

2. HBase数据模型

HBase 的设计理念依据 Google 的 BigTable 论文,论文中对数据模型的首句介绍。

Bigtable 是一个稀疏的、分布式的、持久的多维排序 map

之后对于映射的解释如下:

该映射由行键、列键和时间戳索引;映射中的每个值都是一个未解释的字节数组。

最终 HBase 关于数据模型和 BigTable 的对应关系如下:

HBase 使用与 BigTable 非常相似的数据模型。用户将数据行存储在带标签的表中。数据行具有可排序的键和任意数量的列。该表存储稀疏,因此如果用户喜欢,同一表中的行可以具有疯狂变化的列。

最终理解 HBase 数据模型的关键在于稀疏、分布式、多维、排序的映射。其中映射 map 指代非关系型数据库的 key-value 结构。

1. HBase逻辑结构

HBase 可以用于存储多种结构的数据,以 JSON 为例,存储的数据原貌为:

{"row_key1": {"personal_info": {"name": "zhangsan","city": "北京","phone": "131********"},"office_info": {"tel": "010-1111111","address": "atguigu"}},"row_key11": {"personal_info": {"city": "上海","phone": "132********"},"office_info": {"tel": "010-1111111"}},"row_key2": {......}
}

HBase逻辑结构
存储数据稀疏,数据存储多维,不同的行具有不同的列。

2. HBase物理存储结构

物理存储结构即为数据映射关系,而在概念视图的空单元格,底层实际根本不存储。

3. 数据模型

  1. Name Space
    命名空间,类似于关系型数据库的 database 概念,每个命名空间下有多个表。HBase 两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default 表示用户默认使用的命名空间。

  2. Table
    类似于关系型数据库的表概念。不同的是,HBase 定义表时只需要声明列族即可,不需要声明具体的列。因为数据存储时稀疏的,所有往 HBase 写入数据时,字段可以动态、按需指定。因此,和关系型数据相比,HBase 能够轻松应对字段变更的场景。

  3. Row
    HBase 表中的每行数据都由一个 RowKey 和多个 Column(列)组成,数据是按照 RowKey 的字典顺序存储的,并且查询数据时只能根据 RowKey 进行检索,所以 RowKey 的设计十分重要。

  4. Column
    HBase 中的每个列都由 Column Family(列族) 和 **Column Qualifier(列限定符)**进行限定,例如 info: name,info: age。建表时,只需指定列族,而列限定符无需预先定义。

  5. Time Stamp
    用于标识数据的不同版本(version),每条数据写入时,系统会自动为其加上该字段,其值为写入 HBase 的时间。

  6. Cell
    由 { rowkey, column Family; column Qualifier, timestamp } 唯一确定的单元。cell 中的数据全部都是字节码形式存储。

3. HBase基本架构

  1. Master
    实现类为 HMaster,负责监控集群中所有的 RegionServer 实例。主要作用如下:
    (1)管理元数据表格 hbase:meta,接收用户对表格创建修改删除的命令并执行
    (2)监控 region 是否需要进行负载均衡,故障转移和 region 的拆分。
    通过启动多个后台线程监控实现上述功能:
    ①LoadBalancer 负载均衡器
    周期性监控 region 分布在 regionServer 上面是否均衡,由参数 hbase.balancer.period 控制周期时间,默认 5 分钟。
    ②CatalogJanitor 元数据管理器
    定期检查和清理 hbase:meta 中的数据。meta 表内容在进阶中介绍。
    ③MasterProcWAL master 预写日志处理器
    把 master 需要执行的任务记录到预写日志 WAL 中,如果 master 宕机,让 backupMaster读取日志继续干。

  2. Region Server
    Region Server 实现类为 HRegionServer,主要作用如下:
    (1)负责数据 cell 的处理,例如写入数据 put,查询数据 get 等
    (2)拆分合并 region 的实际执行者,有 master 监控,有 regionServer 执行。

  3. Zookeeper
    HBase 通过 Zookeeper 来做 master 的高可用、记录 RegionServer 的部署信息、并且存储有 meta 表的位置信息。
    HBase 对于数据的读写操作时直接访问 Zookeeper 的,在 2.3 版本推出 Master Registry 模式,客户端可以直接访问 master。使用此功能,会加大对 master 的压力,减轻对 Zookeeper 的压力。

  4. HDFS
    HDFS 为 Hbase 提供最终的底层数据存储服务,同时为 HBase 提供高容错的支持。

HBase 2.x ---- HBase简介相关推荐

  1. HBase基础【HBase简介、HBase安装、HBase shell操作】

    文章目录 一 HBase简介 1 HBase定义 2 HBase数据模型 (1) HBase逻辑结构 (2) HBase物理存储结构 (3)数据模型 a)Name Space b)Table c)Ro ...

  2. Centos Linux 单机安装 HBase 、使用 HBase

    Centos Linux 单机安装 HBase .使用 HBase 视频教程链接:https://www.bilibili.com/video/BV1Z84y1z787/ 1. HBase 简介 HB ...

  3. spark读Hbase数据集成Hbase Filter(过滤器)

    文章目录 过滤器简介 spark 读Hbase集成Filter TableInputFormat 源码 代码示例 基于hbase版本2.3.5 过滤器简介 Hbase 提供了种类丰富的过滤器(filt ...

  4. HBase ACL管理 Hbase 权限管理

    场景:hadoop集群已经进行kerberos认证 启动Hbase相关配置 Hbase权限分为以下五种: Read(R) : 可以读取给定范围内数据的权限 Write(W) : 可以在给定范围内写数据 ...

  5. 带你了解 HBase 数据模型和 HBase 架构

    摘要:HBase 是一个面向列的 NoSQL 数据库. 本文分享自华为云社区<HBase 架构:HBase 数据模型 & HBase 读/写机制>,作者: Donglian Lin ...

  6. HBase学习(四) HBase API操作

    目录 准备工作 创建maven项目 添加依赖 API操作 创建HBase连接 创建HBase表 删除表 向表中插入数据 查看数据 过滤器操作 全部代码 注意事项 准备工作 创建maven项目 添加依赖 ...

  7. hbase 使用lzo_hadoop hbase lzo 安装

    ort> failed on local exception 网上大部分说事使用hadoop 的21版本问题,但我用的是20的. 后来把hbase_home/lib(启动的时候会加载里面所有ja ...

  8. HBase --------- 深入了解HBase架构(架构组建及HBase工作原理)

    HBase架构组件 从物理结构上讲,HBase由三种类型的服务器构成主从式架构.Region Servers为数据的读取和写入提供服务.当访问数据时,客户端直接和Region Servers通信.Re ...

  9. Hbase教程(二) Hbase数据库Shell命令

    Hbase教程(二) Hbase数据库Shell命令 1 Hbase- Shell命令 Hbase是分布式是一个分布式的.面向列的开源数据库,Hbase也提供了Shell命令对数据库增.删.改.查的权 ...

最新文章

  1. linux双机(多机)自动互备份方案
  2. IO多路复用原理剖析
  3. AtCoder Grand Contest 021 D - Reversed LCS(区间dp)
  4. Java学习笔记—TCP通信
  5. 5-3 面向可维护性的构造技术
  6. 程序员真实写真:35岁前成功的12条黄金法则 (转)
  7. win10便签常驻桌面_win7和win10自带桌面便签哪里找
  8. MQTT和CoAP对比
  9. 2005年国内最有份量的资源下载网站一览
  10. 2009年 上海证券交易所新一代交易系统有多牛逼
  11. uploadify Uncaught TypeError: $(...).uploadify is not a function
  12. 亚马逊echo中国使用_您是否需要Amazon Prime才能使用Amazon Echo?
  13. 三菱服务器显示51,三菱空调故障代码51什么意思一招解决 -三菱柜机故障代码06...
  14. 继往开来,中国移动与日本软银引领TD-LTE产业进入5G时代
  15. 性化地图制作软件OpenOrienteering Mapper(附安装包)
  16. 关于手动注册dll文件遇到的一个小问题
  17. java企业车辆管理系统_基于jsp的企业车辆管理系统-JavaEE实现企业车辆管理系统 - java项目源码...
  18. webClient和restTemplate对比
  19. 20230117/18
  20. 基于keil5自动配置stm32f103标准库的官网freertos移植

热门文章

  1. 降本增效这九个月,爱奇艺从“穿越火线”,到“冷静增长”
  2. iOS开发实用技术之MapKit框架的使用
  3. 快速构建一款 AR App 入门指南
  4. typhon例子:cs,bufDataset(类似delphi的clientDataset),josn解析器
  5. 开启加盟模式,喜茶能否借此越过山丘?
  6. 基于影像基因的肺结节分割、肺癌分类分期、CT影像预测基因突变 --董云云 论文阅读
  7. 信息安全工程第四章网络安全体系与网络安全模型要点小结
  8. Java 七参数计算
  9. 51nod 1556 计算(默慈金数)
  10. EXCEL中多行多列数据与一行或一列数据的互相转换