大数据技术之 HBase
第 1 章 HBase 简介

1.1 HBase 定义
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL 数据库。
1.2 HBase 数据模型
逻辑上,HBase 的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。
但从 HBase 的底层物理存储结构(K-V)来看,HBase 更像是一个 multi-dimensional map。

1.2.1 HBase 逻辑结构

1.2.2 HBase 物理存储结构


1.2.3 数据模型

1)Name Space
命名空间,类似于关系型数据库的 DatabBase 概念,每个命名空间下有多个表。HBase
有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default 表是用户默认使用的命名空间。
2)Region
类似于关系型数据库的表概念。不同的是,HBase 定义表时只需要声明列族即可,不需要声明具体的列。这意味着,往 HBase 写入数据时,字段可以动态、按需指定。因此,和关
系型数据库相比,HBase 能够轻松应对字段变更的场景。
3)Row
HBase 表中的每行数据都由一个 RowKey 和多个 Column(列)组成,数据是按照 RowKey
的字典顺序存储的,并且查询数据时只能根据 RowKey 进行检索,所以 RowKey 的设计十分重要。
4)Column
HBase 中的每个列都由 Column Family(列族)和 Column Qualifier(列限定符)进行限定,例如 info:name,info:age。建表时,只需指明列族,而列限定符无需预先定义。
5)Time Stamp
用于标识数据的不同版本(version),每条数据写入时,如果不指定时间戳,系统会自动为其加上该字段,其值为写入 HBase 的时间。
6)Cell
由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数据是没有类型的,全部是字节码形式存贮。

1.3 HBase 基本架构

架构角色:
1)Region Server

Region Server 为 Region 的管理者,其实现类为 HRegionServer,主要作用如下:
对于数据的操作:get, put, delete;
对于 Region 的操作:splitRegion、compactRegion。

2)Master
Master 是所有 Region Server 的管理者,其实现类为 HMaster,主要作用如下:
对于表的操作:create, delete, alter
对于 RegionServer的操作:分配 regions到每个RegionServer,监控每个 RegionServer的状态,负载均衡和故障转移。

3)Zookeeper
HBase 通过 Zookeeper 来做 Master 的高可用、RegionServer 的监控、元数据的入口以及集群配置的维护等工作。

4)HDFS
HDFS 为 HBase 提供最终的底层数据存储服务,同时为 HBase 提供高可用的支持。

大数据技术之 HBase简介相关推荐

  1. 【笔记】大数据技术之HBase简介与应用(四)

    HBase简介 是BigTable开源实现 网页索引:爬虫-> BigTable运行MapReduce HBase 是谷歌的GFS的开源实现 面向列,分布式数据库 底层对应关系 BigTable ...

  2. 大数据技术之Hbase简介以及底层原理详解

    简介 概述 HBase是有Apache提供的基于Hadoop的分布式,可扩展的非关系型数据库 HBase可以管理很大的数据的表 - billions of rows X millions of col ...

  3. 【学习笔记】大数据技术之HBase

    大数据技术之HBase 思考? 1. RegionServer和Master的区别? 2. Hbase端口 3. HBase写流程中,为什么要和zk进行交互? 第 1 章 HBase 简介 1.1 H ...

  4. 大数据技术之HBase(超级详细)

    大数据技术之HBase 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持 ...

  5. 大数据技术之HBase (一)

    大数据技术之HBase (一) 1.简介 1.1什么是HBase HBase是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储 ...

  6. 大数据技术之 HBase安装配置

    大数据技术之 HBase安装 1.hbase依赖于hadoop以及zookeeper,所以 1.1 首先myhadoop.sh start 1.2 然后zk.sh start 接下来安装hbase 1 ...

  7. 大数据技术之HBase(一)HBase简介、HBase快速入门、HBase进阶

    文章目录 1 HBase 简介 1.1 HBase 定义 1.2 HBase 数据模型 1.2.1 HBase 逻辑结构 1.2.2 HBase 物理存储结构 1.2.3 数据模型 1.3 HBase ...

  8. 大数据技术之HBase(二)HBase原理简介

    一.HBase定义 1.1 HBase定义 HBase 是一种分布式.可扩展.支持海量数据存储的 NoSQL 数据库非结构化数据存储的数据库,基于列的模式存储.利用Hadoop HDFS作为其文件存储 ...

  9. 大数据技术之HBase原理与实战归纳分享-下

    文章目录 整合Phoenix 定义 为何要使用 安装 SHELL操作 表的映射 简易JDBC示例 二级索引 二级索引配置文件 全局索引 包含索引 本地索引(local index) HBase与 Hi ...

最新文章

  1. 理解__repr__
  2. Day 25: 联合Tornado、MongoDB 和 AngularJS 进行应用开发
  3. nginx怎么轮询两台php,Nginx 配置轮询分流-实现负载均衡【测试通过】
  4. nodejs在Liunx上的部署生产方式-PM2
  5. 信息学奥赛C++语言:幸运奶牛
  6. 2017年国内开源镜像站点汇总
  7. HBase架构设计及原理分析
  8. shell 监控判断进程是否存在,如果不存在就重新启动脚本。
  9. PHP购物网站(含购物车、全部源码、数据库设计表及其源码)
  10. 计算机专业对于英语水平的要求,英语对计算机专业的重要性及如何提高英语水平...
  11. Spring Cloud原理分析系列#Gateway#GlobalFilter vs GatewayFilter vs WebFilter
  12. 一个线程OOM,进程里其他线程还能运行么
  13. 使用GCC和Makefile编译c文件
  14. codewars练习(javascript)-2021/2/17
  15. 微信二维码扫一扫打开手机外部浏览器打开指定HTML网页
  16. [附源码]java毕业设计逸尘房屋销售管理系统
  17. python白_Python小白到底有多白?
  18. 十年饮冰鸿蒙将至,咕哒:十年饮冰难凉热血 十年头牌阿联可称忠烈
  19. CentOS 7.5 安装Tomcat教程
  20. epoch mysql_PostgreSQL中epoch的用法

热门文章

  1. NHANES数据库的介绍及使用(一)
  2. 关于RGB的学习,浅色RGB范围……
  3. 大学计算机基础知识素材PPT,大学计算机基础操作练习题「附答案」
  4. PanDownload又复活了!抓紧保存...
  5. mysql报错-ERROR 1206 (HY000)- The total number of locks exceeds the lock table size-的解决方法
  6. sanic入门(一)
  7. grafanaprometheus 快速配置报警规则及报警接收
  8. 叙述计算机的主要应用领域并各举实例说明,《大学计算机基础》习题集.DOC
  9. vue使用videojs播放mu38
  10. Media Encoder CC 2017安装使用攻略