HBase的基本概念和定位

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

选择合适的HBase版本

官网版本:http://archive.apache.org/dist/hbase/

CDH版本(稳定,推荐):http://archive.cloudera.com/cdh5/

HBase的用途

  1. 海量数据存储
  2. 准实时查询

HBase的应用场景及特点

  1. 交通
  2. 金融
  3. 电商
  4. 移动(电话信息)等

HBase的特点

  1. 容量大

HBase单表可以有上百亿行、百万列,数据矩阵横向和纵向两个维度所支持的数据量级都非常具有弹性。
2. 面向列

HBase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量。

  1. 多版本

HBase每一个列的数据存储有多个Version(version)。

  1. 稀疏性

为空的列并不占用存储空间,表可以设计的非常稀疏。

  1. 扩展性

底层依赖于HDFS

  1. 高可靠性

WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且HBase底层使用HDFS,HDFS本身也有备份。

7.高性能

底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能够达到毫秒级别。


HBase架构体系与设计模型

HBase架构体系

HBase数据模型

  • 一张表的列簇不会超过5个
  • 每个列簇中的列数没有限制

HBase与关系型数据库表结构的对比

HBase 关系型数据库
列动态增加 列动态增加
数据自动切分 数据自动切分
高并发读写 高并发读写
不支持条件查询 复杂查询

Hbase入门(一)相关推荐

  1. 一条数据的HBase之旅,简明HBase入门教程-Write全流程

    如果将上篇内容理解为一个冗长的"铺垫",那么,从本文开始,剧情才开始正式展开.本文基于提供的样例数据,介绍了写数据的接口,RowKey定义,数据在客户端的组装,数据路由,打包分发, ...

  2. 一条数据的HBase之旅,简明HBase入门教程-开篇

    常见的HBase新手问题: 什么样的数据适合用HBase来存储? 既然HBase也是一个数据库,能否用它将现有系统中昂贵的Oracle替换掉? 存放于HBase中的数据记录,为何不直接存放于HDFS之 ...

  3. hadoop hive hbase 入门学习 (二)

    hadoop 自学系列                hadoop hive hbase 入门学习 (一) hadoop安装.hdfs学习及mapreduce学习 hadoop 软件下载 (hadoo ...

  4. 一条数据的HBase之旅,简明HBase入门教程1:开篇

    [摘要] 这是HBase入门系列的第1篇文章,主要介绍HBase当前的项目活跃度以及搜索引擎热度信息,以及一些概况信息,内容基于HBase 2.0 beta2版本.本系列文章既适用于HBase新手,也 ...

  5. 大数据学习之HBase入门笔记

    文章目录 一.HBase简介 1.1.HBase定义 1.2.HBase数据模型 1.2.1.HBase逻辑结构 1.2.2.物理存储结构 1.2.3.数据模型 1.3.HBase基础架构(入门版) ...

  6. 【Hbase】HBase入门教程

    入门好文章研读: <一条数据的HBase之旅,简明HBase入门教程-开篇>:https://blog.csdn.net/nosqlnotes/article/details/796470 ...

  7. HBase入门至进阶以及开发等知识梳理

    HBase入门至进阶以及开发等知识梳理 HBase简介 hadoop简介 Hadoop是一个由Apache基金会所开发的分布式系统基础架构.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分 ...

  8. HBase入门: 简介、特点、优缺点、数据结构、系统架构、入门操作、适用场景、注意事项与遇到的坑

    原文地址 https://www.cnblogs.com/Little-Li/p/7878219.html https://yq.aliyun.com/articles/54410 https://b ...

  9. HBase--分布式非关系型数据库HBase入门精讲(侧重原理)

    分布式非关系型数据库HBase快速入门 一.HBase介绍 1. HBase 数据模型 2.HBase的物理存储结构 3.HBase的基本架构 4.HBase的完整架构 二.Hbase的工作流程 1. ...

  10. HBase入门介绍(从基础到架构)

    本篇博客,小菌为大家带来的是关于HBase的入门介绍! 文章目录 1.HBase 基本介绍 简介 HBase的发展历程 2.HBase与Hadoop的关系 <1>HDFS <2> ...

最新文章

  1. 通过tushare获取贵州茅台和中国平安历史交易数据并使用plotly进行可视化分析
  2. c++ 图片验证码识别_基于tensorflow 实现端到端的OCR:二代身份证号识别
  3. 移动端界面中的版式设计原理
  4. 百度AI原生云实践: 基于容器云打造 AI 开发基础设施
  5. SQL中条件和比较关键字Case的使用方法(case的结果就是得到了一个值)
  6. 从中序与后序遍历序列构造二叉树Python解法
  7. 1000层的Transformer,诞生了!
  8. 有一次面一非常想去的 飞鸽传书绿色版 公司
  9. c语言sizeof(test),解析C语言中的sizeof
  10. sim卡没坏但苹果手机无服务_iPhone手机无服务那些事儿
  11. 换教室(NOIP2016提高组Day1T3)
  12. Rust:mod、crate、super、self、pub use等模块系统用法梳理
  13. 查看MD04结果的程序 Production Planning - Extract data from MRP Table
  14. 应用在AVR上的拼音输入法
  15. 开挂?16岁保送北大、MIT量子计算机博士是这样玩转区块链的!
  16. 银河帝国----基地前奏
  17. C#【EF Core框架】使用乐观锁处理并发冲突
  18. 二叉树-求叶节点个数
  19. 【学习】PCF8563芯片资料和相关功能解析
  20. 离散题目13(判断自反关系)

热门文章

  1. winform 学习笔记
  2. 01 TVM环境编译
  3. 鼠标事件(mouseover和mouseenter)
  4. C++服务器(一):了解Linux下socket编程
  5. 用python画一些有趣的图案(001)
  6. bit,B,KB,MB,GB,TB,PB分别是什么单位,换算是什么
  7. directives
  8. cookie跨域,实现单点登录
  9. Unity游戏快速制作特效
  10. [动态内存分配] Allocaotrs 1/3 : KR