hbase简介（大数据技术）

HBase是什么?
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目，是横向扩展的。
HBase是一个数据模型，类似于谷歌的大表设计，可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统（HDFS）提供的容错能力。
它是Hadoop的生态系统，提供对数据的随机实时读/写访问，是Hadoop文件系统的一部分。
人们可以直接或通过HBase的存储HDFS数据。使用HBase在HDFS读取消费/随机访问数据。 HBase在Hadoop的文件系统之上，并提供了读写访问。

HBase 和 HDFS
HDFS HBase
HDFS是适于存储大容量文件的分布式文件系统。 HBase是建立在HDFS之上的数据库。
HDFS不支持快速单独记录查找。 HBase提供在较大的表快速查找
它提供了高延迟批量处理;没有批处理概念。它提供了数十亿条记录低延迟访问单个行记录（随机存取）。
它提供的数据只能顺序访问。 HBase内部使用哈希表和提供随机接入，并且其存储索引，可将在HDFS文件中的数据进行快速查找。
HBase的存储机制
HBase是一个面向列的数据库，在表中它由行排序。表模式定义只能列族，也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格值都具有时间戳。总之，在一个HBase：
• 表是行的集合。
• 行是列族的集合。
• 列族是列的集合。
• 列是键值对的集合。
下面给出的表中是HBase模式的一个例子。
Rowide Column Family Column Family Column Family Column Family
col1 col2 col3 col1 col2 col3 col1 col2 col3 col1 col2 col3
1
2
3
面向列和面向行
面向列的数据库是存储数据表作为数据列的部分，而不是作为行数据。总之它们拥有列族。
行式数据库列式数据库
它适用于联机事务处理（OLTP）。它适用于在线分析处理（OLAP）。
这样的数据库被设计为小数目的行和列。面向列的数据库设计的巨大表。
下图显示了列族在面向列的数据库：

HBase 和 RDBMS
HBase RDBMS
HBase无模式，它不具有固定列模式的概念;仅定义列族。 RDBMS有它的模式，描述表的整体结构的约束。
它专门创建为宽表。 HBase是横向扩展。这些都是细而专为小表。很难形成规模。
没有任何事务存在于HBase。 RDBMS是事务性的。
它反规范化的数据。它具有规范化的数据。
它用于半结构以及结构化数据是非常好的。用于结构化数据非常好。
HBase的特点
• HBase线性可扩展。
• 它具有自动故障支持。
• 它提供了一致的读取和写入。
• 它集成了Hadoop，作为源和目的地。
• 客户端方便的Java API。
• 它提供了跨集群数据复制。
在哪里可以使用HBase？
• Apache HBase曾经是随机，实时的读/写访问大数据。
• 它承载在集群普通硬件的顶端是非常大的表。
• Apache HBase是此前谷歌Bigtable模拟非关系型数据库。 Bigtable对谷歌文件系统操作，同样类似Apache HBase工作在Hadoop HDFS的顶部。
HBase的应用
• 它是用来当有需要写重的应用程序。
• HBase使用于当我们需要提供快速随机访问的数据。
• 很多公司，如Facebook，Twitter，雅虎，和Adobe内部都在使用HBase。
这只是简单的一部分，需要了解更多请继续学习

hbase简介（大数据技术）相关推荐

Flink简介—大数据技术
Flink是什么? Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算. 国内使用Flink的企业,挺多的为什么要用Flink? 流数据更加符合生活中数据的真实 ...
大数据技术之 HBase简介
大数据技术之 HBase 第 1 章 HBase 简介 1.1 HBase 定义 HBase 是一种分布式.可扩展.支持海量数据存储的 NoSQL 数据库. 1.2 HBase 数据模型逻辑上,HB ...
【学习笔记】大数据技术之HBase
大数据技术之HBase 思考? 1. RegionServer和Master的区别? 2. Hbase端口 3. HBase写流程中,为什么要和zk进行交互? 第 1 章 HBase 简介 1.1 H ...
深入HBase、Spark、Alluxio、Greenplum、StreamSQL等大数据技术及其架构设计
2017年6月10-11日,由CSDN主办的SDCC 2017·深圳站大数据技术实战峰会将在深圳举办,峰会秉承干货实料的内容原则,邀请业内顶尖的架构师.大数据总监和PMC共话弹性计算.大数据平台构建. ...
大数据技术之HBase（超级详细）
大数据技术之HBase 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持 ...
大数据技术之HBase （一）
大数据技术之HBase (一) 1.简介 1.1什么是HBase HBase是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储 ...
c# 访问hbase_大数据技术 windows下C#通过Thrift操作HBase
本篇教程探讨了大数据技术 windows下C#通过Thrift操作HBase,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入. < 1.到apache官网下载Thrift源 ...
大数据技术Hbase 和 Hive 详解
目录两者的特点各自的限制应用场景大数据技术Hbase 和 Hive 详解, 今天给大家介绍一下关于零基础学习大数据视频教程之HBASE 和 HIVE 是多么重要的技术,那么两者有什么区别呢 ? ...
c# 访问hbase_大数据技术之C#通过Thrift连接查询HBase主要方法总结
本篇文章探讨了大数据技术之C#通过Thrift连接查询HBase主要方法总结,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入. 1.get(byte[] tableName,byt ...
Spark大数据技术与应用第一章Spark简介与运行原理
Spark大数据技术与应用第一章Spark简介与运行原理 1.Spark是2009年由马泰·扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目,经过开源后捐赠给Aspache软件基金会 ...

hbase简介（大数据技术）

hbase简介（大数据技术）相关推荐

最新文章

热门文章