hbase简介(大数据技术)
HBase是什么?
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。
HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。
它是Hadoop的生态系统,提供对数据的随机实时读/写访问,是Hadoop文件系统的一部分。
人们可以直接或通过HBase的存储HDFS数据。使用HBase在HDFS读取消费/随机访问数据。 HBase在Hadoop的文件系统之上,并提供了读写访问。
HBase 和 HDFS
HDFS HBase
HDFS是适于存储大容量文件的分布式文件系统。 HBase是建立在HDFS之上的数据库。
HDFS不支持快速单独记录查找。 HBase提供在较大的表快速查找
它提供了高延迟批量处理;没有批处理概念。 它提供了数十亿条记录低延迟访问单个行记录(随机存取)。
它提供的数据只能顺序访问。 HBase内部使用哈希表和提供随机接入,并且其存储索引,可将在HDFS文件中的数据进行快速查找。
HBase的存储机制
HBase是一个面向列的数据库,在表中它由行排序。表模式定义只能列族,也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格值都具有时间戳。总之,在一个HBase:
• 表是行的集合。
• 行是列族的集合。
• 列族是列的集合。
• 列是键值对的集合。
下面给出的表中是HBase模式的一个例子。
Rowide Column Family Column Family Column Family Column Family
col1 col2 col3 col1 col2 col3 col1 col2 col3 col1 col2 col3
1
2
3
面向列和面向行
面向列的数据库是存储数据表作为数据列的部分,而不是作为行数据。总之它们拥有列族。
行式数据库 列式数据库
它适用于联机事务处理(OLTP)。 它适用于在线分析处理(OLAP)。
这样的数据库被设计为小数目的行和列。 面向列的数据库设计的巨大表。
下图显示了列族在面向列的数据库:
HBase 和 RDBMS
HBase RDBMS
HBase无模式,它不具有固定列模式的概念;仅定义列族。 RDBMS有它的模式,描述表的整体结构的约束。
它专门创建为宽表。 HBase是横向扩展。 这些都是细而专为小表。很难形成规模。
没有任何事务存在于HBase。 RDBMS是事务性的。
它反规范化的数据。 它具有规范化的数据。
它用于半结构以及结构化数据是非常好的。 用于结构化数据非常好。
HBase的特点
• HBase线性可扩展。
• 它具有自动故障支持。
• 它提供了一致的读取和写入。
• 它集成了Hadoop,作为源和目的地。
• 客户端方便的Java API。
• 它提供了跨集群数据复制。
在哪里可以使用HBase?
• Apache HBase曾经是随机,实时的读/写访问大数据。
• 它承载在集群普通硬件的顶端是非常大的表。
• Apache HBase是此前谷歌Bigtable模拟非关系型数据库。 Bigtable对谷歌文件系统操作,同样类似Apache HBase工作在Hadoop HDFS的顶部。
HBase的应用
• 它是用来当有需要写重的应用程序。
• HBase使用于当我们需要提供快速随机访问的数据。
• 很多公司,如Facebook,Twitter,雅虎,和Adobe内部都在使用HBase。
这只是简单的一部分,需要了解更多请继续学习
hbase简介(大数据技术)相关推荐
- Flink简介—大数据技术
Flink是什么? Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算. 国内使用Flink的企业,挺多的 为什么要用Flink? 流数据更加符合生活中数据的真实 ...
- 大数据技术之 HBase简介
大数据技术之 HBase 第 1 章 HBase 简介 1.1 HBase 定义 HBase 是一种分布式.可扩展.支持海量数据存储的 NoSQL 数据库. 1.2 HBase 数据模型 逻辑上,HB ...
- 【学习笔记】大数据技术之HBase
大数据技术之HBase 思考? 1. RegionServer和Master的区别? 2. Hbase端口 3. HBase写流程中,为什么要和zk进行交互? 第 1 章 HBase 简介 1.1 H ...
- 深入HBase、Spark、Alluxio、Greenplum、StreamSQL等大数据技术及其架构设计
2017年6月10-11日,由CSDN主办的SDCC 2017·深圳站大数据技术实战峰会将在深圳举办,峰会秉承干货实料的内容原则,邀请业内顶尖的架构师.大数据总监和PMC共话弹性计算.大数据平台构建. ...
- 大数据技术之HBase(超级详细)
大数据技术之HBase 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持 ...
- 大数据技术之HBase (一)
大数据技术之HBase (一) 1.简介 1.1什么是HBase HBase是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储 ...
- c# 访问hbase_大数据技术 windows下C#通过Thrift操作HBase
本篇教程探讨了大数据技术 windows下C#通过Thrift操作HBase,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入. < 1.到apache官网下载Thrift源 ...
- 大数据技术Hbase 和 Hive 详解
目录 两者的特点 各自的限制 应用场景 大数据技术Hbase 和 Hive 详解, 今天给大家介绍一下关于零基础学习大数据视频教程之HBASE 和 HIVE 是多么重要的技术,那么两者有什么区别呢 ? ...
- c# 访问hbase_大数据技术之C#通过Thrift连接查询HBase主要方法总结
本篇文章探讨了大数据技术之C#通过Thrift连接查询HBase主要方法总结,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入. 1.get(byte[] tableName,byt ...
- Spark大数据技术与应用 第一章Spark简介与运行原理
Spark大数据技术与应用 第一章Spark简介与运行原理 1.Spark是2009年由马泰·扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目,经过开源后捐赠给Aspache软件基金会 ...
最新文章
- strict aliasing
- mpls 保留标签值_MPLS 标签模式/分发行为/保留模式/标签空间
- Oracle数据库迁移
- Java程序编译运行过程
- c++数据结构队列栈尸体_数据结构-第三章:栈和队列(栈的应用、括号匹配、表达式转换)...
- Azure Services Platform
- 训练日志 2019.4.13
- 【算法学习】堆排序(Heap Sorting)
- HTTP1.0 HTTP1.1 HTTP2.0总结
- 一次性解决导航栏的所有问题
- oh my Zsh使用手册
- idea安装eclipse风格主题
- 云南智慧医院一卡通建设解决方案,昆明数字化医疗办公、就诊、用餐、停车一卡通用
- 测量员软件测试版,测量员app
- loj6198 谢特
- html图片隐藏文字,怎样用CSS隐藏图片背景的文字内容
- 【每日新闻】诺基亚展示未来工厂:5G自动化机器人与人类和谐共处
- tickeys 1.1.0 中文版 (键盘打字音效模拟)
- python语言中、复数类型中实数部分_python学习03.02:Python数值类型(整形、浮点型和复数)及其用法...
- Vue 2.7 正式发布,代号为 Naruto
热门文章
- win7 'IIS APPPOOL\Classic .NET AppPool' 登录失败
- python增删改查csv文件_Python--作业2--对员工信息文件,实现增删改查操作
- 计算机如何查找目标,如何使用命令行查找计算机地理位置? | MOS86
- 使用pycharm配置flask项目,并使用git进行版本控制
- vue Method 事件
- 我的AutoHotkey配置
- 简单的封装axios 不包含状态码和提示
- Linux 系统如何查看硬盘UUID与修改
- react学习(28)---react挂载图
- [html] 在head标签中必不少的是什么?