HBase是什么?
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。
HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。
它是Hadoop的生态系统,提供对数据的随机实时读/写访问,是Hadoop文件系统的一部分。
人们可以直接或通过HBase的存储HDFS数据。使用HBase在HDFS读取消费/随机访问数据。 HBase在Hadoop的文件系统之上,并提供了读写访问。

HBase 和 HDFS
HDFS HBase
HDFS是适于存储大容量文件的分布式文件系统。 HBase是建立在HDFS之上的数据库。
HDFS不支持快速单独记录查找。 HBase提供在较大的表快速查找
它提供了高延迟批量处理;没有批处理概念。 它提供了数十亿条记录低延迟访问单个行记录(随机存取)。
它提供的数据只能顺序访问。 HBase内部使用哈希表和提供随机接入,并且其存储索引,可将在HDFS文件中的数据进行快速查找。
HBase的存储机制
HBase是一个面向列的数据库,在表中它由行排序。表模式定义只能列族,也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格值都具有时间戳。总之,在一个HBase:
• 表是行的集合。
• 行是列族的集合。
• 列族是列的集合。
• 列是键值对的集合。
下面给出的表中是HBase模式的一个例子。
Rowide Column Family Column Family Column Family Column Family
col1 col2 col3 col1 col2 col3 col1 col2 col3 col1 col2 col3
1
2
3
面向列和面向行
面向列的数据库是存储数据表作为数据列的部分,而不是作为行数据。总之它们拥有列族。
行式数据库 列式数据库
它适用于联机事务处理(OLTP)。 它适用于在线分析处理(OLAP)。
这样的数据库被设计为小数目的行和列。 面向列的数据库设计的巨大表。
下图显示了列族在面向列的数据库:

HBase 和 RDBMS
HBase RDBMS
HBase无模式,它不具有固定列模式的概念;仅定义列族。 RDBMS有它的模式,描述表的整体结构的约束。
它专门创建为宽表。 HBase是横向扩展。 这些都是细而专为小表。很难形成规模。
没有任何事务存在于HBase。 RDBMS是事务性的。
它反规范化的数据。 它具有规范化的数据。
它用于半结构以及结构化数据是非常好的。 用于结构化数据非常好。
HBase的特点
• HBase线性可扩展。
• 它具有自动故障支持。
• 它提供了一致的读取和写入。
• 它集成了Hadoop,作为源和目的地。
• 客户端方便的Java API。
• 它提供了跨集群数据复制。
在哪里可以使用HBase?
• Apache HBase曾经是随机,实时的读/写访问大数据。
• 它承载在集群普通硬件的顶端是非常大的表。
• Apache HBase是此前谷歌Bigtable模拟非关系型数据库。 Bigtable对谷歌文件系统操作,同样类似Apache HBase工作在Hadoop HDFS的顶部。
HBase的应用
• 它是用来当有需要写重的应用程序。
• HBase使用于当我们需要提供快速随机访问的数据。
• 很多公司,如Facebook,Twitter,雅虎,和Adobe内部都在使用HBase。
这只是简单的一部分,需要了解更多请继续学习

hbase简介(大数据技术)相关推荐

  1. Flink简介—大数据技术

    Flink是什么? Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算. 国内使用Flink的企业,挺多的 为什么要用Flink? 流数据更加符合生活中数据的真实 ...

  2. 大数据技术之 HBase简介

    大数据技术之 HBase 第 1 章 HBase 简介 1.1 HBase 定义 HBase 是一种分布式.可扩展.支持海量数据存储的 NoSQL 数据库. 1.2 HBase 数据模型 逻辑上,HB ...

  3. 【学习笔记】大数据技术之HBase

    大数据技术之HBase 思考? 1. RegionServer和Master的区别? 2. Hbase端口 3. HBase写流程中,为什么要和zk进行交互? 第 1 章 HBase 简介 1.1 H ...

  4. 深入HBase、Spark、Alluxio、Greenplum、StreamSQL等大数据技术及其架构设计

    2017年6月10-11日,由CSDN主办的SDCC 2017·深圳站大数据技术实战峰会将在深圳举办,峰会秉承干货实料的内容原则,邀请业内顶尖的架构师.大数据总监和PMC共话弹性计算.大数据平台构建. ...

  5. 大数据技术之HBase(超级详细)

    大数据技术之HBase 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持 ...

  6. 大数据技术之HBase (一)

    大数据技术之HBase (一) 1.简介 1.1什么是HBase HBase是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储 ...

  7. c# 访问hbase_大数据技术 windows下C#通过Thrift操作HBase

    本篇教程探讨了大数据技术 windows下C#通过Thrift操作HBase,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入. < 1.到apache官网下载Thrift源 ...

  8. 大数据技术Hbase 和 Hive 详解

    目录 两者的特点 各自的限制 应用场景 大数据技术Hbase 和 Hive 详解, 今天给大家介绍一下关于零基础学习大数据视频教程之HBASE 和 HIVE 是多么重要的技术,那么两者有什么区别呢 ? ...

  9. c# 访问hbase_大数据技术之C#通过Thrift连接查询HBase主要方法总结

    本篇文章探讨了大数据技术之C#通过Thrift连接查询HBase主要方法总结,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入. 1.get(byte[] tableName,byt ...

  10. Spark大数据技术与应用 第一章Spark简介与运行原理

    Spark大数据技术与应用 第一章Spark简介与运行原理 1.Spark是2009年由马泰·扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目,经过开源后捐赠给Aspache软件基金会 ...

最新文章

  1. strict aliasing
  2. mpls 保留标签值_MPLS 标签模式/分发行为/保留模式/标签空间
  3. Oracle数据库迁移
  4. Java程序编译运行过程
  5. c++数据结构队列栈尸体_数据结构-第三章:栈和队列(栈的应用、括号匹配、表达式转换)...
  6. Azure Services Platform
  7. 训练日志 2019.4.13
  8. 【算法学习】堆排序(Heap Sorting)
  9. HTTP1.0 HTTP1.1 HTTP2.0总结
  10. 一次性解决导航栏的所有问题
  11. oh my Zsh使用手册
  12. idea安装eclipse风格主题
  13. 云南智慧医院一卡通建设解决方案,昆明数字化医疗办公、就诊、用餐、停车一卡通用
  14. 测量员软件测试版,测量员app
  15. loj6198 谢特
  16. html图片隐藏文字,怎样用CSS隐藏图片背景的文字内容
  17. 【每日新闻】诺基亚展示未来工厂:5G自动化机器人与人类和谐共处
  18. tickeys 1.1.0 中文版 (键盘打字音效模拟)
  19. python语言中、复数类型中实数部分_python学习03.02:Python数值类型(整形、浮点型和复数)及其用法...
  20. Vue 2.7 正式发布,代号为 Naruto

热门文章

  1. win7 'IIS APPPOOL\Classic .NET AppPool' 登录失败
  2. python增删改查csv文件_Python--作业2--对员工信息文件,实现增删改查操作
  3. 计算机如何查找目标,如何使用命令行查找计算机地理位置? | MOS86
  4. 使用pycharm配置flask项目,并使用git进行版本控制
  5. vue Method 事件
  6. 我的AutoHotkey配置
  7. 简单的封装axios 不包含状态码和提示
  8. Linux 系统如何查看硬盘UUID与修改
  9. react学习(28)---react挂载图
  10. [html] 在head标签中必不少的是什么?