Hadoop 生态圈 ————Hbase数据库
HBase是一个分布式的,面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文”Bigtable:一个结构化数据的分布式存储系统“。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列而不是基于行模式。在需要实时读写、随机访问超大规模数据集时,可以使用HBase。
上图描述Hadoop Ecosystem中的各层结构。其中,HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持。Hadoop MapReduce为HBase提供了高性能的计算能力,ZooKeeper为HBase提供了稳定服务和故障切换(failover)机制。此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。
HBase架构图
HBase Master负责管理所有的HRegion,HBase Master并不存储HBase服务器的任何数据,HBase逻辑上的表可能会划分为多个HRegion,然后存储在HRegion Server群中,HBase Master Server中存储的是从数据到HRegion Server的映射。
一台机器只能运行一个HRegion服务器,数据的操作会记录在Hlog中,在读取数据时候,HRegion会先访问缓存,如果缓存中没有数据才回到Hstore中上找,每一个列都会有一个Hstore集合,每个Hstore集合包含了很多具体的HstoreFile文件,这些文件是B树结构的,方便快速读取。
郑州新思齐科技有限公司
王亚辉
Hadoop 生态圈 ————Hbase数据库相关推荐
- Hadoop生态圈-Hbase的rowKey设计原则
Hadoop生态圈-Hbase的rowKey设计原则 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 转载于:https://www.cnblogs.com/yinzhengjie/ ...
- Hadoop生态圈-Hbase的API常见操作
Hadoop生态圈-Hbase的API常见操作 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.
- Hadoop生态圈以及各组成部分的简介
1.Hadoop是什么? 适合大数据的分布式存储与计算平台 HDFS: Hadoop Distributed File System分布式文件系统 MapReduce:并行计算框架 2.Hadoop生 ...
- Hadoop生态圈一览
根据Hadoop官网的相关介绍和实际使用中的软件集,将Hadoop生态圈的主要软件工具简单介绍下,拓展对整个Hadoop生态圈的了解. 这是Hadoop生态从Google的三篇论文开始的发展历程,现已 ...
- Hadoop专业解决方案-第1章 大数据和Hadoop生态圈
一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章 大数据和Hadoop生态圈小组已经翻译完成,在此 ...
- Hadoop生态圈:19个让大象飞起来的工具!
https://zhuanlan.zhihu.com/p/22366610 Hadoop生态圈:19个让大象飞起来的工具! 大圣圈 更多知识分享请关注公众号:大圣圈(spesedu) 12 人赞了该文 ...
- 盘点Hadoop生态圈:13个让大象飞起来的开源工具
借助Google的三大论文,Hadoop打开了低成本海量数据处理之门:同时,借助了开源运动,Hadoop生态圈得以迅速成熟,也催生了处理各种业务及数据的工具,这里带大家回顾2013年让大象飞起来的13 ...
- 小白也能懂的hadoop生态圈,很黄很暴力!
转自Xiaoyu Ma 链接:请戳这里! 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了 ...
- 大数据运维实战第一课 大话 Hadoop 生态圈
你好,欢迎来到<大数据运维实战>专栏. 入行以来,我从事大数据运维也有十多年了,期间我做过系统运维.DBA,也做过大数据分析师,最后选择了大数据运维方向,曾设计并管理超过千台.PB 级的数 ...
最新文章
- 从R中安装phylotaR包
- Python-字符串格式化
- 基于chrome内核的.NET开发资源
- 旧计算机 云桌面,该不该利用旧PC机改造成云桌面虚拟化模式呢?
- 《Android 应用案例开发大全(第二版)》——导读
- 数据结构八-Trie树
- Spring框架(下)JdbcTemplate、声明式事务管理
- word修订模式怎么彻底关闭_标书制作靠它准没错!那些你不知道的Word技巧大全...
- Python: names, values, assignment and mutability
- 脚本文件不变色_LoadRunner脚本开发
- fast rcnn和faster rcnn
- java digester_xml和java对象的解决:Digester | 学步园
- 图形学基础|环境光遮蔽(Ambient Occlusion)
- win7显示安装程序正在启动服务器失败,Win7安装程序正在启动服务怎么办?
- Flutter Connection to **** was not upgraded to websocket
- Android UI + Function
- win10 安装“msi”文件提示 “Windows Installer无法打开此安装程序包。请确认该程序包存在,并且你有权访问它,或者与应用程序供应商联” error 2502 2503
- 第一天 :二分查找+移除元素
- 51nod 矩阵快速幂模版题
- 715. Range Module
热门文章
- stm32f072的spi的设置注意事项。
- 从python开始学编程pdf-Python真好玩:教孩子学编程 PDF 完整原版
- <Java开发环境配置>6-SQLyog安装教程
- js Proxy 从入门到废掉的整个过程
- python函数名是变量_Python 变量做函数名的简单示例
- How to enable AHCI on Windows7
- 基于Qt大恒工业相机二次开发demo-C++
- inode节点介绍及查看和删除
- 【交换篇】06. 升级固件 ❀ C3750-E ❀ CISCO 交换机
- 为什么 think-cell 图表中的标签显示为白色矩形?