官网:http://hbase.apache.org/

一:HBase的介绍

HBase认识
Hadoop database, a distributed, scalable, big data store
need random, realtime read/write
very large tables – billions of rows X millions of columns

HBase特性:
Strictly consistent reads and writes 严格一致性读写
Automatic and configurable 自动的可配置的
Automatic failover 自动容错
Easy to use Java API java和api访问
Block cache and Bloom Filters
Query predicate push down
Thrift gateway and a REST-ful

二:Hbase的优缺点

1 列的可以动态增加,并且列为空就不存储数据,节省存储空间.

2 Hbase自动切分数据,使得数据存储自动具有水平scalability.

3 Hbase可以提供高并发读写操作的支持

4 对海量数据高效存储和访问

5 高可扩展性和高可用性,线性扩展

6 表的格式不是固定的,通过键值对存储,减少时间空间开销

7 随机读写

8 当行数小于10000的时候,开销和行数成正比。但是超过50000行时,无论是顺序还是随机的插入操作,性能都会逐渐变好

Hbase的缺点:

1 不能支持条件查询,只支持按照Row key来查询.

2 暂时不能支持Master server的故障切换,当Master宕机后,整个存储系统就会挂掉.

3 没有表与表之间的关联查询

HBase vs RDBMS:

列式存储方式
缺少SQL
分布式:可扩展性
KV存储
支持的列多
表之间耦合性低(解耦)
支持大数据量
事物
存在冗余
查询性能高
数据类型(Bytes)
null不存储
二级索引不支持
trigger不支持

三:HBase内部配置

官网:http://hbase.apache.org/book.html#faq
HBase shell:
help
create…

HBase Conf[相关参数]:
zk
retry
timeout
balancer
flush
hfile size
ulimit
compact/split
grant

HBase基本术语:
Table -> N * rows
row: rowkey(rk):[一行数据的唯一标识]
column family(cf):[一行数据同属一个cf, table-> N * cf, cf-> N * col, 多行数据可以有不同col]
cell:[rk, cf:col, version]
timestamp: [ts肯定在version数据内的 ts <= count(vesion)]
eg: row => row1 column=f1:a, timestamp=1550349258503, value=value1, version

四HBase架构:

官网:https://mapr.com/blog/in-depth-look-hbase-architecture/

Welcome to Apache HBase 介绍一相关推荐

  1. Apache HBase 快照(Snapshots) 介绍

    Apache HBase 快照(Snapshots) 介绍 本文将介绍 HBase 快照功能,因为 HBase 的底层存储是基于 HDFS 的,所以 HBase 的快照功能也是依赖 HDFS 快照的知 ...

  2. Apache HBase快照介绍

    转自 http://www.importnew.com/4966.html CDH是Cloudera的完全开源分布式Apache Hadoop及相关项目(包括Apache HBase).CDH的当前版 ...

  3. apache karaf_Apache Karaf遇到Apache HBase

    apache karaf 介绍 Apache HBase是一个以Google Bigtable为蓝本的开源,分布式,版本化,面向列的商店. 如果您是普通读者,那么您可能已经知道Apache Karaf ...

  4. Apache Karaf遇到Apache HBase

    介绍 Apache HBase是模仿Google Bigtable的开源,分布式,版本化,面向列的商店. 如果您是普通读者,那么您可能已经知道Apache Karaf是什么,但是对于那些不是的读者:A ...

  5. Apache HBase【从无到有从有到无】【AH8】RegionServer调整大小的经验法则

    目录 RegionServer调整大小的经验法则 1.关于列族的数量 1.1.ColumnFamilies的基数 2.Rowkey设计 2.1.热点发现(Hotspotting) 2.2.单调增加行键 ...

  6. Apache HBase MTTR 优化实践:减少恢复时长

    摘要:HBase是Hadoop Database的简称,是建立在Hadoop文件系统之上的分布式面向列的数据库,它具有高可靠.高性能.面向列和可伸缩的特性,提供快速随机访问海量数据能力. 本文分享自华 ...

  7. 【转】Apache Doris介绍

    转:Apache Doris介绍_wapecheng的博客-CSDN博客_apache doris 一.关于 Apache Doris 和 DorisDB.StarRocks 的关系 Doris 最早 ...

  8. HBase介绍、搭建、环境、安装部署

    1.搭建环境 部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放Hadoop等组件运行包.因为该目录用于安装hado ...

  9. 移动云使用 JuiceFS 支持 Apache HBase 增效降本的探索

    作者简介: 陈海峰,移动云数据库 Apache HBase 开发人员,对 Apache HBase.RBF.Apache Spark 有浓厚兴趣. 背景 Apache HBase 是 Apache H ...

最新文章

  1. 4,fail-fast错误机制
  2. $(window).load(function() {})和$(document).ready(function(){})的区别
  3. IAR中断定义#pragma vector = P0INT_VECTOR __interrupt void P0_ISR(void)啥意思?
  4. 熊猫分发_实用熊猫指南
  5. linux网络编程(二)高并发服务器
  6. matlab pca和逆pca函数,matlab_PCA,训练集与测试集分开,原理和用法
  7. 收藏 | 程序员必须掌握哪些算法?
  8. Python字典(dict)与列表(list)与数组(nbarray)详解
  9. UIKit框架类层次图
  10. mysql56 配置内存_【mysql】mysql 内存配置调优
  11. 基于Python/PYQT5的动物识别专家系统(人工智能实验)
  12. 勒索病毒 -- “永恒之蓝”NSA 武器免疫工具
  13. 网易MuMu模拟器 更改模拟器大小(iphone5为例)
  14. ESET NOD32 互联网安全软件和防毒软件 -简单,可靠的防护。
  15. 计算机三种校验方式,三种校验码
  16. 解压报错 你需要从上一压缩卷启动解压命令以便解压 解决方案及WinRAR怎么分卷压缩详解
  17. 许路平:Gvoice千万在语音输入的那些事
  18. 2020计算机考研复试
  19. 如何修炼java内功
  20. 大数据「偏见」会让我们变蠢吗

热门文章

  1. [导入]Mobile Media API概述
  2. 沟通CTBS V5.0发布, 南北通及安全性成最大亮点
  3. JavaScript中的六种错误类型
  4. Linux命令解释之awk
  5. 如何在linux上压缩文件夹,如何在Linux中使用命令压缩文件和文件夹
  6. Android中使用HttpURLConnection实现GET POST JSON数据与下载图片
  7. sv_labs学习笔记——sv_lab5_上(System Verilog)
  8. EDA实验课课程笔记(六)——NC-verilog的介绍与使用(二)
  9. linux7ip路由,Centos7源地址访问路由(双IP双网关配置)
  10. ERROR 1064 (42000): You have an error in your SQL syntax