rowkey设计原则

a.唯一原则

一定要保证当前的rowkey是所有数据的唯一一行

b.长度原则

在满足唯一原则的基础上,尽可能的减少rowk的容量大小

如果rowkey有特殊的排序需求的时候,要补齐位数

rowkey理论上支持64k的容量,一般10-100byte比较合理,越短越好

c.散列原则

如果按照keyPrefix原则拆分region,容易产生热点问题,比如手机号段

解决热点问题:

1.加盐

在原rowkey的前面生成n位随机数

2.反转

把原rowkey里的一些随机的内容放在最前面,相当于按随机数进行拆分

比如手机号,可以把最后四位放在号段的前面,不增加长度,还散列了

3.预分区

rowKey设计原则相关推荐

  1. Hadoop生态圈-Hbase的rowKey设计原则

    Hadoop生态圈-Hbase的rowKey设计原则 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 转载于:https://www.cnblogs.com/yinzhengjie/ ...

  2. Hbase rowkey设计原则,热点问题

    rowKey的作用 读写数据时通过 RowKey 找到对应的 Region: MemStore 中的数据按 RowKey 字典顺序排序: HFile 中的数据按 RowKey 字典顺序排序. rowk ...

  3. hbase的rowkey设计原则及热点问题

    1.1 hbase数据库介绍 1.简介 hbase是基于Google BigTable模型开发的,典型的key/value系统.是建立在hdfs之上,提供高可靠性.高性能.列存储.可伸缩.实时读写no ...

  4. Hbase Rowkey设计原则

    Hbase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这三个维度可以对HBase中的数据进行快速定位 ...

  5. hbase 预分区_hbase的rowKey设计原则

    前言 访问hbase table中的行,只有三种方式: 1 通过单个row key访问 2 通过row key的range 3 全表扫描 可以看出rowkey设计的好与坏直接决定了查询速度,在hbas ...

  6. HBase的RowKey设计原则含案例(全)

    前言 HBase的RowKey的行由行键按字典顺序排序,这样的设计优化了扫描,允许存储相关的行或者那些将被一起读的邻近的行.然而,设计不好的行键是导致 hotspotting 的常见原因.当大量的客户 ...

  7. 最通俗易懂的解释hbase热点问题rowkey设计原则region分区及解决方案

    关于热点问题,我简单陈述容易理解: 我们最开始hbase创建表默认是一个region,而我们所谓的热点问题其实就是对某一个region的过量访问造成的 Hbase当发现一个region存储数据量大于阈 ...

  8. HBase的rowkey设计原则、HBase避免热点 11

    1. 唯一性原则 每条数据的rowkey必须唯一,不重复 2. 长度原则 rowkey尽量越短越好,一般不要超过16字节 原因 数据的持久化文件HFlie中是按照KeyValue存储的,如果rowke ...

  9. Habse中Rowkey的设计原则——通俗易懂篇

    Hbase的Rowkey设计原则 一. Hbase介绍 HBase -> Hadoop Database,HBase是Apache的Hadoop项目的子项目.HBase不同于一般的关系数据库,它 ...

最新文章

  1. java 泛型 .net_Java基础11:Java泛型详解
  2. js通过正则表达式解析xml 获取指定的内容
  3. HashMap 和 HashTable 到底哪不同 ?
  4. LINQ系列:Linq to Object排序操作符
  5. 老板让我用少量样本 finetune 模型,我还有救吗?急急急,在线等!
  6. 读《纸本书变电子书是很小的事》有感
  7. centos7下载elasticsearch7版本(超详细)
  8. ajax请求整理(一) 2021.05.12
  9. 属于哪个单元_1~6年级上册数学第一单元知识整理
  10. 硬核 App,这项新功能一定要打开,关键时刻能救命!!
  11. 20200530每日一句
  12. 我的VSTO之路(四):深入介绍Word开发
  13. .xz是什么文件怎么解压_如何解压缩 tar.xz 文件
  14. 中国大学MOOC C语言程序设计(大连理工大学) 课后编程题 第九周题解(个人向仅供参考)
  15. jQuery DOM元素的遍历
  16. dga (Domain Generation Algorithm) 域名 生成算法 简介
  17. 微软桌面android,微软推 Android launcher 桌面 App, 电脑同步手机更方便!
  18. ControlNet
  19. win7 安装双系统centos7
  20. DLT求解PnP问题

热门文章

  1. Numpy中的.mean()和mean的区别
  2. 信号量解决进程的同步和互斥
  3. SIwave仿真手册——信号完整性仿真之S参数的提取(二)
  4. Rust开发环境搭建(Linux)
  5. 黑群晖安装qbittorrent记录
  6. Informix IDS 11琐屑解决(918测验)认证指南,第 7 部分: IDS复制(4)
  7. 信号的调制与解调matlab仿真,基于MATLAB对信号调制与解调的仿真
  8. Docker精通:微服务
  9. linux下使用如何使用多个CPU核
  10. 百度ssp php源码,百度联盟SSP媒体广告异步加载代码最优解决方案