2019独角兽企业重金招聘Python工程师标准>>>

一、手动分割

  • 为了避免拆分/合并风暴,关闭region自动拆分、合并,手动调用split和major_compact命令。

1  设置hbase.hregion.max.filesize为一个很大的值,如,100G

2 使用API或shell实现手动分割 、

二、热点问题

  • 缓解region热点问题

    手动将热点region分割成一个或多个region,然后将子region负载分布到多个region服务器上。

  • 什么是表热点?

    对于拥有多个region的表来说,大多数的region分布并不均匀,即大多数region在同一个服务器上。

  • 解决表热点问题?

    方法1: 使用HBase shell 或 HBaseAdmin类中的API,通过move()函数显示的移动region到另外一台服务器上。

    方法2: 使用unassign()方法或者shell命令简单地从当前服务器移除受影响表的region,master会立即将其部署到其他

    region服务器上。

三、预分配

1 建表时预分配:使用HexStringSplit

create 'poidb', { NAME => 'info', COMPRESSION => 'snappy' },  {NUMREGIONS => 9, SPLITALGO      => 'HexStringSplit'}

2 建表时预分配:指定startkey endkey

create 'testtable', 'colfam1', { SPLITS => [ 'row-100', 'row-200','row-300', 'row-400' ] }

3 查看60010 端口,hmaster进程,看新建表的分区。

四、合并region

1 使用工具类:hbase org.apache.hadoop.hbase.util.Merge

hbase org.apache.hadoop.hbase.util.Merge table \
        poidb,1c71c71c,1401350387344.163071a6eb98d44e0e6d087ff9e48d53. \
        poidb,38e38e38,1401350387344.86b9bb5b0989dcfe955c18f4a74450c7.

2 原理:在每个region中读取存储文件,并将它们合并成一个新的存储文件。

转载于:https://my.oschina.net/u/1537182/blog/270701

11.4 优化拆分和合并(region)相关推荐

  1. HBase-Region的拆分与合并

    1 Region拆分一个Region代表一个表的一段Rowkey的数据集合,当Region太大,Master会将其拆分.Region太大会导致读取效率太低,遍历时间太长,通过将大数据拆分到不同机器上, ...

  2. Goldengate的拆分与合并

    在使用Goldengate作为复制解决方案时,随着负载的增加,replicat组件常常是最先出现性能瓶颈的.为了适应不断增加的负载,就需要拆分replicat来实现并行复制,本文介绍Goldengat ...

  3. html 单元格拆分及合并,表格合并和拆分.html

    拆分与合并 table { margin: 50px auto 10px; } td { width: 100px; height: 100px; text-align: center; } td.a ...

  4. 细说PHP笔记03(第7章)--数组与数据结构,数组定义,数组遍历,数组内部指针遍历,键值操作函数,统计数组函数,回调函数处理数组元素,数组排序,拆分、合并、分解、结合数组,数组实现堆栈,随机选取元素

    1.数组 索引数组:索引值是整数 关联数组:索引值是字符串 2.数组的定义 1.以直接赋值的方式声明 $数组名[下标]=资料内容 或 $数组名[关联字符串(键值)]=资料内容 <?php $va ...

  5. 使用Adobe Acrobat DC完成图像转PDF,PDF拆分,合并,调整尺寸,调整大小

    Use Adobe Acrobat DC to transform Image files to PDF, and split, combine, reshape PDF page, compress ...

  6. DM8主备集群中主备库 的拆分与合并

    DM8主备集群中主备库的拆分与合并 环境准备 添加数据 新建表空间及用户并赋权 创建表 STUDENT 和 COURSE 插入数据并提交 查询验证数据 对主库进行在线备份 停止集群 停止守护进程 停止 ...

  7. opencv-python 9.4 拆分及合并图像通道

    opencv-python 教程 https://www.cnblogs.com/Undo-self-blog/p/8424220.html 9.4 拆分及合并图像通道 有时我们需要对 BGR 三个通 ...

  8. linux下将多个文件去除文件头合并_命令行生存指南:拆分与合并 | Linux 中国

    这一节将会介绍 Linux 命令行下的文件拆分与合并操作. 作者:Psiace (本文字数:2706,阅读时长大约:3 分钟) 作为一个工程师,我们经常与命令行打交道,但除了工作用的命令,你是否尝试过 ...

  9. 拆分命令_命令行生存指南:拆分与合并 | Linux 中国

    导读:这一节将会介绍 Linux 命令行下的文件拆分与合并操作. 本文字数:2706,阅读时长大约:3分钟作者:Psiace 作为一个工程师,我们经常与命令行打交道,但除了工作用的命令,你是否尝试过让 ...

最新文章

  1. CUDA之单thread单block多thread单block多thread多block
  2. 设置apache目录认证
  3. 10 ORA系列:ORA-12704 字符集不匹配 character set mismatch
  4. 北邮高级语言设计基于java期末_北邮《高级语言程序设计》第三次阶段作业带答案...
  5. 容器学习 之 安装docker(二)
  6. scrapy框架_入门Scrapy框架看这一篇文章就够了
  7. ListableBeanFactory接口
  8. 处理接口超时_架构设计|异步请求如何同步处理?
  9. 为什么 Rust 连续 4 年获「最受喜爱编程语言」?
  10. java ajax 进度条_java使用ajax实现进度条
  11. html提交表单使用python计算_使用Python计算股票期货,量化程序化交易
  12. Could not transfer artifact问题
  13. java回顾:MyBatis开发、配置、标签、封装会话工具
  14. 【LeetCode】 374. 猜数字大小 骚气的猴子算法 打死都找不着系列 JAVA
  15. 公交门户分析与统计系统
  16. 计算机课作文600,上信息技术课作文600字
  17. 安装Ubuntu 21.04后要做的事
  18. android os v2.0,免除升级烦恼 Android OS v2.2给力手机推荐
  19. 计算机 网络属性打不开,电脑上的本地连接属性打不开怎么处理?
  20. GitHub is free for teams -终于等到你

热门文章

  1. 在LINUX中如何把2个文件中的内容合到另一个文件中
  2. Go 语言接口详解(一)
  3. angular cannot get /
  4. Linux学习总结(七十四)自动化运维之ansible
  5. 深入理解Spring系列之四:BeanDefinition装载前奏曲
  6. linux page buffer cache深入理解
  7. linux下插入的mysql数据乱码问题及第三方工具显示乱码问题
  8. win03组策略-入门篇
  9. C语言学习之 数组,指针,字符串. (一)
  10. ORA-01092解决一例