BDS定位

BDS针对开源HBase目前存在的同步迁移痛点,自主研发的一套数据迁移的平台,用于HBase集群的无缝迁移、主备容灾、异地多活、在线离线业务分离、HBase数据归档、对接RDS实时增量数据等等。目的在于帮助阿里云上客户解决自建HBase、EMR HBase、Apsara HBase的数据导入导出,从而方便云上客户围绕HBase构建高可用、灵活的业务系统。

使用场景

BDS在云上目前主要有以下几个使用场景:

  • 新旧集群无缝迁移

  • 在线离线业务分离

  • 主备容灾

  • RDS实时数据同步到HBase、Phoenix

新旧集群无缝迁移

使用范围
  • HBase大版本升级, 1.x 升级 2.x

  • 集群配置升级

  • 集群网络的切换,经典切换VPC

  • 异地跨机房迁移

  • 业务拆分

业务流程

在线离线业务分离
业务架构

通过BDS,将在线业务数据实时同步到离线集群,结合Spark、MR等大数据组件进行离线的数据分析,从而不影响在线业务的查询。

主备容灾

业务流程

通过BDS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群,尽可能减少对业务产生的影响,当主集群服务恢复之后,通过BDS同步服务补齐主集群遗漏的数据。

RDS实时数据同步到HBase、Phoenix

业务架构

通过BDS将RDS数据实时同步到HBase集群
  • 结合Spark、MR等大数据组件进行离线的数据分析,从而不影响在线业务的查询

  • 利用HBase支持动态列的功能,将mysql中多张表构建成一张HBase的大宽表,避免在RDS中进行join查询

  • 做RDS的历史库

BDS优势

  1. 功能性

    1. 支持跨版本的数据迁移和同步,HBase HBase、Phoenix Phoenix

    2. 对于同构数据源迁移,支持同步建表语句,保证分区一致

    3. 支持异构数据源的实时数据同步,RDS -> HBase、Phoenix

  2. 迁移同步对业务方无感知

    1. 不停服数据迁移,同时搞定历史数据迁移、实时增量数据的同步

    2. 对业务端应用代码无侵入

  3. 迁移同步对业务影响小

    1. 迁移过程中基本不会和集群的HBase交互,只读写集群的HDFS

    2. 可以动态调整迁移的速度和并发读

  4. 正确性

    1. 保证数据迁移的不丢失

    2. 数据的抽样校验

  5. 稳定性

    1. 有完善的failover机制,能够自动处理常见的错误

    2. 实时系统监控,方便定位上下游的问题

    3. 报警机制,对于一些需要人为介入的异常进行报警

    4. 错误重试支持断点续传

  6. 高效性

    1. 单个节点迁移速度可达到100MB/s,节点数支持水平扩展,能够满足支持TB、PB级别的数据迁移

总结

BDS已经在阿里云上线了,方便云上的客户在自建HBase、EMR HBase、Apsara HBase之间进行数据的迁移和实时数据同步。
在云上已经服务40多个客户,帮助客户实现集群之间的无缝迁移,集群的升配,主备容灾,数据迁移同步规模达到400多T(单副本)。
云上有迁移需求的客户,可以查看《BDS服务介绍》,或者联系侧田:

https://help.aliyun.com/document_detail/120883.html

对BDS实现原理及方案比较感兴趣的朋友,可以查看《BDS-HBase数据同步方案的设计与实践》:

https://yq.aliyun.com/articles/704977

大家工作学习遇到HBase技术问题,把问题发布到HBase技术社区论坛http://hbase.group,欢迎大家论坛上面提问留言讨论。想了解更多HBase技术关注HBase技术社区公众号(微信号:hbasegroup),非常欢迎大家积极投稿。

本群为HBase+Spark技术交流讨论,整合最优质的专家资源和技术资料会定期开展线下技术沙龙,专家技术直播,专家答疑活动

点击链接钉钉入群:https://dwz.cn/Fvqv066s或扫码进群

本群为Cassandra技术交流讨论,整合最优质的专家资源和技术资料会定期开展线下技术沙龙,专家技术直播,专家答疑活动

Cassandra 社区钉钉大群:https://c.tb.cn/F3.ZRTY0o

Cassandra 技术社区微信公众号:

hbase集群 数据写入_HBase神器 | BDSHBase集群之间数据迁移同步的利器相关推荐

  1. linux强制将数据写入磁盘,防止丢失内存的数据

    原文https://www.cnblogs.com/python-cat/p/7252112.html sync命令文件系统管理 sync命令用于强制被改变的内容立刻写入磁盘,更新超块信息. 在Lin ...

  2. hbase集群 数据写入_Hbase实用技巧:全量+增量数据的迁移方法

    摘要:本文介绍了一种Hbase迁移的方法,可以在一些特定场景下运用. 背景 在Hbase使用过程中,使用的Hbase集群经常会因为某些原因需要数据迁移.大多数情况下,可以跟用户协商用离线的方式进行迁移 ...

  3. hbase集群 数据写入_HBase架构与原理详解

    一.概述 HBase是基于列式存储的分布式数据库,底层存储采用的是LSM树,是Hadoop生态下核心技术之一. 1.1 架构图 1.2 组件介绍 HBase由三种类型的服务器以主从模式构成: Regi ...

  4. hbase 二进制数据写入_Hbase对于大对象存储的三种主要解决方案

    本帖最后由 非鱼 于 2015-4-29 12:23 编辑 方案1:HBase自身的大对象存储方案 由于HBase底层数据都是以Bytes数组来存储,对于非结构化数据的大对象可以很容易的转成Bytes ...

  5. java数据写入文件方案,Java如何将字符串数据写入文件?

    package org.nhooo.example.commons.io; import org.apache.commons.io.FileUtils; import java.io.File; i ...

  6. 将数据写入文件C语言fwrite,fwrite -- 将数据写入到文件中

    fwrite函数文档 函数概要: fwrite 函数用于将指定尺寸的数据写入到指定的文件中. 函数原型: #include ... size_t fwrite(const void *ptr, siz ...

  7. bootstraptable 怎么在特定行添加数据_同等权限下多任职之间数据权限的实例

    编辑导语:同等权限下多任职之间的数据权限应该如何解决呢?本文作者提出了两种解决方法,并且介绍了权限系统.权限分类和角色管理,希望看后能够对你有所启发. 有两种解决方案: 第一种实现难度低,不用跟组织架 ...

  8. c语言将数据写入文件后乱码_c语言,数据能写入文件,但是从文件读取数据的时候,出现了乱码,如下代码,求解答...

    //写入数据代码#include#defineSIZE2typedefstructstu1//学生信息表{charname[10];intnum;intage;charaddr[15];}studen ...

  9. 如何将数据写入excel中,而不覆盖原有数据

    之前直接用pandas库,然后to_excel(),结果直接将原始数据直接覆盖,幸亏有备份.(友善提醒,做数据处理之前,先将数据本地备份一份,确认完全没有问题,然后还是备份一份 ,再进行实盘操作,否则 ...

最新文章

  1. shell 练习(13) —— 监控 httpd 进程数是否异常
  2. 简单的树形dp NOJ376 小强的Linux
  3. Hibernate事务管理-HibernateTransactionManager-对hibernate session的管理
  4. matlab的数值计算功能,MATlAB数值计算功能
  5. Spring cloud(Finchley)微服务框架,sleuth整合zipkin链路追踪失效的问题
  6. python信息管理系统实战_最新python入门+进阶+实战课堂教学管理系统开发全套完整版...
  7. IP地址、子网掩码、网关、默认网关、DNS的理解
  8. bootstrap 横铺 行_bootstrap的布局(container、row、col-xs-4)
  9. svn 切换账号信息
  10. PHP核心技术与最佳实践 读书笔记 第二章 面向对象的设计原则
  11. HTTP2.0,HTTP1.1,HTTP1.0三者在通性性能上的优化方法
  12. 14. Element className 属性
  13. SwitchyOmega规则列表地址
  14. js 将16进制转为字符串
  15. 运筹学教学|十分钟快速掌握割平面法及对偶单纯形法(附Java代码及算例)
  16. Arduino 和 TB6612FNG 驱动直流电机
  17. Android整合网上资源以及个人对GreenDao数据库框架的理解与使用(android-studio开发)
  18. python实现从oracle读数据写入mysql(1)
  19. Apache服务器访问过慢分析及解决
  20. Python | 输入逗号分隔的元素,转换为列表并打印

热门文章

  1. 《Python数据分析》第二版.第二章.[学习笔记][Jupyter notebook]
  2. 利用python语言实现帧差法,python+opencv实现帧差法
  3. CleanCodeHandbook Chapter 2: Math(17-19)
  4. sql server 2008 的安装
  5. [USACO18JAN] Cow at Large G (dfs)
  6. SDN第5次上机作业
  7. PHP json_encode 中文乱码
  8. 质因数分解(0)P2012_1
  9. C#操作XML方法详解
  10. Kernel panic - not syncing:Attempted to kill...