5.hbase表新增数据同步之add

一.前提主从集群之间能互相通讯；

二.在cluster1上（源集群）：

1.查看集群已开启的peers

hbase(main):011:0> list_peers

PEER_ID CLUSTER_KEY STATE TABLE_CFS
10 slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase ENABLED USER_INFO:ncallrecords
1 row(s) in 0.0100 seconds

2.使用新建表test做测试，建表，然后在从集群也建立一张一样的test表：

hbase(main):015:0> create "test","A"
0 row(s) in 2.2720 seconds

3.disable该表：

hbase(main):022:0> disable 'test'
0 row(s) in 2.2550 seconds

4.开启复制功能，默认为不开启：

hbase(main):023:0> alter 'test',{NAME=>'A',REPLICATION_SCOPE => '1'}

5.开启该表：

hbase(main):026:0> enable 'test'
0 row(s) in 1.2630 seconds

6.针对该表建立add_peer功能：

hbase(main):028:0> add_peer '11','slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase'
0 row(s) in 0.0180 seconds

7.再看查看已开启的peers，可以看到新加的：

hbase(main):029:0> list_peers
PEER_ID CLUSTER_KEY STATE TABLE_CFS
11 slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase ENABLED
10 slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase ENABLED USER_INFO:ncallrecords
2 row(s) in 0.0120 seconds

8.开启针对test表同步复制：

hbase(main):030:0> set_peer_tableCFs '11','test'
0 row(s) in 0.0040 seconds

9.再list_peers:

hbase(main):031:0> list_peers
PEER_ID CLUSTER_KEY STATE TABLE_CFS
11 slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase ENABLED test
10 slave.01.bigdata.prod.wgq,slave.02.bigdata.prod.wgq,slave.03.bigdata.prod.wgq:2181:/hbase ENABLED USER_INFO:ncallrecords
2 row(s) in 0.0050 seconds

10.往主集群hbase数据库test表中put新数据，验证从集群是否有新数据：

hbase(main):034:0> put "test","2222222","A:name","chenliangliang"
0 row(s) in 0.0720 seconds

hbase(main):035:0> put "test","2222222","A:age","30"
0 row(s) in 0.0060 seconds

----------------------------------------------------------------------------------------------------

hbase(main):036:0> scan "test"
ROW COLUMN+CELL
1111111 column=A:age, timestamp=1524021317653, value=30
1111111 column=A:name, timestamp=1524021305313, value=gongxiucheng
2222222 column=A:age, timestamp=1524021628181, value=30
2222222 column=A:name, timestamp=1524021616864, value=chenliangliang
2 row(s) in 0.0070 seconds

-------------------------------------------------------------------------------------------------------

其中rowKey为1111111的这条是开启数据同步之前put的；

-------------------------------------------------------------------------------------------------------

然后到从集群scan test表，假如有rowKey为2222222的这条数据，则同步成功：

---------------------------------------------------------------------------------------------------------

hbase(main):010:0> scan "test"
ROW COLUMN+CELL
2222222 column=A:age, timestamp=1524021628181, value=30
2222222 column=A:name, timestamp=1524021616864, value=chenliangliang
1 row(s) in 0.0350 seconds

三.总结：

1 验证是需要先核对下hbase的版本,不同版本的复制命令不同；

2 同步是针对配置后复制的新数据，旧数据需要手动迁移；

转载于:https://www.cnblogs.com/gxc2015/p/8873269.html

5.hbase表新增数据同步之add_peer相关推荐

datax 持续数据同步_采用DataX实现多表增量数据同步
这两天验证了一下阿里的DataX数据同步工具,觉得DataX可以用来做管理数据的多级数据同步.DataX用来做批量数据迁移很适合,能够保证数据的一致性,性能也很好,结合时间戳字段,用来实现数据定时增量 ...
MYSQL数据库表A数据同步到表B
目前有一个功能,需要数据库表A的数据同步到数据库表B里,目前来说除了表名不一样,字段全部都一样. 表A 表B 然后执行sql语句 INSERT QC_RSLT_EXT SELECT * FROM QC ...
Kettle-开源的ETL工具集-实现SqlServer到Mysql表的数据同步并部署在Windows服务器上
场景 kettle 中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出.是一款由纯Java编写的ETL工具,绿色无需安装,数据抽取高效稳定(数据迁移工具). ...
python实现指定数据库指定表的数据同步（监听binlog）
话不多说直接上代码,简单实现,具体功能请根据业务场景自行调整 from pymysqlreplication import BinLogStreamReader from pymysqlreplica ...
scala学习-scala读取Hbase表中数据并且做join连接查询
1.业务需求:sparkSQL on hbase ,sparkSQL直接读取Hbase中的两个表,进行连接查询. 2.图示绿色的线上图中绿色的线是做过测试的,直接在hive中建表,然后load数据 ...
java实现两张表的数据同步,java实现mysql数据库从一张表插入数据到另一张表
包 cn.gtmc.schedule.app; 导入 cn.gtmc.schedule.domain.Employee; import java.sql. * ; 导入 java.util.Array ...
php mysql两个表合并_php操作mysql两个数据库中表的数据同步
题记: 我们开发当中经常会遇到,数据同步.比如将teaching数据库中area表的数据同步到study数据库中zone表中. 备注:这两个数据库不同,数据表名字也不同,但数据表的结构相同.不同表结构 ...
elasticsearch 数据类型_基于 MySQL Binlog 的 Elasticsearch 数据同步实践
来源;马蜂窝一.背景随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存 ...
基于 MySQL Binlog 的 Elasticsearch 数据同步实践
一.为什么要做随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数 ...
基于 MySQL Binlog 的 Elasticsearch 数据同步实践原
一.背景随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数据可以 ...

5.hbase表新增数据同步之add_peer

5.hbase表新增数据同步之add_peer相关推荐

最新文章

热门文章