本文介绍redis主从环境下的手工failover操作及排错过程,实现主实例宕机的时候,将从实例提升为主实例,继续写入数据;等到原主实例恢复后,同步原从实例上的数据完成后,恢复初始的主从实例角色!

环境介绍
操作系统版本均为:rhel5.4 64bit
redis版本:2.6.4
redis实例端口均为:6379
redis实例密码均为:123
主实例为server11(192.168.1.112)
从实例为server12(192.168.1.113)

一:未配置持久化情况下的手工切换
1:正常情况下,server11为主实例,server12为从实例,数据同步正常

  1. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123
  2. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 3 'Replication'
  3. # Replication
  4. role:master
  5. connected_slaves:1
  6. slave0:192.168.1.113,6379,online
  7. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 config get save
  8. 1) "save"
  9. 2) ""
  10. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 config get save
  11. 1) "save"
  12. 2) ""
  13. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 set 5 e
  14. OK
  15. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 5
  16. "e"
  17. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  18. "e"

2:当主实例挂掉的时候,从实例可以正常查询,但无法写入数据

  1. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 shutdown
  2. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 5
  3. Could not connect to Redis at 192.168.1.112:6379: Connection refused
  4. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  5. "e"
  6. [root@server12 ~]#  /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 set 6 f
  7. (error) READONLY You can't write against a read only slave.

3:将从实例提升为主实例,从而实现数据写入

  1. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 SLAVEOF NO ONE
  2. OK
  3. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 info |grep -A 3 'Replication'
  4. # Replication
  5. role:master
  6. connected_slaves:0
  7. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  8. "e"
  9. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 set 6 f
  10. OK
  11. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 6
  12. "f"

4:主实例恢复后尝试从server12实例上获取最新的数据,实际测试表明这种方法不可行,最终导致server11和server12的数据不一致,如果强行恢复初始实例角色,则会导致数据丢失

  1. [root@server11 ~]# /usr/local/redis2/bin/redis-server /usr/local/redis2/etc/redis.conf
  2. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 3 'Replication'
  3. # Replication
  4. role:master
  5. connected_slaves:0
  6. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123  get 5
  7. (nil)
  8. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123  get 6
  9. (nil)
  10. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123  get 5
  11. "e"
  12. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123  get 6
  13. "f"
  14. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -p 6379 -a 123 SLAVEOF 192.168.1.113 6379
  15. OK
  16. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 10 'Replication'
  17. # Replication
  18. role:slave
  19. master_host:192.168.1.113
  20. master_port:6379
  21. master_link_status:down
  22. master_last_io_seconds_ago:-1
  23. master_sync_in_progress:0
  24. master_link_down_since_seconds:517
  25. slave_priority:100
  26. slave_read_only:1
  27. connected_slaves:0
  28. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 info |grep -A 3 'Replication'
  29. # Replication
  30. role:master
  31. connected_slaves:0
  32. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 5
  33. (nil)
  34. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 6
  35. (nil)
  36. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 6
  37. "f"
  38. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  39. "e"

二:开启从实例快照持久化下的测试
1:恢复原测试环境后,开启从实例的快照持久化,因为是测试环境,所以设置60秒内如果有1条数据变更则保持一次快照

  1. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 config get save
  2. 1) "save"
  3. 2) ""
  4. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 config get save
  5. 1) "save"
  6. 2) "60 1"
  7. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 3 'Replication'
  8. # Replication
  9. role:master
  10. connected_slaves:1
  11. slave0:192.168.1.113,6379,online
  12. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 info |grep -A 3 'Replication'
  13. # Replication
  14. role:slave
  15. master_host:192.168.1.112
  16. master_port:6379

2:写入测试数据主从环境数据是否同步正常

  1. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 set 5 e
  2. OK
  3. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 5
  4. "e"
  5. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  6. "e"

3:模拟主实例宕机,手动将从实例提升为主实例,继续写入新数据

  1. [root@server11 ~]# killall -9 redis-server
  2. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 3 'Replication'
  3. Could not connect to Redis at 192.168.1.112:6379: Connection refused
  4. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  5. "e"
  6. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 set 6 f
  7. (error) READONLY You can't write against a read only slave
  8. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 slaveof no one
  9. OK
  10. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 info |grep -A 3 'Replication'
  11. # Replication
  12. role:master
  13. connected_slaves:0
  14. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  15. "e"
  16. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 set 6 f
  17. OK
  18. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 6
  19. "f"

4:原主实例恢复后的数据同步及角色复原,这里同步数据采取将从实例的快照文件复制到主实例的方式实现

  1. [root@server12 ~]# scp /usr/local/redis2/slave_dump.rdb  server11:/usr/local/redis2/master_dump.rdb
  2. [root@server11 ~]# /usr/local/redis2/bin/redis-server /usr/local/redis2/etc/redis.conf
  3. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 2 'Replication'
  4. # Replication
  5. role:master
  6. connected_slaves:0
  7. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 5
  8. "e"
  9. [root@server11 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 get 6
  10. "f"
  11. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 slaveof 192.168.1.112 6379
  12. OK
  13. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 info |grep -A 10 'Replication'
  14. # Replication
  15. role:slave
  16. master_host:192.168.1.112
  17. master_port:6379
  18. master_link_status:up
  19. master_last_io_seconds_ago:1
  20. master_sync_in_progress:0
  21. slave_priority:100
  22. slave_read_only:1
  23. connected_slaves:0
  24. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 5
  25. "e"
  26. [root@server12 ~]# /usr/local/redis2/bin/redis-cli -h 192.168.1.113 -a 123 get 6
  27. "f
  28. [root@server11 ~]#  /usr/local/redis2/bin/redis-cli -h 192.168.1.112 -a 123 info |grep -A 3 'Replication'
  29. # Replication
  30. role:master
  31. connected_slaves:1
  32. slave0:192.168.1.113,6379,online

后续扩展:本文实现的failover过程,到从实例提升到主实例阶段都是可以通过部署keepalive自动实现的,在最后原主实例数据同步和角色复原可以通过shell脚本来调度,下篇文章中将对此进行详细的介绍!

本文转自斩月博客51CTO博客,原文链接http://blog.51cto.com/ylw6006/1080211如需转载请自行联系原作者

ylw6006

Redis手动failover相关推荐

  1. 实现redis 手动_Redis精华所在,一口气说完Redis的主从复制和哨兵模式

    主从复制概念 主从复制指将一台redis的数据复制另外一台redis服务器上,前者称为主节点(master),后者称为从节点(slave). 注意复制的过程是单向的,只能从主节点到从节点,主节点以写为 ...

  2. 16、Redis手动创建集群

    写在前面的话:读书破万卷,编码如有神 --------------------------------------------------------------------------------- ...

  3. centos7 安装 Redis(资源)

    2019独角兽企业重金招聘Python工程师标准>>> Redis简介 Redis是一个基于BSD开源的项目,是一个把结构化的数据放在内存中的一个存储系统.可以把它作为数据库,缓存和 ...

  4. @primary注解_springboot整合redis分别实现手动缓存和注解缓存

    一.前期准备 1.一个构建好的springboot系统2.下载redis安装包,去redis官网下载3.启动redis服务,windows下双击bin目录下的redis-service.exe 二.环 ...

  5. springboot整合redis分别实现手动缓存和注解缓存

    一.前期准备 一个构建好的springboot系统 下载redis安装包,去redis官网下载 启动redis服务,windows下双击bin目录下的redis-service.exe 二.环境构建 ...

  6. Redis 如何分布式,来看京东金融的设计与实践

    http://www.infoq.com/cn/articles/jingdong-redis-practice 前言 R2M 是京东金融线上大规模应用的分布式缓存系统,目前管理的机器总内存容量超过 ...

  7. 用最少的机器支撑万亿级访问,微博6年Redis优化历程

    https://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=2653547263&idx=1&sn=fe484b24660b7e ...

  8. Redis Sentinel配置小记

    Sentinel是一个管理多个redis实例的工具,它可以实现对redis的监控.通知.自动故障转移.sentinel不断的检测redis实例是否可以正常工作,通过API向其他程序报告redis的状态 ...

  9. Redis哨兵模式(sentinel)学习总结及部署记录(主从复制、读写分离、主从切换)

    Redis的集群方案大致有三种:1)redis cluster集群方案:2)master/slave主从方案:3)哨兵模式来进行主从替换以及故障恢复. 一.sentinel哨兵模式介绍 Sentine ...

最新文章

  1. .如何实现浏览器内多个标签页之间的通信?
  2. PHPExcel报错:谷歌浏览器显示网页可能暂时无法连接,或者它已永久性地移动到了新网址的原因?
  3. [已解决]window下Can't connect to MySQL server on 'localhost' (10061)与无法启动MYSQL服务”1067 进程意外终止”...
  4. STM32的:外部中断线EXTIN和外部中断向量EXTIN_IRQn和中断服务程序入口EXTIN_IRQHandler详解
  5. 初步了解Linux内核中断初始化
  6. 009 数据结构逆向—数组(困难版)
  7. linux无法打开共享对象文件或目录,linux - libmodbus.so.5:无法打开共享对象文件:没有这样的文件或目录 - 堆栈内存溢出...
  8. 史上最简单的SpringCloud教程 | 第六篇: 分布式配置中心(Spring Cloud Config)
  9. 牛客网 在线编程 之字形矩阵打印
  10. android安卓机版市场,安卓各版本市场份额数据更新 安卓8.0暴增
  11. 后端技术:数据持久化框架为什么放弃 Hibernate、JPA、Mybatis,最终选择 JDBCTemplate!...
  12. 数据交互智能终端设想
  13. ElasticSearch概述(一)——简介
  14. 2、赶去公司--网易2017春招
  15. 合作 | IEIC·IT耳朵智能创新大会:人工智能落地将带来新风口
  16. redis 配置文件翻译
  17. Nginx 场景应用
  18. 安装linux没有raid驱动程序,LINUX 无法在 RAID 上安装的问题
  19. vmware mac os 10.11.6 安装xcode 8
  20. android配置jni cmake,Android JNI之青春期 Cmake(android studio)

热门文章

  1. 算法题存档20190304
  2. mysql5.5怎么升级补丁_mysql 5.5升级到5.7版本操作流程
  3. 分布式事务实践 解决数据一致性 分布式系统
  4. css3 flex属性flex-grow、flex-shrink、flex-basis学习笔记
  5. android游戏渠道支付,Android渠道支付隐患及推荐解决方案
  6. hibernate4整合spring3.1出现java.lang.NoClassDefFoundError: Lorg/hibernate/cache/CacheProvider
  7. 《Go 语言程序设计》读书笔记 (五) 协程与通道
  8. 优秀简历模板和面试题分享
  9. Docker核心技术之联合文件系统
  10. docker-compose搭建kafka集群