1、DRBD开机自自动(chkconfig --add drbd),需要注意一下wait time out选项:、

wfc-timeout 120;  如果为0的话,它会无限的等待下去;

在配置高可用如keepalived时候,要注意 先保证drbd数据的一致性;然后在启动keepalived

小插曲:

在linux 自起中,先运行 /etc/rc.d/rc#. d  里面设定的脚本,最后是/etc/rc.local ,如果同样是在某运行级别下的脚本,根据S后面的数字,数字越小优先级越高,所以drbd的数字要比keepalived的小一些;

2、磁盘IO故障

推荐配置为 detach 策略;这个时候主从角色状态没有改变,磁盘状态变为diskless(这个需要监控);

模拟实验:

drbd-primary:

drbdadm detach all;

此时磁盘还处于挂接状态;为了正常切换角色,执行以下命令:

drbdadm secondary all;

umount /dev/drbd0;

在drbd-secondary 上执行:

drbdadm primary all;

mount /dev/drbd0 /data

3、更换磁盘

如果secondary节点出现磁盘故障需要换硬盘:

注意:新添加的硬盘的磁盘名如果被占用,需要修改配置文件!

进行的操作:

drbdadm create-md  all

service drbd start

drbdadm attach all

drbdadm secondary all

以上情况 属于内部元数据, 下面可以看看使用外部元数据更换硬盘;

除以上操作外,还有进行 drbdadm invalidate  all

即进行以下操作:

drbdadm create-md all

drbdadm attach all

drbdadm invalidate  all

drbdadm secondary all

4、处理节点故障:

当primary node 出现故障后,Drbd并不升级存活的节点到主,需要集群管理程序重要做。

切换完毕后需要做 的事情:

1)将出现故障的硬件替换为与之类似性能和容量的磁盘。(性能最好一致;替换为磁盘容量比较小,会导致drbd拒绝连接被替换的节点。)

2)安装基本系统和应用程序。

3)安装drbd并从幸存的节点上拷贝/etc/drbd.conf和所有的/etc/drbd.d

4)drbdadm create-md resource (创建元数据设备)

5)service  drbd start

6)drbdadm attach resource (将drbd资源和后端设备连接 )

7)drbdadm syncer resource  (设置drbd资源的同步参数)

8)drbdadm connect resource  (连接对等节点)

Look:千万不要初始化设备,

5、脑裂问题处理

DRBD检测到primary 恢复连接并变成可用,和对等节点达成初步的握手。如果drbd检测到两个节点(也可能是两个节点断开时)都是主角色,它就连接关闭复制的连接。可以在系统日     志中发现:Split-Brain detected, dropping connection!

一个节点将保持始终以StandAlone状态连接资源,另外一个节点也可能处于StandAlone状态(如果两个节点被探测到同时处于裂脑状态),也可能是WFConnection状态(如果对等接在     还没有来得及探测到裂脑就down掉的话)。

必须手工干预选择丢失一个节点的修改被丢失(这个节点被称为裂脑受害者),除非配置drbd的裂脑自动修复。

(在出现脑裂的情况下,service drbd stop 是不会生效的,返回会hang住,一直处于等待状态)

在需要放弃修改的那一端做如下操作:

drbdadm secondary <resource>

drbdadm -- --discard-my-data connect <resource>

在其他节点上(裂脑幸存者),如果它的状态也为StandAlone状态,可输入以下命令:

drbdadm connect <resource>

如果节点已经处于WFConnection状态,可是省略这一步,因为它会自动进行重新连接。

当连接时裂脑受害者将立即改变连接状态为SyncTarget,并被主节点覆盖其余节点的修改。

Look:裂脑受害者不是一个完整的设备同步,相反,还有可能执行本地修改的回滚操作,而将裂脑幸存者的所做的修改完整的传输到裂脑受害者。当重新完成同步后,就认为裂脑问题已经解决,两个节点的数据再次达成一致,形成一个冗余复 制的存储系统。

转载于:https://blog.51cto.com/weipengfei/1333465

DRBD 管理、故障处理部分相关推荐

  1. 记一次DRBD Unknown故障处理过程

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://koumm.blog.51cto.com/703525/1769112 配置drb ...

  2. 一文详解 MySQL 高可用之 DRBD | 原力计划

    作者 | wzy0623 责编 | 屠敏 出品 | CSDN 博客 大多数MySQL高可用解决方案都是基于MySQL自带的各种复制技术.本质上是将一个实例上的数据更新或事务,在其它实例上进行重放,从而 ...

  3. 【编译打包】drbd 8.4.2

    drbd 全称Distributed Replicated Block Device,分布式复制块设备,相当于网络raid1,可以实现块设备的高可用.经典的用法是drbd+heartbeat. drb ...

  4. MySQL高可用之DRBD

    目录 一.DRBD简介 1. 工作原理 2. DRBD 支持的底层设备 3. DRBD资源 4. DRBD 配置工具 5. DRBD与RAID1区别 6. DRBD与共享存储 二.DRBD安装配置 1 ...

  5. 没有执行此操作所需的足够可用空间。_一文详解 MySQL 高可用之 DRBD | 原力计划...

    作者 | wzy0623责编 | 屠敏出品 | CSDN 博客大多数MySQL高可用解决方案都是基于MySQL自带的各种复制技术.本质上是将一个实例上的数据更新或事务,在其它实例上进行重放,从而完成数 ...

  6. DRBD中文应用指南

    DRBD中文应用指南 写在前面的话: 为了方便学习,将drbd的英文文档翻译出来,以供学习和参考.但因为本人英语水平有限,以及对drbd的了解并不足够深入,翻译中出现很多不通顺或者是语病的地方,请大家 ...

  7. 老王学linux-centos6.7drbd8.4.3

    最下面有包 复制模块到内核中 cp drbd.ko /lib/modules/`uname-r`/kernel/lib/ depmod             更新内核包关联文件modules.dep ...

  8. 激光雷达与自动驾驶详解

    激光雷达与自动驾驶详解 参考文献链接 https://mp.weixin.qq.com/s/Gk4JJZapKHXZE2AjliR8_A https://mp.weixin.qq.com/s/8xkd ...

  9. 在你的应用里使用Jetty嵌入式

    Jetty嵌入式的支持jsp的web container,我在一个港股行情系统里嵌入了jetty来通过http监控系统状况. Jetty的pom依赖库 <dependency> <g ...

  10. 自动驾驶功能架构的演进

    前言 为什么? 为什么同样实现NOA功能,特斯拉只用摄像头方案,而大部分OEM还会增加毫米波雷达,甚至激光雷达? 为什么5R1V架构这么受欢迎?到底有什么经典之处,这种架构会长期存在吗? 为什么L3级 ...

最新文章

  1. 200行代码实现一个滑动验证码
  2. 贪吃蛇程序 php,php,函数 Web程序 - 贪吃蛇学院-专业IT技术平台
  3. 【转载】从头编写 asp.net core 2.0 web api 基础框架 (1)
  4. 订餐系统之Excel批量导入
  5. “约见”面试官系列之常见面试题之第一百零八篇之如何获取dom(建议收藏)
  6. 《剑指Offer》 变态跳台阶
  7. c语言双向链表 快速排序,双向链表的快速排序(swift版本)
  8. Websphere 手动模拟删除应用操作
  9. 重复类发展手法_正确护肤手法图解!
  10. 提交不了_志愿提交不了,不一定是系统问题。为了成功填报,建议试试这7步...
  11. win10下Miracast无线投屏使用教程及异常解决方案(超详细)
  12. Java基础面试题大全
  13. DSP2812 RAM不够用的解决方法【转载】
  14. 验证iOS应用的无障碍特性
  15. pcd点云文件成功转成npy文件
  16. 【Gitee + Hexo】从0开始搭建自己的博客网站
  17. 微信小程序开发之实现一个弹幕评论
  18. python抠图代码_五行 Python 代码实现批量抠图
  19. 《隐忍的老虎司马懿》
  20. STM32,点亮RGB灯,指南者,新手

热门文章

  1. Python 序列化模块(json,pickle,shelve)
  2. Learning-MySQL【4】:表的操作管理和 MySQL 的约束控制
  3. php获取并删除数组的第一个和最后一个元素
  4. BZOJ 2440 【中山市选2011】 完全平方数
  5. [hdu1532]最大流
  6. (原创)使用nRF51822/nRF51422创建一个简单的BLE应用 ---入门实例手册(中文)之五...
  7. 查询英语单词 - 有道官方(一)
  8. webstorm 快捷键
  9. 【BZOJ1116】[POI2008]CLO 并查集
  10. python_射门小游戏