为验证AIX HACMP集群系统的稳定性及保障其上应用的连续性和可靠性,决定周五晚进行集群切换测试。下面是当次过程的文档总结和记录,方便以后参考并备案。

系统环境:AIX 5.3

数据库: DB2 V8.2

存储: IBM DS4700,为两节点配置使用共享存储

AIX HACMP原理示意图:

HA测试一: 启动和关闭

在当前系统中确保VG在两边都被varyoff

#smitty clstart 启动HA

tail –f /tmp/hacmp.out 看启动输出信息

tail –f /tmp/cm.log 看错误信息

netstat –i 和 –in 看IP地址是否变为service地址

lsvg –o 查看VG是否在两台机器上被varyon

l***c –g cluster 看相应SRC是否起来(应该显示2或3个SRC)

如:Subsystem Group PID Status

clsmuxpdES cluster 213488 active

clstrmgrES cluster 238062 active

clinfoES cluster 229656 active

#smitty clstop 关闭HA

graceful(正常)/takeover(接管)/force(强制,IP不变回boot)

这里就选graceful

tail –f /tmp/hacmp.out 看关闭输出信息

tail –f /tmp/cm.log看错误信息

netstat –i 和 –in看IP地址是否变为boot地址

l***c –g cluster看相应SRC是否已关闭(应该无显示)

使用Cluster Snapshot可以保存当前Cluster配置,以后直接Apply就可恢复。

HA测试二:本机IP接管

确定两台机器HA已正常启动。

拔去与主机service IP关联的网卡的网线。

在主机上运行:

netstat –i 和 –in

这时standby网卡将接管service IP而原service网卡将对应standby IP。

备机不发生任何反应。

插回主机上拔去的网线并运行:

netstat –i 和 –in

这时主机没有任何复原动作,原standby网卡仍对应service IP而原service网

卡仍对应standby IP,即便关闭HA也不会变回来。

要使网卡恢复最初的对应IP,可以运行:

smitty mktcpip

选定网卡(en0, en1, ... ),不作任何改动回车。

HA测试三:资源接管

确定两台机器HA已正常启动。

模拟主机异常终止运行:

方法一:主机上运行:

smitty clstop 关闭方式选takeover

这种测试是主动告诉对方需要接管,并不是真正模拟了故障,可以

在进行真正故障模拟之前先进行这一步测试。

方法二:主机上运行halt –q即时关机(最佳方法)。

方法三:同时拔去主机所有网线和心跳线。

方法四:主机拔电(不建议)。

在备机上运行:

netstat –i 和 –in

如果备机也有service网卡(在cascading,即mutual takeover配置下),这时备机

的standby网卡将接管主机的service IP;

如果备机没有service网卡(在rotating,即standby配置下),这时备机的boot网

卡将接管主机的service IP。

当备机有svc地址:

这是资源组会在备机上挂起来,如果没有挂上,则在备机上运行:

varyonvg datavg

mount -a (或一个一个的挂)

在resource group中定义的FS应该在备机上自动mount。

最后测试应用是否正常,完成集群切换测试报告。

AIX HACMP集群切换测试实际案例解析相关推荐

  1. jar包在Hadoop集群上测试(MapReduce)

    本片使用MapReduce--统计输出给定的文本文档每一个单词出现的总次数的案例进行,jar包在集群上测试 1.添加打包插件依赖 <build><plugins><plu ...

  2. Spark在集群上执行代码案例(中文切词)

    Spark在集群上执行代码案例 java的切词使用案例(Demo) Spark中文切词代码 需求:利用jieba进行中文分词,并打包上传到集群进行执行 java的切词使用案例(Demo) @Test ...

  3. Redis 集群可用性测试

    Redis 集群可用性测试 脚本内容 #!/bin/bashredisHost=192.168.8.119 redisPorts="7001 7002 7003 7004 7005 7006 ...

  4. Elasticsearch 集群压力测试

    文章目录 1. 压力测试 2. 测试目标 & 测试数据 3. 测试脚本 4. ES Rally 简介 5. Rally 的安装以及入门 6. Rally 基本概念讲解 7. Benchmark ...

  5. Kubernetes-记录在容器云Galera集群中测试导入数据

    Kubernetes-在Caicloud容器平台Galera集群中测试导入数据 平台:Caicloud Compass(才云compass容器云管理平台) mysql版本:5.7.20 Galera集 ...

  6. 【Kubernetes】k8s多集群切换【含上下文作用详解】【含6443端口不可达处理方法】

    文章目录 何为多集群? kubeconfig文件内容编写[master节点操作] 单集群配置文件修改 方式一[手动编辑] 文件备份 config文件代码解释[上下文详细解释] config代码编辑 证 ...

  7. 单机快速体验k8s集群的测试环境

    快速指南 以下为快速体验k8s集群的测试.开发环境–单节点部署(aio),国内环境下比官方的minikube方便.简单很多. 1.基础系统配置 准备一台虚机配置内存2G/硬盘30G以上 最小化安装Ub ...

  8. apisix集群安装测试

    apisix集群安装测试 apisix 是无状态服务,集群不用太复杂 本次测试使用在集群外做负载均衡 集群地址 172.21.41.240 172.21.41.241 172.21.41.242 版本 ...

  9. PostgreSQL集群篇——PostgreSQL的配置文件解析

    PostgreSQL集群篇--postgresql.conf配置文件解析 正文 日常中我们进行安装PostgreSQL后都需要对其进行配置基础配置,以便其能有效发挥出服务器的性能,下面是我进行整理后的 ...

最新文章

  1. 有奖活动:写书评赢O'Reilly Velocity大会门票
  2. RedHat(Linux) Oracle数据库设置开机自启动
  3. who killed my time?
  4. 下边框_山寨iPhone12Pro开箱:浴霸四摄更小,下边框有点宽
  5. 做海外运营?这125条核心数据你需要Get
  6. 引用:编写高性能Web应用程序的10个技巧(一)
  7. SAP Hybris MVC里的M指什么
  8. 第四代双模5G旗舰:vivo X30系列为啥「超有梗」?
  9. php array 取值 没有key,PHP array_key_exists不起作用;数组不是多维的
  10. 查询分析300万笔记录_MySQL之慢查询日志
  11. MMKV_Android数据持久化方案调研-MMKV SP REALM ROOM WCDB...
  12. sniffer抓包工具(中文版+视频教程)
  13. 第一章 绪论 1.2 时域采样定理及其应用
  14. 由ERA5逐小时数据获取逐日数据——三种方法
  15. ATA工厂测试AT_MODE下震动不振问题分析
  16. 为什么亚马逊AWS EC2 ping会不通
  17. GPS与LBS的差别
  18. python监控网站学习笔记2——网页中文乱码
  19. submit 编写python代码
  20. IaaS PaaS SaaS云服务三种应用模式

热门文章

  1. MachineLearning(4)-核函数与再生核希尔伯特空间
  2. 《Python Cookbook 3rd》笔记(1.10):删除序列相同元素并保持顺序
  3. 样式缓存没更新_差点没认出来:Office 2019/365桌面新图标来啦
  4. 程序员生存定律--使人生永动的势能
  5. 显卡天梯图:2014最新显卡性能天梯图
  6. 支撑4.5亿活跃用户的WhatsApp架构概览
  7. 人生历练必备的十个心态(图)
  8. 常见电脑字符编码总结
  9. 对h.264压缩视频码流中i帧的提取(firstime)
  10. 解决浏览器 Provisional headers are shown 无法向后台发送请求问题