1. 环境描述

    某公司有一套系统,2台Windows2003系统,采用自带的群集管理器功能实现双机热备功能,正常情况下,服务器10.1.1.1承载中间件应用服务,服务器10.1.1.2承载数据库服务,仅当其中一台服务器故障时才会把资源切换至另一台。

    系统名称 系统版本 IP地址 备注
    S-EIP-APP Windows2003ENTSP2 10.1.1.1 采用Windows2003自带的群集管理器实现双机热备功能
    S-EIP-DATA Windows2003ENTSP2 10.1.1.2
  2. 故障表现

    某天晚上收到短信告警,系统异常,无法访问。登录系统10.1.1.1查看群集管理器状态,发现服务器10.1.1.2处于脱离群集状态。

  3. 处理和分析过程

    1)远程登录系统10.1.1.1,打开群集管理器,发现“S-EIP-DATA”数据库服务器节点故障,显示“红色叉”,活动资源中的“EAIEIP”、“Oracle Services for MSCS”、“OracleOraDb10g_home1TNSListenerFsloracle-vip”状态处于“失败”,群集管理器尝试把故障自动转移至“S-EIP-APP”节点上,但故障依旧。

    2)把10.1.1.2服务器重启系统尝试解决,问题依旧。

    3)登录到10.1.1.2服务器,查看事件日志,发现告警信息和错误信息:“安全系统检测到一个对服务器DNS/s-xx1.hq.cxxp.xxx的身份验证错误,来自身份验证协议kerbers的失败代码为登录无效,可能原因为无效的用户名或验证消息”,如图:

    4)从上图日志看出,均出现类似“未知的用户名和密码错误”错误。由于Windows2003群集管理器采用AD域进行集中管理,咨询AD域管理员得知,之前有更改过AD域的管理员密码。

    5)此时排查重点为,如何在门户的群集管理器中修改AD域最新的密码。经过查阅官方KB和网上资料,尝试修改群集管理器中的AD域的密码:

    分别登录10.1.1.1和10.1.1.2,修改“服务”中的“cluster service”--登录--修改密码,如图:

    6)修改“cluster service“服务中的密码后,问题依旧,查看群集管理器中的”S-EIP-DATA“中的”Oracle Services for MSCS“仍为失败状态,查看日志得知,仍是用户密码问题,如图:

    7)解决办法:分别修改10.1.1.1和10.1.1.2中的”服务“中的”oracleMSCSServices“登录密码,如图:

    8)修改完成后,群集管理器”S-EIP-DATA“活动资源中的”EAIEIP“资源仍处于失败状态,如图:

    9)从上图报错可以看出,oracle fail safe故障转移群集出现错误用户密码,按照上面的经验,应该为oracle fail safe同样采用的是AD域的管理员密码,尝试修改密码:

    登录10.1.1.2--开始--程序--“oracle-ofs34_home1”--"oracle services for MSCS Security Setup",修改新的AD域管理员密码。

    10)把所有与AD域管理员帐号相关的密码更改成与AD域一致后,问题解决,群集管理器功能正常,业务恢复正常。

  4. 故障原因

    由于系统在前期规划时,直接采用了AD域域管理员的用户密码进行管理,而由于AD域服务器的域管理员密码修改,但在该系统没有做相应的更改,从而导致了本次故障的发生。

转载于:https://blog.51cto.com/luweikai/1711628

记一次AD域域管理员密码更改导致某系统群集管理器故障排查解决过程相关推荐

  1. linux启动grub密码,如何为GRUB系统引导管理器加上密码 | LinuxSir.Org

    作者:北南南北 来自:LinuxSir.Org 摘要:本文主要是讲述就如何为GRUB系统引导管理器加上密码,只要输入密码才能使用GRUB来引导系统:仅限于桌面系统上的应用,不能用 于远程管理的服务器上 ...

  2. 计算机需要管理员密码,如何实现 Windows 系统在安装 / 卸载软件时要求输入管理员密码?...

    准备工作:本教程适用Windows XP / Windows 7 / Windows 10.首先为以上系统的管理员账号设置密码.参考 win7如何修改administrator密码_百度经验 1. 打 ...

  3. 服务器站点解密出错,修改域超级管理员密码后站点复制出错。

    这个是repadmin检查结果: C:\Users\administrator.123>repadmin /kcc Repadmin: 针对所有 DC localhost 运行命令 /kcc S ...

  4. mimikatz实战域渗透抓取域控管理员密码

    实验环境: 攻击机:Kali 靶 机:Windows server 2012 工具:mimikatz2.1 这里实验所需要的工具我会上传到我的资源里面,有需要的小伙伴可以自己去下载 条件:靶机获取到s ...

  5. 统一变更域本地管理员密码

    策略:计算机配置-策略-Windows设置-脚本-启动 脚本:井号内为脚本内容 ################################### @echo off net user leade ...

  6. Mysql 忘记管理员密码更改

    对管理员设置密码 第一种方式: #mysqladmin -u root password 'new-password'; #mysqladmin -u root -h localhost passwo ...

  7. 记一次library cache lock/library cache pin导致的函数编译hang住分析及处理过程

    墨墨导读:业务在进行alter function my_function_name compile时,有两个函数编译无法通过,现象就是会hang住,这里分享处理的整个过程. 一.前言 业务在进行alt ...

  8. 记一次MongoDB故障排查的过程

    数据技术嘉年华等你来 预告:11.16-17日,北京市东三环中路61号富力万丽酒店,相聚数据技术嘉年华,(99元票务)免费购票倒计时,点击查看大会详情. 张甦老师带来主题"双剑合璧带你走进M ...

  9. 记一次生产大对象导致的OOM让架构师连夜排查解决

    为何半夜告警电话狂打不停,为何上线用户投诉不断,是道德的沦丧还是人性的扭曲,NO,是代码的缺陷. Java8的JVM内存管理中,大对象生成直接放入老年代的,当老年代空间不足,就会进行FullGC,频繁 ...

最新文章

  1. Oracle Enterprise Manager 11g: Empowering IT to Drive Business Value
  2. ==与equals 的使用比较
  3. ansible内置模块
  4. 前端学习(83):按显示进行分类
  5. SIP与RTP综合应用5-RTP解包过程
  6. 通道控制方式,通道指令与通道程序
  7. debian8.7.1安装zabbix3.2
  8. php单例模式与工厂模式
  9. html颜色趋势,展望下一年的网页设计配色趋势
  10. axios 封装数据请求
  11. 杭电计算机考研比率,杭州电子科技大学考研的难度大吗
  12. OSChina 周四乱弹 —— 月中发工资还没到家……
  13. STM32项目分享---MQTT智能门禁系统(含APP控制)
  14. Jni native java.lang.UnsatisfiedLinkError:No implementation found for boolean com.xxx.xxx.jni.init()
  15. 在阿里云或腾讯云配置微信小程序
  16. 楼天成男人8题(树的分治-POJ1741)
  17. 永磁同步电机(PMSM)参数辨识(一)
  18. 基于知识图谱的学术资源推荐系统设计与实现
  19. python屏幕取词getword_GetWord Demo(屏幕取词软件)
  20. 华为音频编辑服务,助力开发者高效创新

热门文章

  1. java学习日记(9)———socket,网络编程的学习
  2. AndroidStudio_使用gradle添加依赖jar包_依赖模块---Android原生开发工作笔记78
  3. npm的安装和更新---npm工作笔记002
  4. Got error 28 from storage engine的错误怎么办
  5. 在NPP运行Python报错:SyntaxError: Non-ASCII character '\xe5' in file的解决方法
  6. torch将多个tensor张量合并为一个张量,只提高迷你批次的纬度
  7. 计算机网络通信的基本原理概论,计算机网络
  8. laravel无法运行php,Laravel:php artisan服务无法启动
  9. java定时运行一个url_Swift 4:如何异步使用URLSessionDataTask但请求是否在一个定时队列中?...
  10. 川大计算机生物学怎么样,四川大学生物信息学初试经验分享