记一次Oracle Clusterware安装成功后的故障处理

1. 环境

[grid@rac1 rac1]$ cat /etc/issue

Red Hat Enterprise Linux Server release 5.8 (Tikanga)

Kernel \r on an \m

2. 问题描述

在安装RAC的过程中, 成功安装好grid (clusterware) 后关闭了各节点. 在下次开启各节点后, 检查crs资源状态, 出现如下错误:

[grid@rac1 ~]$ crs_stat -t -v

CRS-0184: Cannot communicate with the CRS daemon.

3. 分析解决检查crs状态:

[grid@rac1 ~]$ crsctl check crs

CRS-4638: Oracle High Availability Services is online

CRS-4535: Cannot communicate with Cluster Ready Services  # 无法与CRS通信

CRS-4529: Cluster Synchronization Services is online

CRS-4533: Event Manager is online

查看crsd对应日志:

2014-11-21 15:18:13.490: [GIPCXCPT][1002185440] gipcShutdownF: skipping shutdown, count 2, from [ clsinet.c : 1732], ret gipcretSuccess (0)

2014-11-21 15:18:13.492: [GIPCXCPT][1002185440] gipcShutdownF: skipping shutdown, count 1, from [ clsgpnp0.c : 1021], ret gipcretSuccess (0)

2014-11-21 15:18:13.498: [  OCRASM][1002185440]proprasmo: Error in open/create file in dg [DATA] # 打开磁盘组失败

[  OCRASM][1002185440]SLOS : SLOS: cat=7, opn=kgfoAl06, dep=15077, loc=kgfokge

ORA-15077: could not locate ASM instance serving a required diskgroup  # 没有ASM实例

2014-11-21 15:18:13.498: [  OCRASM][1002185440]proprasmo: kgfoCheckMount returned [7]

2014-11-21 15:18:13.498: [  OCRASM][1002185440]proprasmo: The ASM instance is down # ASM实例处于关闭状态

2014-11-21 15:18:13.499: [  OCRRAW][1002185440]proprioo: Failed to open [+DATA]. Returned proprasmo() with [26]. Marking location as UNAVAILABLE.

2014-11-21 15:18:13.499: [  OCRRAW][1002185440]proprioo: No OCR/OLR devices are usable

2014-11-21 15:18:13.499: [  OCRASM][1002185440]proprasmcl: asmhandle is NULL

2014-11-21 15:18:13.499: [  OCRRAW][1002185440]proprinit: Could not open raw device

2014-11-21 15:18:13.499: [  OCRASM][1002185440]proprasmcl: asmhandle is NULL

2014-11-21 15:18:13.499: [  OCRAPI][1002185440]a_init:16!: Backend init unsuccessful : [26]

2014-11-21 15:18:13.499: [  CRSOCR][1002185440] OCR context init failure.  Error: PROC-26: Error while accessing the physical storage ASM error [SLOS: cat=7, opn=kgfoAl06, dep=15077, loc=kgfokge

ORA-15077: could not locate ASM instance serving a required diskgroup

] [7]

2014-11-21 15:18:13.499: [    CRSD][1002185440][PANIC] CRSD exiting: Could not init OCR, code: 26

2014-11-21 15:18:13.499: [    CRSD][1002185440] Done.

日志信息表明, ASM实例未能启动, 导致crsd进程无法启动

尝试手动启动ASM实例:

[grid@rac1 ~]$ asmcmd

Connected to an idle instance.

ASMCMD> startup

ORA-27154: post/wait create failed

ORA-27300: OS system dependent operation:semget failed with status: 28

ORA-27301: OS failure message: No space left on device

ORA-27302: failure occurred at: sskgpsemsper

Connected to an idle instance.

上述信息表明, 失败的操作是semget.

semget的任务是获得信号量集(get set of semaphores), 这里的No space left on device并不是指存储空间,而是信号量资源.

检查系统中的信号量使用情况:

[grid@rac1 ~]$ ipcs

------ Shared Memory Segments --------

key        shmid      owner      perms      bytes      nattch     status

0x00000000 3407873    root      644        80         2

0x00000000 3440643    root      644        16384      2

0x00000000 3473412    root      644        280        2

------ Semaphore Arrays --------

key        semid      owner      perms      nsems

------ Message Queues --------

key        msqid      owner      perms      used-bytes   messages

未发现异常. 继续检查内核参数中的semmns:

root@rac1 ~]# sysctl -a|grep sem

kernel.sem = 250    100    32    128

四个参数分别为:

semmsl---每个信号集包含的信号数,该值应比ORACLE进程的最大数大10左右

semmns---系统中的信号数

semopm---每个信号操作呼叫的最大操作数

semmni---信号集标识符数,用于控制可随时创建的信号集数

加大系统中的信号量(/etc/sysctl.conf):

kernel.sem = 256 32768 100 228

重新启动ASM实例:

ASMCMD> startup

ORA-03113: end-of-file on communication channel

Connected to an idle instance.

因着急继续做实验, 此时直接对两个节点进行了重新启动, 重启后ASM实例正常启动, crs资源状态正常, 问题得到解决.

后来实验结束后查询ORA-03113, 导致该错误的可能原因有:

1) Unix核心参数设置不当

2) Oracle执行文件权限不正确/环境变量问题

3) 客户端通信不能正确处理

4) 数据库服务器崩溃/操作系统崩溃/进程被kill

5) Oracle 内部错误

6) 特定SQL、PL/SQL引起的错误

7) 空间不够

8) 防火墙的问题

但因错误环境已消失, 未能排查解决, 很是遗憾, 仅留做以后参考.

4. 参考2) [ASM启动报错ORA-27300, ORA-27301 and ORA-27302: failure occurred at: sskgpsemsper]

3) [DBA手记:共享内存无法正常释放的处理]

4) [ORA-03113: end-of-file on communication channel 错误定位过程]

[原文链接:http://www.cnblogs.com/tjm-1990/p/4114384.html]

oracle 4535,记一次Oracle Clusterware安装成功后的故障处理相关推荐

  1. MySQL后初次密码_mysql第一次安装成功后初始化密码操作步骤

    把文件解压到一个目录下 这是解压后的目录 将my.ini文件考进去 双击打开my.ini 找到这两行更改成自己的解压路径保存 右键此电脑属性 找到高级系统设置配置环境变量 环境变量 新建 变量值是解压 ...

  2. mysql 初始化_mysql第一次安装成功后初始化密码操作步骤

    把文件解压到一个目录下 这是解压后的目录 将my.ini文件考进去 双击打开my.ini 找到这两行更改成自己的解压路径保存 右键此电脑属性 找到高级系统设置配置环境变量 环境变量   新建 变量值是 ...

  3. 未找到文件 服务器可能无此更新包文件,win7安装xampp提示windows找不到-n文件(安装成功后,443端口占用,apache服务器无法正常启动)的解决方案...

    1. 环境:win7 64位安装xampp 32位. 2. 安装过程最后,报错,提示windows找不到-n文件.以及说没有安装Microsoft Visual C++ 2008 Redistribu ...

  4. androidx86安装pc后无法联网_问题解决记录-npm和yarn全局安装成功后命令无法执行的问题...

    问题描述: 使用命令npm i -g xxx安装成功后无法执行被安装的命令,比如安装yarn npm i -g yarn 执行上面的命令安装成功yarn以后执行的时候提示,command not fo ...

  5. magento本地安装成功后无法进入后台,密码和用户名均正确 .

    magento本地安装成功后无法进入后台,密码和用户名均正确 . 解决方法一: 这是一个cookie问题,使用firefox等非IE核心浏览器可以解决这个问题.虽然浏览器处理cookie的方式很相似但 ...

  6. fiddler和xampp安装成功后,网站打不开的原因

    fiddler和xampp安装成功后,网站打不开,出现403的错误 解决办法 编辑httpd.conf文件注释掉以下代码 #AllowOverride none # Require all denie ...

  7. npm 安装yarn_问题解决记录-npm和yarn全局安装成功后命令无法执行的问题

    问题描述: 使用命令npm i -g xxx安装成功后无法执行被安装的命令,比如安装yarn npm i -g yarn 执行上面的命令安装成功yarn以后执行的时候提示,command not fo ...

  8. OVM虚拟化平台安装成功后初始化配置方法!

    为什么80%的码农都做不了架构师?>>>    对于首安装OVM用户,在OVM平台安装成功后,第一次登陆出现无法登陆的状况!​ OVM管理平台在成功安装后,必需进行admin初始化设 ...

  9. Matlab2018a安装成功后,打开出现licensing error:-8523

    文章目录 1.问题描述 2.问题解决 1.问题描述 Matlab2018a安装成功后,打开出现licensing error:-8523: 2.问题解决 将桌面自动创建的matlab的快捷方式删除,找 ...

最新文章

  1. session_start() 对 HTTP_REQUEST扩展/fsockopen函数 的影响
  2. 使用IntelliJ IDEA11创建Java Web程序
  3. SMPP Java示例(客户端)
  4. Leecode 136. 只出现一次的数字
  5. 搭建LAMP环境的过程详细总结
  6. “Redirect to SMB”漏洞影响所有版本的Windows
  7. java数据返回到界面,java后台获取网页ajax数据和返回数据简单源码
  8. 2018年手机摄像头模组市场调研报告
  9. 随机数插入排序c 语言,C语言程序设计100例之(22):插入排序
  10. 创建者模式 -- 工厂模式
  11. 调试wifi简单记录
  12. 14.使用 CSS 显示 XML
  13. dreamweaver序列号免费_dreamweaver8【dreamweaver8序列号】dreamweaver8注册码序列号简体中文版...
  14. 很详细的解决Tomcat乱码问题
  15. 7-ELEVEn 便利店 EDI 概览
  16. 基于智能电网的电力线载波通信研究
  17. 09、Flutter FFI Dart Native API
  18. windows无法连接到某个wifi_Windows无法连接到无线网络的解决办法
  19. 在电脑上怎么做报表新手_自己怎样在电脑上制作表格
  20. linux vi打不开文件,在Linux中使用vi/vim打开一个文件时出现的的问题

热门文章

  1. iPhone屏幕投射到Mac的解决方案
  2. (附源码)springboot小区物业管理系统 毕业设计 101409
  3. 学好英语网源代码及图片
  4. Java准确获取Word/Excel/PPT/PDF的页数(附Word页数读不准的处理办法)
  5. 基于百度EasyDL定制化图像识别平台的海洋鱼类识别方法
  6. 这一次,Windows 站起来了:Windows ​ Linux 的性能 Battle
  7. 联发科物联网芯片型号处理器大全资料介绍
  8. 关于位图数据和标记位-P3
  9. 阿富汗-天灾与人祸的荒野[天声人语2009年8月25日(火)]
  10. 斯坦福学者让太阳能电池在夜间发电,功率可达50毫瓦/平方米