展开全部

如何分析这种问题了?先看62616964757a686964616fe59b9ee7ad9431333363373832系统日志,像他这个是HP-UX,那么系统日志为/var/log/syslog/syslog.log,AIX是errpt

在系统日志中,我看到:

Nov 11 18:43:57 rx8640c syslog: Oracle CSS family monitor shutting down. 3

Nov 11 18:43:59 rx8640c su: + tty?? root-oracle

Nov 11 18:43:59 rx8640c syslog: Cluster Ready Services completed waiting on dependencies.

在对比ALERT日志,发现系统基本是在这个时候重启的

Wed Nov 11 18:43:28 2009

Trace dumping is performing id=[cdmp_20091111184328]

Wed Nov 11 18:57:17 2009

Starting ORACLE instance (normal)

LICENSE_MAX_SESSION = 0

LICENSE_SESSIONS_WARNING = 0

如果是AIX系统,可以用last shutdown看看,HP我不知道是不是这个

这里,在syslog.log中可以看到,CSS进程shutdown(这个意思是偶猜的),CSS关闭或异常,会自动重启主机,符合现在的情况

接下来就是分析ORA_CRS_HOME中的ocssd日志了

[ CSSD]2009-11-11 18:39:18.460 [13] >WARNING: clssgmAssignMemberNo(): grock(#CSS_CLSSOMON) memberNo(1) already assigned

[ CSSD]2009-11-11 18:39:34.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 50% heartbeat fatal, eviction in 14.807 se

conds

[ CSSD]2009-11-11 18:39:35.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 50% heartbeat fatal, eviction in 13.807 se

conds

[ CSSD]2009-11-11 18:39:42.313 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 75% heartbeat fatal, eviction in 6.807 sec

onds

[ CSSD]2009-11-11 18:39:45.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) is impending reconfig

[ CSSD]2009-11-11 18:39:45.314 [14] >TRACE: clssnmPollingThread: diskTimeout set to (27000)ms impending reconfig status(1)

[ CSSD]2009-11-11 18:39:46.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) is impending reconfig

[ CSSD]2009-11-11 18:39:46.314 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 90% heartbeat fatal, eviction in 2.807 sec

onds

[ CSSD]2009-11-11 18:39:47.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) is impending reconfig

[ CSSD]2009-11-11 18:39:47.314 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 90% heartbeat fatal, eviction in 1.807 sec

onds

[ CSSD]2009-11-11 18:39:48.313 [14] >TRACE: clssnmPollingThread: node rx8640c (1) is impending reconfig

[ CSSD]2009-11-11 18:39:48.314 [14] >WARNING: clssnmPollingThread: node rx8640c (1) at 90% heartbeat fatal, eviction in 0.807 sec

onds

[ CSSD]2009-11-11 18:39:49.133 [14] >TRACE: clssnmPollingThread: node rx8640c (1) is impending reconfig

[ CSSD]2009-11-11 18:39:49.134 [14] >TRACE: clssnmPollingThread: Eviction started for node rx8640c (1), flags 0x000f, state 3,

这个日志信息很明显了,私有网络心跳丢失,节点被驱除

至于为什么私有网络出现问题,心跳丢失,我想这个不是DBA能处理的了,写个报告丢给管网络的去看吧

另外提下,可能造成节点重启的进程有3个,OCSSD,OPROCD,OCLSOMON

一般的,OCSSD的原因就是心跳丢失(网络心跳或者投票磁盘出现问题)和CSS进程请求不到CPU资源和BUG;OPROCD,OCLSOMON的原因是进程请求不到CPU资源和BUG

他这里在节点重启前,还顺便报了个600错误

Wed Nov 11 18:43:27 2009

Errors in file /oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_24884.trc:

ORA-00600: internal error code, arguments: [keltnfy-ldmInit], [46], [1], [], [], [], [], []

确认是个Bug 5486074

ORA-600 [keltnfy-ldminit] can occur in the Server Generated Alert

subsystem when it cannot determine the Host Name or

Network Address. This can be caused by DNS server being unaavilable.

查了下,没说这个错误会导致CSS死亡,主机重启的,而该错误应该是客户端报出来的。。。

至少说可以确认网络出现过问题

启动的时候,报错

Wed Nov 11 18:58:06 2009

Errors in file /oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_7203.trc:

ORA-00600: internal error code, arguments: [ksprlspeeq3], [65536], [], [], [], [], [], []

Wed Nov 11 18:58:07 2009

Errors in file /oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_7203.trc:

ORA-07445: exception encountered: core dump [kgscDump()+801] [SIGSEGV] [Address not mapped to object] [0x000001004] [] []

ORA-00600: internal error code, arguments: [ksprlspeeq3], [65536], [], [], [], [], [], []

Wed Nov 11 18:58:08 2009

Errors in file /oracle/app/oracle/admin/ora10g/udump/ora10g1_ora_7203.trc:

ORA-07445: exception encountered: core dump [kgscDump()+801] [SIGSEGV] [Address not mapped to object] [0x000001004] [] []

ORA-07445: exception encountered: core dump [kgscDump()+801] [SIGSEGV] [Address not mapped to object] [0x000001004] [] []

ORA-00600: internal error code, arguments: [ksprlspeeq3], [65536], [], [], [], [], [], []

ORA-07445[kgscDump]对应有个Bug 5508574 - OERI[504] / OERI[99999] / Dump [kgscdump] with > 31 CPUs,可是系统只有15C,30核。

ORA-00600[ksprlspeeq3]这个没找到10203相关的BUG,先也懒的管了

推荐一个METALINK的note:4.1,这个就是以前的knowledge,里面有很多归类的文章,和一些工具的列表

已赞过

已踩过<

你对这个回答的评价是?

评论

收起

oracle11g 磁盘心跳_31串口心跳和磁盘心跳的区别相关推荐

  1. 磁盘与文件系统管理( 认识磁盘,了解磁盘,文件系统的建立与自动挂载)

    文章目录 磁盘与文件系统管理 磁盘结构及分区表示 硬盘的结构 硬盘的接口 磁盘分区表示 MBR介绍 fdisk 命令–查看或管理磁盘分区 mkswap命令 磁盘分区的表示 linux系统文件类型 EX ...

  2. linux 存储映射lun 给_在Linux中针对物理磁盘和LUN映射Oracle ASM磁盘

    本文可帮助你查找哪个ASM磁盘映射到哪个Linux分区或DM设备. 前言 如果你作为Linux管理员长时间退出工作,你可能已经了解了ASM,Device Mapper Multipathing(DM- ...

  3. linux显示磁盘使用情况命令,Linux显示磁盘使用率信息(iostat)

    使用 iostat 命令可以报告有关磁盘输入和输出的统计信息,以及生成对吞吐量.使用率.队列长度.事务速率和服务时间的测量值. 如何显示磁盘使用率信息 (iostat) 使用 iostat 命令和时间 ...

  4. linux 重新分区挂载,Linux:挂载磁盘分区,linux已挂载磁盘重新分区

    Linux:挂载磁盘分区,linux已挂载磁盘重新分区 查看挂载的分区 df 命令主要用来了解系统中已经挂载的各个文件系统的磁盘使用情况. 常用选项: "-h" ,显示更易读的容量 ...

  5. linux+平均磁盘请求数量_SUSE LINUX下磁盘IO性能监测分析

    这两天发现一台测试用的服务器经常负载很高,但cpu和内存消耗却很少,很是奇怪,经过诊断发现是由于大容量的测试数据导致高并发下的磁盘IO消耗比较大,由于缓存是小文件并且数量比较大,所以并发比较高的情况下 ...

  6. 三周第五次课) 4.5/4.6 磁盘格式化 4.7/4.8 磁盘挂载 4.9 手动增加swap空间

    三周第五次课 4.5/4.6 磁盘格式化 4.7/4.8 磁盘挂载 4.9 手动增加swap空间 4.5/4.6 磁盘格式化 cat /etc/filesystems 查看文件格式 (win系统的格式 ...

  7. 计算机硬盘清理,电脑磁盘清理,详细教您电脑磁盘怎么清理

    电脑上积累了许多垃圾后,就会变得十分卡.很多人都有这样的感受,随着电脑使用时间段的增长,电脑中的碎片越来越多,垃圾也越来越多,一些不必要的程序也在干扰着电脑的运行,那电脑磁盘怎么清理?下面,小编跟大家 ...

  8. 磁盘操作系统是计算机语言吗,实时磁盘操作系统

    实时磁盘操作系统(Realtiml Disc Operating System)简写为RDOS.RDOS是一个具有实时处理功能的,可对磁盘文件信息进行分级管理的操作系统,它允许前.后台两道作业程序并行 ...

  9. mysql 磁盘组_有效管理 ASM 磁盘组空间

    ORA-15041: diskgroup space exhausted 对您的数据库环境的直接和间接影响?与 ASM 磁盘组相关的磁盘空间问题和 ORA-15041 错误会 ORA-15041: d ...

最新文章

  1. Automatic Summarization of Bug Reports
  2. Jsp之五 过滤器与监听器
  3. C\C++对文件的读写操作
  4. Jmeter基础之JMeter参数化补充练习
  5. Squid Analyzer 5.1 发布,Squid日志统计
  6. 装饰者模式 (decorator pattern)
  7. 油炸锅EN/IEC60335 CE认证标准介绍
  8. 微信小程序实现登录注册页面
  9. eclipse 连接mysql 数据库 实现数据库基本操作
  10. 维纳滤波法matlab代码,完整的维纳滤波器Matlab源程序
  11. 在有位图索引的表上进行DML操作与enq: TX - row lock contention等待事件问题分析
  12. OTSU算法(大津法—最大类间方差法)原理及实现
  13. 抖音小程序开发所遇到的问题
  14. 论文写作学习心得体会
  15. 高级程序员到底长什么样子?
  16. 阅读小结:MSR:From Captions to Visual Concepts and Back
  17. java-网页404(个例)
  18. 适用于渗透测试不同阶段的工具收集整理(转载)
  19. 软件考试:89个系统相关的基本概念
  20. 进销存是什么意思?值得推荐的进销存软件有哪些?

热门文章

  1. Epic安装新Epic Online Services内部模块报错EOS-ERR-1603解决
  2. You may wish to exclude one of them to ensure predictable runtime behavior
  3. Gitblit搭建及Git协作开发流程
  4. JavaScript脚本延迟加载的方式有哪些
  5. 单链表实现一元多项式相加
  6. win系统丝滑迁移/系统故障修复
  7. 一款好用的文本编辑器KindEditor+PHP
  8. CAD图案复制到Excel里面怎么去掉空白部分?如何在CAD中绘制常用的标高符号?
  9. 装机员Ghost Win10 RS1 1607 64位装机贺岁版2017
  10. lvs dr 模型配置详解