最常见的5个导致节点重新启动、驱逐或 CRS 意外重启的问题
Applies to:
Oracle Database - Enterprise Edition - Version 10.1.0.2 to 11.2.0.3 [Release 10.1 to 11.2]
Information in this document applies to any platform.
本文章简要概述了导致节点重新启动或者 CRS 意外重启的几个最常见问题
Details
问题 1:节点重新启动,但是日志文件未显示任何错误或原因。
1) 如果 CRS 版本为 11.1 或者更低,请将 diagwait 设置为 13。
2) 如果平台为 AIX,请参照文章 811293.1(RAC and Oracle Clusterware Best Practices and Starter Kit (AIX))中所建议的方法优化 AIX VM 参数。
3) 如果平台为 Linux,请设置 Hugepage 并将内核参数 vm.min_free_kbytes 设置为保留“512MB”,将 swappiness 设置为 100。
请注意,使用 Hugepage 时无法设置 memory_target。
4) 检查是否有大量内存分配给了操作系统的 IO 缓冲区高速缓存。与 OS 供应商联系,建议一些方法来减少 IO 缓冲区高速缓存量,或者增加从 IO 缓冲区高速缓存回收内存的比率。
5) 增加内存量。
问题 2:节点重新启动,该节点是由于丢失网络心跳而被逐出。
这是因为丢失网络心跳或 发生了脑裂。在双节点环境中,节点 2 的重复重新启动通常意味着节点 2 由于 脑裂 而被驱逐。在节点重新启动前,ocssd.log 会显示丢失网络心跳或一条脑裂消息。
问题 3:在出现存储问题后节点重新启动。
ocssd.log 文件显示节点因为无法访问大部分 voting disks 而重新启动。
问题 4:asm 或数据库实例被挂起或驱逐后节点重新启动。
正常运行节点的 ocssd.log 显示一个 member kill 请求升级到了 node kill 请求。
问题 5:CRS 自动重启,但是节点没有重新启动
References
NOTE:341788.1 - Recommendation for the Real Application Cluster Interconnect and Jumbo Frames
NOTE:1050693.1 - Troubleshooting 11.2 Clusterware Node Evictions (Reboots)
NOTE:265769.1 - Troubleshooting 10g and 11.1 Clusterware Reboots
NOTE:452326.1 - Linux Kernel Lowmem Pressure Issues and Kernel Structures
NOTE:811293.1 - RAC and Oracle Clusterware Best Practices and Starter Kit (AIX)
最常见的5个导致节点重新启动、驱逐或 CRS 意外重启的问题相关推荐
- oracle_最常见的 5 个导致节点重新启动、驱逐或 CRS 意外重启的问题
oracle_最常见的 5 个导致节点重新启动.驱逐或 CRS 意外重启的问题 Purpose Scope Details 问题 1:节点重新启动,但是日志文件未显示任何错误或原因. ...
- oracle集群断电重启,Oracle10.2.0.4 RAC 2节点集群节点被驱逐导致系统异常重启
oracle 10.2.0.4 redhat 5.4 linux OCSS.LOG日志: 1.正常的节点2 [ CSSD]2013-12-03 15:07:52.100 [1258428736 ...
- 下载丨云和恩墨技术通讯:OCR无法正常读取导致节点宕机
墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了<云和恩墨技术通讯>,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考.同时,我们也 ...
- Hadoop多次format格式化会导致节点的clusterID不一致
1. 使用环境 vmware配置的3个Centos7虚拟机,一个master,2个slave 2. 问题描述 hadoop 多次格式化format namenode 导致节点不能启动 出现这个问题的原 ...
- 模拟私网问题导致节点宕机无法启动
模拟私网问题导致节点宕机无法启动 目的 分析过程 GI alert日志 os日志 ocssd.log 日志 参考文档 目的 本文章通过模拟私网问题,导致集群节点宕机,来进行日志分析. # ifconf ...
- 精华阅读第 13 期 |常见的八种导致 APP 内存泄漏的问题 1
2019独角兽企业重金招聘Python工程师标准>>> 本期是移动开发精英俱乐部的第13期文章,都是以技术为主,所以这里就不过多的进行赘述了,我们直接看干货内容吧!本文系ITOM管理 ...
- oracle重启root,案例:Oracle报错ORA-15025 ORA-27041 root用户操作rac导致节点宕机
天萃荷净 运维DBA反映Oracle RAC环境中节点宕机,alert发现报错ORA-15025 ORA-27041,分析原因为使用root用户操作rac导致节点宕机 接到同事请求,说客户的linux ...
- Oracle显示表裂开,【案例】Oracle RAC脑裂导致节点重启原因分析
天萃荷净 Oracle研究中心案例分析:运维DBA反映Oracle RAC重启,分析原因为脑裂导致,结合日志分析产生原因. 本站文章除注明转载外,均为本站原创: 转载自love wife & ...
- k8s驱逐篇(3)-kubelet节点压力驱逐-源码分析篇
kubelet节点压力驱逐-概述 kubelet监控集群节点的 CPU.内存.磁盘空间和文件系统的inode 等资源,根据kubelet启动参数中的驱逐策略配置,当这些资源中的一个或者多个达到特定的消 ...
最新文章
- Android -- 贝塞尔使圆渐变为桃心
- python如何实现多进程_Python实现多进程的四种方式
- 服务的实例已在运行中_亚马逊首次把macOS引入云服务
- android或java timer声明
- Python 正则表达式-问号的四种用法
- mysql随机显示记录_MySQL随机读取表中记录
- [原创] GSM/GPRS 以及CDMA区分以及相关模块选型
- 【caffe-Windows】cifar实例编译之model的使用
- MySQL索引的Index method中btree和hash的区别
- com.alibaba.druid.pool.DruidDataSource : testWhileIdle is true, validationQuery not set
- Eclipse直接运行算法第4版例子(重定向和读取指定路径文件)
- CoreAnimation汇总
- javascript测试框架 Mocha 实例教程
- html的兼容有哪些,HTML里需要兼容验证的浏览器有哪些
- Eclipse日常踩坑记录——导入文件时遇到的几个问题
- ASP.NET URL Routing
- nohup java -jar
- UI app界面的尺寸规范
- opencv mat与cvmat, iplimage转换
- Aurora Engine 游戏引擎入门 21(统一渲染架构 FIXED)
热门文章
- WhoIsOnline ;) - 解读CNForum源码中在线用户统计
- java根据表名取出字MySQL_mysql取得数据库所有表名和字段注释_MySQL
- lisp一键室内标注_LISP-标注的自动位置调整
- python线程按照顺序执行_Python3多线程之间的执行顺序问题
- 监管码服务器维修,云风的 BLOG
- 简单的签到代码_签到功能,用 MySQL 还是 Redis ?
- 卧式储罐液位体积计算公式excel_2020晋中化工防腐储罐订做欢迎来电-环保设备...
- win7为什么打开桌面上的计算机很卡很慢,如何解决win7系统电脑反应慢
- 服务器日志监控系统怎么解决,服务器日志监控系统
- java 中特殊的_Java中一些特殊关键字