近期,有一用户的RAC环境反映业务缓慢;排查数据库日志发现有报错ORA-00239: timeout waiting for control file enqueue: held by 'inst 2, osid 7591' for more than 900 seconds;检查当时系统负载非常低;通过alert日志中报错的进程(这里是inst 2, osid 7591),查出持有control file enqueue的为LGWR进程;进一步排查LGWR进程TRACE日志,可以发现有大量IO缓慢的提示。

在此前提下,排查OS日志,也有些磁盘的报错信息;进一步与硬件维护人员排查确认,通过更换主机的HBA卡,之后系统恢复正常。

相关日志如下:

1.ALERT日志中的ORA-00239: timeout waiting for control file enqueue信息
Sat Feb 19 21:47:36 2022
Errors in file /u01/app/oracle/diag/rdbms/orcl/orcl1/trace/orcl1_arc0_8317.trc  (incident=1154998):
ORA-00239: timeout waiting for control file enqueue: held by 'inst 2, osid 7591' for more than 900 seconds
Incident details in: /u01/app/oracle/diag/rdbms/orcl/orcl1/incident/incdir_1154998/orcl1_arc0_8317_i1154998.trc
opidrv aborting process ARC0 ospid (8317) as a result of ORA-603
Sat Feb 19 21:47:37 2022
Sweep [inc][1154998]: completed
Sweep [inc2][1154998]: completed
Sat Feb 19 21:52:52 2022
Suspending MMON slave action ketbgact_ for 82800 seconds
Sat Feb 19 21:53:55 2022
Suspending MMON action 'undo usage' for 82800 seconds2.检查数据库中持有锁的进程信息[oracle@CRXJ-DB-2 ~]$ cd /u01/app/oracle/diag/rdbms/orcl/orcl2/trace
[oracle@CRXJ-DB-2 trace]$ ls *7591*
orcl2_lgwr_7591.trc  orcl2_lgwr_7591.trm
[oracle@CRXJ-DB-2 trace]$ ls -al orcl2_lgwr_7591.trc
-rw-r----- 1 oracle asmadmin 748774 Feb 19 20:00 orcl2_lgwr_7591.trc
3.查看LGWR进程TRACE信息
[oracle@CRXJ-DB-2 trace]$ tail -n 50 orcl2_lgwr_7591.trc
…………*** 2022-02-19 17:02:47.221
Warning: log write elapsed time 837ms, size 1KB(set event 10468 level 4 to disable this warning)*** 2022-02-19 19:10:58.951
Warning: log write elapsed time 516ms, size 1058KB(set event 10468 level 4 to disable this warning)*** 2022-02-19 19:22:50.852
Warning: log write elapsed time 534ms, size 0KB(set event 10468 level 4 to disable this warning)*** 2022-02-19 20:00:55.692
Warning: log write broadcast wait time 3354ms(set event 10468 level 8 to disable this warning)4.查看操作系统日志:Feb 20 13:00:48 crxj-db-2 kernel: 6>sd 3:0:0:16: [sdq] Sense Key : Illegal Request [current]
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:16: [sdq]
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:10: [sdk] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:10: [sdk] Sense Key : Illegal Request [current]
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:10: [sdk] <<vendor>> ASC=0x94 ASCQ=0x1<<vendor>> ASC=0x94 ASCQ=0x1ASC=0x94 ASCQ=0x1
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:16: [sdq] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00
Feb 20 13:00:48 crxj-db-2 kernel: end_request: I/O error, dev sdq, sector 0
Feb 20 13:00:48 crxj-db-2 kernel: ASC=0x94 ASCQ=0x1
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:10: [sdk] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00
Feb 20 13:00:48 crxj-db-2 kernel: end_request: I/O error, dev sdk, sector 0
…………
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:18: [sds] Sense Key : Illegal Request [current]
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:18: [sds] <<vendor>> ASC=0x94 ASCQ=0x1ASC=0x94 ASCQ=0x1
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:18: [sds] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00
Feb 20 13:00:48 crxj-db-2 kernel: end_request: I/O error, dev sds, sector 0
Feb 20 13:00:48 crxj-db-2 kernel: [current]
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:2: [sdc] <<vendor>> ASC=0x94 ASCQ=0x1ASC=0x94 ASCQ=0x1
Feb 20 13:00:48 crxj-db-2 kernel: sd 3:0:0:2: [sdc] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00

RAC环境报错ORA-00239: timeout waiting for control file enqueue排查相关推荐

  1. STARTUP报错:ORA-00205: error in identifying control file, check alert log for more info

    问题描述 startup nomount没有异常 startup mount则出现异常,说明控制文件出错

  2. Oracle 11G R2 RAC 启动报错:ORA-01078 ORA-01565 ORA-17503 ORA-12547 处理方法

    Oracle 11G R2 RAC 启动报错:ORA-01078 ORA-01565 ORA-17503 ORA-12547 处理方法 前几天搭建的RAC测试环境:RedHat 6.8   grid ...

  3. mysql 5.6 主主复制_Percona MySQL 5.6 主主复制环境报错Got fatal error 1236 from master.....

    Percona MySQL 5.6 主主复制环境报错: mysql> show slave status\G *************************** 1. row ******* ...

  4. php5.6.30环境报错Call to undefined function ImageCreate() 编译安装 gd库

    php5.6.30环境报错Call to undefined function ImageCreate() 编译安装 gd库发现php5.6.30没有加载gd库[root@cn_vs_web04:/u ...

  5. Gym导入Atari游戏环境报错

    由于Gym近期版本的更新,导致程序中 import Atari的游戏环境报错.Gym最新版本 0.21.0 虽然修复了一系列更新后的Bug,但是貌似只支持 Python 3.7及以上版本.于是为了能够 ...

  6. oracle 10g rac数据库,oracle 10g rac安装报错集锦

    oracle 10g rac安装报错汇总 删除crs 1.      停止资源:关闭crs资源:crsctl stop resources 关闭crs:       crsctl stop crs 2 ...

  7. vue3 全局注册app.config.globalProperties, 如何处理getCurrentInstance 上下文线上环境报错

    vue3挂载全局属性和方法,使用app.config.globalProperties, 但是在组件中获取全局上下文的时候getCurrentInstance会在线上环境报错. 搜索了一遍,看了好多文 ...

  8. 设备通过国标GB28181协议接入EasyCVR,报错“504 Gateway Time-out”是什么原因?

    EasyCVR基于云边端一体化架构,能支持海量视频的轻量化接入与汇聚管理.在视频能力上,可提供视频监控直播.视频轮播.视频录像.云存储.回放与检索.智能告警.服务器集群.语音对讲.云台控制.电子地图. ...

  9. ESP32 VScode环境报错:Something went wrong while trying to build the project。解决办法

    配置ESP32- Vscode环境 报错如图 项目目录包含了中文字符,我给换成全英文路径,再次尝试 成功 一些使用技巧 不要学我当星际玩家,找修改端口号找了半天,最后发群里丢人才发现

  10. 【数据库】报错ora 12154 解决方法

    Oracle报错 ora 12154 解决办法: 1.确认服务器监听正确打开: 2.确认别名前无空格.

最新文章

  1. HEOI2012 朋友圈
  2. java jackson json_使用Java和Jackson将Json序列化为通用结构而无...
  3. Shell——流程控制(if、case、for、while)
  4. SAP Data Intelligence Graph json源代码的结构分析
  5. SAP Netweaver ECATT介绍
  6. 前端学习(3316):connect
  7. 无法检索传真服务器信息,帮助中心
  8. 大数据时代的3V3高
  9. 宇宙是否可以了解,宇宙和计算机科学有关系吗?
  10. 各种常见排序算法的时间/空间复杂度 是否稳定 算法选取的情况 改进 思维导图整理
  11. MessageQueue nativePollOnce 一个不一样的 ANR
  12. html怎么定义403页面,自定义 403 错误页面(示例代码)
  13. 弘辽科技:直通车成交率多少正常?如何提高成交率?
  14. android自定义控件不显示,解决Android Studio Design界面不显示layout控件的问题
  15. 介词短语不能做宾语,但有时有的借此有句意省略就出现了介词再加上介词短语了
  16. MySQL语句的条件查询
  17. 阿里云的短信验证码(详细)
  18. cloud-music
  19. 小程序常用的页面布局
  20. 读书笔记—用系统来工作

热门文章

  1. 百度3D地图API的调用以及适应过程
  2. 外汇套利原理及策略EA
  3. MySQL 反引号作用
  4. Python-爬虫(数据库基本操作,爬取豆瓣电影排行)
  5. SOME/IP与DDS对比及DDS测试策略和方案探讨
  6. 写给小白的Python之006:数据类型之列表
  7. 『论文笔记』目标追踪结合相关滤波器资料收集+机器学习基础知识补充!
  8. google手机连接Wifi后总会提示无法连接互联网问题的解决
  9. matlab里支持向量机SVM实例1葡萄酒分类
  10. IEMS_11_课程信息相关的初始数据导入