在这篇文章中我们会对 11g 新特性—hang 管理器(Hang Manager) 进行介绍。我们需要说明,HM 只在RAC 数据库中存在。

在我们诊断数据库问题的时候,经常会遇到一些数据库/进程 hang住的问题。对于hang的问题,一般来说,常见的原因有以下两种。

死锁(cycle)。对于这种hang, 除非循环被打破,问题会永远存在。

某个堵塞者(blocker) 进程在持有了某些资源后堵住了其他进程。当然,根据堵塞的情况,我们可以把blocker

分为直接堵塞进程(immediate blocker)和根堵塞进程(root blocker)。而root blocker 在通常情况下会处于两种状态。

2.1 根堵塞进程处于空闲状态,对于这种情况,终止这个进程能够解决问题。

2.2 根堵塞进程正在等待某些和数据库无关的资源(例如:等待I/O),对于这种情况,终止这个进程也许能解决问题。但是,从数据库的角度来讲,这已经超出了数据库的范畴。

而从数据库的角度来讲, oracle有几种死锁的发现机制。 在这篇文章中我们会介绍11g RAC的新特性 hang管理器。hang 管理器的基本步骤是。

1.分配一部分内存空间用于存放hang analyze dump 信息。

2.定期搜集hang analyze dump信息(本地和全局)

3. 分析搜集到的dump信息,并确认系统中是否存在hang。

4. 利用分析的结果来解决hang问题。

接下来,我们对每个步骤进行具体的介绍。

步骤1: ORACLE 会分配一部分内存空间,我们称之为 hang analysis

cache,用来存放搜集的hang analyze dump i信息。这部分内存空间在每个节点的数据库实例上都存在。

步骤2:oracle 会定期搜集hang

analyze 信息,由于,HM特性是针对RAC数据库的特性,hang analyze的级别会包括本地和全局。另外,负责搜集这些dump 信息的后台进程是DIA0(这个进程从11g才被介绍)。默认情况下每3秒钟搜集本地级别hang analyze dump, 每10 秒搜集全局级别hang analyze dump。

步骤3:因为,每个节点都会搜集hang

analyze dump 信息,那么,意味着每个实例都会拥有自己的DIA0进程,负责完成本地的hang 分析。但是,对于RAC数据库,很多hang的情况会包含多个实例的进程。所以,我们需要一个实例上的DIA0 进程作为master,来对多个实例搜集到的信息进行分析。对于11g版本,节点号最小的实例的DIA0进程会成为HM的master进程。当然,在实例级别发生了重新配置后,主(master)DIA0 进程会重新在存在的实例中重新被选举出来。

对于hang的问题,HM采用以下的机制来进行检测,当HM分析过几个hang analyze dump(每30秒进行一次分析,至少经过三次分析)后,就会发现有一些进程之间存在着等待关系(我们可以称之为open chain),而且在这段时间之内没有任何的改变(例如,一直等待相同的等待事件),那么,我们就可以怀疑,这些进程之间出现了hang的情况。而在进一步的验证之后,的确发现这些进程之间存在着等待关系,那么就会找到这个等待链(open chain)的根阻塞进程,并尝试通过终止阻塞进程的方式来解决这个hang.当然,对于死锁(dead lock)这种情况,我们采用的方式是,终止等待环中的一个进程。下面的图形说明了以上的基本逻辑。

步骤4: 在确认hang的确发生之后,根据hang的类型选择对应的解决方案。对于HM 来说,如果这个hang线管的进程满足以下条件之一,那么HM就无法解决这个hang.

1. 除数据库以外的其他层面的进程也和这个hang相关,例如:asm实例的进程。

2. 是由于用户应用层面导致的,例如:TX锁。

3. 并行查询

4. 需要用户手动干预。例如:阻塞进程在等待“log file switch ”(这种等待很可能是由于归档目录对应的filesystem空间不足导致的。即使HM中知道了阻塞进程,hang的情况也无法得到解决)。

如果,hang是HM无法解决的类型,那么HM会继续跟踪这个问题。

而对于HM能够解决的问题,其解决的办法就是终止根阻塞进程。但是,如果这个阻塞进程是oracle 的主要后台进程,终止它就会导致实例crash。所以,HM在解决hang的时候,也存在解决范围。这个范围是由隐含参数"_hang_resolution_scope" 控制的,这个参数可以有三个值off(默认值,也就是说HM不会去解决hang),process(允许HM终止阻塞进程,如果该进程不是主要的后台进程),instance(允许HM终止阻塞进程,即使该进程是主要的后台进程。终止该进程会导致实例终止)。

最后,我们对和HM 相关的一些参数和trace 文件进行简单的介绍。

参数:

_hang_resolution=TRUE 或者 FALSE。这个参数用于控制HM是否解决hang。

_hang_resolution_scope=OFF,PORCESS或者 INSTANCE。这个参数用于控制HM解决问题的范围。

_hang_detection= 。 HM检测hang的时间间隔,默认值为30(秒)

oracle hm,Oracle 11g 新特性 – HM(Hang Manager)简介相关推荐

  1. Oracle 11g 新特性 – HM(Hang Manager)简介

    在这篇文章中我们会对oracle 11g 新特性-hang 管理器(Hang Manager) 进行介绍.我们需要说明,HM 只在RAC 数据库中存在. 在我们诊断数据库问题的时候,经常会遇到一些数据 ...

  2. 11g 新特性 Member Kill Escalation 简介

    首先我们介绍一下历史.在oracle 9i/10g 中,如果一个数据库实例需要驱逐(evict, alert 文件中会出现ora-29740错误)另一个实例时,需要通过LMON进程在控制文件(以下简称 ...

  3. Oracle 11g 新特性 -- Transparent Data Encryption (透明数据加密TDE) 增强 说明

    一.TransparentData Encryption (TDE:透明数据加密) 说明 Orace TDE 是Orcle 10R2中的一个新特性,其可以用来加密数据文件里的数据,保护从操作系统层面上 ...

  4. Oracle 11g新特性之--虚拟列(Virtual Column)

    Oracle 11g新特性之--虚拟列(Virtual Column) Oracle 11G虚拟列Virtual Column介绍 在老的 Oracle 版本,当我们需要使用表达式或者一些计算公式时, ...

  5. Oracle 11g新特性之 - 使用RMAN复制数据库

    Oracle 11g新特性之 - 使用RMAN复制数据库 Oracle 11g新特性之 - 使用RMAN复制数据库 - 1 Oracle 11g新特性之 - 使用RMAN复制数据库 - 2 Oracl ...

  6. Oracle 11g新特性之--只读表(read only table)

    Oracle 11g新特性之--只读表(read only table)       Oracle11g推出了一个新的特性,可以将table置于read only状态,处于该状态的table的不能执行 ...

  7. oracle+字段+virtual,Oracle 11g新特性之--虚拟列(Virtual Column)

    Oracle 11g新特性之--虚拟列(Virtual Column) Oracle 11G虚拟列Virtual Column介绍 在老的 Oracle 版本,当我们需要使用表达式或者一些计算公式时, ...

  8. oracle result_cache_max_size,oracle database 11g新特性之设置result cache-Oracle

    oracle database 11g新特性之设置result  cache oracle database 11g 新特性 之设置 result  cache 如果系统以前没有使用过result c ...

  9. Oracle入门(三B)之11G新特性 SYSASM 角色用来管理ASM

    转载自 oracle 11G新特性--SYSASM 角色--用来管理ASM SYSASM 角色 自动存储管理 (ASM) 是在 Oracle 数据库 10g 中引入的,它在某种程度上打破了 DBA 和 ...

最新文章

  1. nfs client高性能参数设置
  2. ResultSet获取set中的记录数
  3. C# 操作自定义config文件
  4. centos7 nginx php整合,Centos7下,宿主机nginx配合docker环境的php-fpm
  5. Spring事务隔离级别,事务传播行为
  6. “约见”面试官系列之常见面试题之第七十篇之==和===(建议收藏)
  7. 吴恩达发起新型竞赛范式!模型固定,只调数据?!
  8. ASP.NET Session丢失问题原因及解决方案[转]
  9. 作者:李明,男,中兴通讯股份有限公司产品经理。
  10. 夏日清凉小风扇网站源码 抖音引流神器
  11. C#LeetCode刷题-广度优先搜索
  12. “APP杀手”?微信小程序瞬间原形毕露
  13. Discuz! 7.1 7.2 远程代码执行漏洞
  14. TypeError: keys must be str, int, float, bool or None, not tuple,解决 python 中 json 保存不了字典键值为 元组 的问题
  15. 大数据分析的重要性体现在哪里
  16. java.lang.ClassCastException: $Proxy8 cannot be cast to org.hihernate.lob.SerialzableClob
  17. vs2013 win10 Caffe的编译安装(微软版本)
  18. Unity3D入门篇
  19. C语言求解圆周率近似值
  20. 基于SPSS的交叉表分析

热门文章

  1. 谷歌账号电子邮件怎么改_如何使用Google仅搜索您的电子邮件,事件和其他内容...
  2. Android Gif动态图片库
  3. Arcmap 10.8与Arcmap 10.2工具对比
  4. VMware-workstation-full-10.0.2中英文切换
  5. html设置pdf预览名字,浏览器预览PDF文件的个性化设置
  6. Flask学习笔记(四): Flask与数据库连接
  7. 网络引流平台都有哪些?推荐5种引流获客方式!
  8. 从阿尔法元到人工智能会取代你的工作吗?
  9. MonoRail学习笔记六:Filter功能使用
  10. 硬件设计与实践:16位CPU设计