Oracle 11g 新特性 – HM(Hang Manager)简介
在这篇文章中我们会对oracle 11g?新特性—hang?管理器(Hang Manager)?进行介绍。我们需要说明,HM?只在RAC?数据库中存在。 ? ? ? 在我们诊断数据库问题的时候,经常会遇到一些数据库/进程?hang住的问题。对于hang的问题,一般来说,常见的原因有以下两种。 ? 死锁(cycle)。对于这种hang,?除非循环被打破,问题会永远存在。 ? 某个堵塞者(blocker) 进程在持有了某些资源后堵住了其他进程。当然,根据堵塞的情况,我们可以把blocker ? 2.1?根堵塞进程处于空闲状态,对于这种情况,终止这个进程能够解决问题。 ? 2.2?根堵塞进程正在等待某些和数据库无关的资源(例如:等待I/O),对于这种情况,终止这个进程也许能解决问题。但是,从数据库的角度来讲,这已经超出了数据库的范畴。 ? ? ? 而从数据库的角度来讲,?oracle有几种死锁的发现机制。 在这篇文章中我们会介绍11g RAC的新特性?hang管理器。hang?管理器的基本步骤是。 ? 1.分配一部分内存空间用于存放hang analyze dump?信息。 ? 2.定期搜集hang analyze dump信息(本地和全局) ? 3.?分析搜集到的dump信息,并确认系统中是否存在hang。 ? 4.?利用分析的结果来解决hang问题。 ? ? ? 接下来,我们对每个步骤进行具体的介绍。 ? 步骤1: ORACLE?会分配一部分内存空间,我们称之为?hang analysis ? 步骤2:oracle?会定期搜集hang ? 步骤3:因为,每个节点都会搜集hang ? ? ? 对于hang的问题,HM采用以下的机制来进行检测,当HM分析过几个hang analyze dump(每30秒进行一次分析,至少经过三次分析)后,就会发现有一些进程之间存在着等待关系(我们可以称之为open chain),而且在这段时间之内没有任何的改变(例如,一直等待相同的等待事件),那么,我们就可以怀疑,这些进程之间出现了hang的情况。而在进一步的验证之后,的确发现这些进程之间存在着等待关系,那么就会找到这个等待链(open chain)的根阻塞进程,并尝试通过终止阻塞进程的方式来解决这个hang.当然,对于死锁(dead lock)这种情况,我们采用的方式是,终止等待环中的一个进程。下面的图形说明了以上的基本逻辑。 ? ? ? ? ? ? 步骤4:?在确认hang的确发生之后,根据hang的类型选择对应的解决方案。对于HM?来说,如果这个hang线管的进程满足以下条件之一,那么HM就无法解决这个hang. ? 1.?除数据库以外的其他层面的进程也和这个hang相关,例如:asm实例的进程。 ? 2.?是由于用户应用层面导致的,例如:TX锁。 ? 3.?并行查询 ? 4.?需要用户手动干预。例如:阻塞进程在等待“log file switch?”(这种等待很可能是由于归档目录对应的filesystem空间不足导致的。即使HM中知道了阻塞进程,hang的情况也无法得到解决)。 ? ? ? 如果,hang是HM无法解决的类型,那么HM会继续跟踪这个问题。 ? ? ? 最后,我们对和HM?相关的一些参数和trace?文件进行简单的介绍。 ? 参数: ? _hang_resolution=TRUE?或者?FALSE。这个参数用于控制HM是否解决hang。 ? _hang_resolution_scope=OFF,PORCESS或者?INSTANCE。这个参数用于控制HM解决问题的范围。 ? _hang_detection= <number>。?HM检测hang的时间间隔,默认值为30(秒)。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |