ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 中止进程导致系统HANG住

中止进程导致系统HANG住

原创 Linux操作系统 作者:yangtingkun 时间:2012-03-07 23:04:39 0 删除 编辑

以前在11g上碰到过一次类似的情况,由于ALTER SYSTEM KILL SESSION导致资源被完全占用,在一段时间内数据库处于HANG住状态。这次又碰到类似的问题。

 

 

简单描述一下问题产生的环境,用户在进行测试,在很短的时间内连续启动了多个应用服务器,导致大量的并发进程同时连接到数据库中,致使数据库服务器CPU利用率一下冲到100%

由于数据库的这种状态,用户决定中止一些进程来释放服务器上的资源。但是通过kill -9alter system kill session杀掉大量的会话后,数据库服务器反而处于HANG死状态,这时连sqlplus / as sysdba都无非正常登录。

于是用户继续通过kill -9清除所有非本地连接,到最后所有连接到数据库的非本地连接已经完全被杀掉,而服务器上的CPU资源已经下降,只有OraclePMON进程占用了单CPU50%左右,其他CPU完全空闲。可是此时数据库仍然无非正常登录。

此时只能通过sqlplus –prelim “/ as sysdba”方式登录,然后利用oradebug执行systemstatedump,查看导致数据库HANG死的原因。

检查SYSTEMSTATEDUMP文件,发现PMON进程和大量的DEAD进程都在经历library cache: mutex X等待事件。而整个DUMP文件中library cache: mutex X等待事件出现了3000多次。这个等待事件是不正常的。

查询MOS发现果然是bugBug 9312879  "library cache: mutex x" waits after killing sessions / PMON slow to clean up。在11.1中,如果会话在KILL,那么PMON进程可能在清除进程会话是出现异常,导致清除进程失败后不断尝试,并最终产生这个问题。

这个BUG11.2.0.111.1.0.7.7中被fixed,而Oracle对于这个问题的临时解决方案是不要kill会话。看来11.1版本和11.2相比确实是问题更多一些。

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/4227/viewspace-718219/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
暂无介绍

注册时间:2007-12-29

  • 博文量
    1955
  • 访问量
    10353110