ITPub博客

首页 > Linux操作系统 > Linux操作系统 > <转载>DBA日记 第一部(8) 5月20日 临晨的邮件通知短信

<转载>DBA日记 第一部(8) 5月20日 临晨的邮件通知短信

原创 Linux操作系统 作者:hu_kt 时间:2009-02-11 16:38:43 0 删除 编辑

昨天睡觉的时候忘记关手机了,这个月不是我战略值班,按理说是可以关手机的,睡觉前匆忙中居然忘记了,其实我手机关机的时候很少,一般在长途旅行后或者加夜班后一般会关机,以保证睡眠。半夜,正在睡梦中的我被一阵手机铃声惊醒,第一时间我就觉得是John回信了,急忙拿起放在床头的手机,一看,是一个房地产广告,"万科东方尊域,超低价发售,9999起"。一个烂楼盘,被万科包装后,从5000多升到一万一平米,还是超低价发售,万科真是房产价格杀手。

我失望的放下手机,正准备躺下,手机铃声再次响起,可恶的房产广告,可恶的万科,我挣准备掐掉铃声,突然发现这是我的邮箱的邮件通知短信。John真是个好同志,自从离开Oracle后,John成为一家银行的DBA MANAGER,空闲的时间比在Oracle的时候多了很多,用他的话说,从一个救火队员变成了一个悠闲的海滨度假者,从40岁开始,他要开始享受生活了,带小孩周游列国和为报纸撰写社评是他的主要工作,我听说后嘲笑他说,周游列国我相信,写社评我绝对不信,顶多也就给Oracle技术通讯写几个客户来稿。不过自从他离开Oracle后,由于闲暇时间过多,因此回答我的问题也越来越及时。我已经有一个多月没和他联络过了,估计这哥们也早就心里痒痒的了,对John来说,有Oracle方面的难题给他,是最愉快的事情。

放下手机,我马上打开正在待机的电脑,查看John的邮件。John的回答很短,显然是在匆忙中写的,翻译成中文就是"DEAD LOCK引起数据库HANG住是一个老问题了,开发人员已经起码处理了几年了,但是还有很多BUG没有解决,其关键原因是写TRACE的时候,需要进行PROCESS STATE DUMP,而DUMP完成之前,持有的PARENT ENQUEUE HASH CHAINS闩锁是不释放的,这就是问题的关键"。

仔细想想,SYSTEM STATEDUMP 或者PROCESS STATE DUMP被HANG住的可能性也是存在的,这很可能是由于另外一个BUG引起的,无论哪个BUG,关闭DUMP应该可以解决问题。由于在PROCESS STATE DUMP的时候,死锁检测SESSION会持有ENQUEUE HASH CHAINS父闩锁,因此在这个时候,任何需要申请锁资源(包括Internal Lock)的操作都需要等待。由于CURSOR分析需要申请LIBRARY CACHE LOCK,因此在这种情况下,CURSOR分析会无法进行。因此部分SESSION会报ora-600[kksscl-inf-inl-loop]故障。

看看手机,现在已经是早上6点多钟了,澳大利亚已经是早上8点多了,Ben可能已经起床了,Ben有早上上网阅读早新闻的习惯,希望能碰到他,和他聊聊这个问题。打开yahoo pager,发现Ben已经在线了。Ben听说这个问题后,也立即说这是Oracle的一个顽疾,虽然出了很多补丁,但是还有一些问题没有解决,Ben在Oracle工作快10年了,作为澳洲Oracle的救火队员,他处理过超过10个类似的案例,因此他十分肯定的说我的猜测是对的。同时,我从Ben那里拿到了一分关于BUG 2235386的资料,这份资料比我在METALINK上看到的要详细的多。从那里,我有了十分惊人的发现。

BUG 2235386里面详细介绍了ORA-60导致系统HANG住的情况,里面的内容和我和John的想法基本是一致的。但是PATCH 2235386并没有解决这个问题,因为解决这个问题的方法是做PROCESS STATE DUMP之前最好释放闩锁,而这是不可能的,因为这样会导致PROCESS STATE DUMP或者SYSTEM STATE DUMP的信息不准确。因此在这个补丁里引入了10027和10028两个事件,通过设置这两个事件来开启或关闭PROCESS STATE DUMP或者SYSTEM STATE DUMP。仅仅是打补丁是不行的,必须配合设置事件才能解决这个问题。而Oracle的工程师仅仅替用户打了补丁,这样确实是无法解决这个问题的。通过设置10028事件来关闭PROCESS STATE DUMP可以解决这个问题。而PROCESS STATE DUMP对于客户来说是没有多大用途的。

上午和客户沟通了问题的分析情况,客户也基本认同了我的分析。下一步就是找一个本地网进行试验了。原本定于今天下午的关于RAC的交流,由于他们有事,押后到明天进行。今天可以休息一下了。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11401185/viewspace-548726/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2008-10-08

  • 博文量
    1
  • 访问量
    12001