2008/3/17
大约17:00-17:30
REDHAT Linux AS4 Oracle10.2.0.1 Rac(2nodes)
断断续续的DB从14号重起后,老是发生应用程序与服务器忽然失去连接,程序好像处于死机状态,一会又缓过神来,监听器日志现实很多程序在不断的重复连接,有时候故障几秒,产线感觉到马上就好了,有时候要好几分钟,ping显示timeout, 产线陆陆续续出现了多次故障,郁闷死了。
最后爆发了,一下子服务器不管内外网都ping不通了,好久,以为是服务器网卡或者service故障,所以就重起了DB,半个多小时。
后来网管说可能是网络回路,所以找人马上去产线逐个调查,结果发现网段A和网段B居然有根网线直接互联了,这两个网段可是互相独立的!,赶紧拔掉。
后来继续跟踪,发现问题监听器日志当中还有类似的情况,只是很少,不免有点紧张,还好昨天拔掉网线后到现在没有出现故障。我希望那根网线就是罪魁祸首,否则我再也经不起折腾了,毕竟我离合格的DBA还差很远。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10341434/viewspace-209668/,如需转载,请注明出处,否则将追究法律责任。