Oracle 9.2.0.6 RAC
hp-ux 11.11
现场情况:
昨晚由于机房要重新配置电源,需要关闭主机.
配置完毕后重新启动机器、启动os集群、启动gsd、启动数据库均没有错误。
今天早上过来的时候客户就在抱怨在B机应用系统非常缓慢,查询一个人的信息需要10分钟+,而以前查询是在20秒内完成;而在A机上的操作一切正常。当时觉得这种情况莫名其妙的。
1.在B上用top/vmstat分析发现主机的负载不高,没有出现特别耗资源的应用。
2.由于昨晚关机前对os的内核参数调整过,曾经试过怀疑是内核参数引起的问题,不过通过对比A和B后发现两台主机没什么区别,而A机运行良好,把这个可能排除。
3.在A和B上分别做statspack后发现B机statspack生成report非常缓慢,N分钟后生成report,top 5等待事件为:
Top 5 Timed Events
~~~~~~~~~~~~~~~~~~ % Total
Event Waits Time (s) Ela Time
-------------------------------------------- ------------ ----------- --------
global cache cr request 5,056 4,144 61.96
buffer busy global CR 2,754 1,966 29.40
global cache null to x 211 202 3.02
global cache open s 215 174 2.60
global cache open x 199 91 1.36
都是与RAC中的GES/GCS有关的等待事件,怀疑是内部连接的问题。
在A、B上用ping 2000测试正常。
在A上用ftp到B上get某个大文件,正常。
在B上用ftp到A上get某个大文件,非常缓慢,发现只有500K-每秒。
在另外的主机C上分别ftp到A,B上get某个大文件,均正常。
问题基本定位在在A到B之间的传输上了,可怜用的还是千M网卡。
曾经考虑过用cluster_interconnects指定oracle实例之间的内部连接,不成功,后来查文档发现这个参数在9206已经不起作用了。
我ft!
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/6906/viewspace-21677/,如需转载,请注明出处,否则将追究法律责任。