ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 再一次MAA环境下switchover失败经验分享

再一次MAA环境下switchover失败经验分享

原创 Linux操作系统 作者:Allen2312 时间:2009-06-28 16:57:17 0 删除 编辑

前几天又有机会做MAA环境下的switchover,结果又失败啦~~

这个环境跟我第一次MAA环境类似,稍微复杂的是主备库都是6节点RAC,第一次从主库切换备库,是我现场支持做的,遇到点小问题,但是switchover成功了,当时遇到的问题是:

在主库switchover成备库成功,但是在备库switchover到主库时,提示If media recovery active, switchover will wait for completion,然后检查alert日志发现,原备库没有完全应用end of redo的archive log,原因是:

ORA-19816: WARNING: Files may exist in db_recovery_file_dest that are not known to database.
ORA-17502: ksfdcre:4 Failed to create file +DISKGROUP4
ORA-15041: diskgroup space exhausted
Wed May 13 20:32:52 2009
*************************************************************
WARNING: A file of type ARCHIVED LOG may exist in
db_recovery_file_dest that is not known to the database.
Use the RMAN command CATALOG RECOVERY AREA to re-catalog
any such files. This is most likely the result of a crash
during file creation.
*************************************************************

Wed May 13 20:32:52 2009
Errors in file /log/admin/cbak/bdump/cbak1_arc1_22278.trc:
ORA-19504: failed to create file "+DISKGROUP4"
ORA-17502: ksfdcre:4 Failed to create file +DISKGROUP4
ORA-15041: diskgroup space exhausted
ARC1: Error 19504 Creating archive log file to '+DISKGROUP4'
ARC1: All standby destinations failed; successful archival assumed
ARC1: Failed to archive thread 3 sequence 3367 (19504)
ARCH: Archival stopped, error occurred. Will continue retrying

Identified End-Of-Redo for thread 1 sequence 3237
Media Recovery Waiting for thread 3 sequence 3367

还没有完成media recovery,这时候做switchover肯定失败

最后使用手动方式注册没有成功的归档日志,然后再重新switchover,成功~~

关于上面为什么没有成功创建归档,原因ORA-15041: diskgroup space exhausted,经过检查发现是ASM的一个bug和数据库配置有关的问题,暂时也没时间解决,只好先用手动注册归档方式解决了~~

结果不及时总结的后果体现出来了,切换成功后运行了将近2个月,前几天需要切换回来,出现了非常奇特的现象,简言之,就是主库切换备库就失败了,没有成功应用end of redo的archive log,因为上面ASM原因,没有创建成功,但是备库已经成功接收,不过因为主库没有成功应用,而且中间出现问题重启了备库,所以最后是备库激活后,数据一点没有丢失,而且原主库继续查找以前的归档并能成功接收归档,但是由于都是以前的归档,不能应用,一直向后查找,因为遗留的6个节点归档将近3000个,所以最后没有等待继续找玩,就重新做了备库。

感觉如果等待切换的备库自己应用,也许最后可以正常,因为感觉他的主备模式没有被破坏,不过也不一定,最有可能scn不一致,由于是比较重要的生产库,就没能继续实验下去~

又多了一次switchover失败经验~~

大家一定注意前期检查,不能忽略这些可能引起异常的小问题~~

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/122290/viewspace-607759/,如需转载,请注明出处,否则将追究法律责任。

下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2008-11-03

  • 博文量
    12
  • 访问量
    69024