ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 10g RAC 一节点不能自动启动gsd,ons,lsnr,inst等服务

10g RAC 一节点不能自动启动gsd,ons,lsnr,inst等服务

原创 Linux操作系统 作者:tolywang 时间:2008-11-20 14:42:43 0 删除 编辑

问题已解决。

linux as4.0 u5  64bit
oracle 10.2.0.3  64bit

ocfs2  rac ,  2 nodes .

原来做过的10g rac都没有碰到过这种问题 。做过一次fail over测试,关闭节点1的public 网卡,之后恢复 。然后就
发现节点1 在os启动时所有服务及db都能自动启动 , 节点2  crs服务不能启动,inst也不能自动启动 。

# /etc/rc.d/init.d/init.crs   enable  之后重新关闭服务数据库,启动,还是不行。  

节点1 都是online , 节点2 状态都是unknown , 手动 srvctl  start   nodeapps  -n  ecsrac02  , 然后开启节点2实例 。
都变成online . 全部正常。  


如何恢复成所有节点都能自动开启相关服务及实例自动开启呢 ??

 

ecsrac01$crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.ecsdb.db   application    ONLINE    ONLINE    ecsrac01   
ora....b1.inst application    ONLINE    ONLINE    ecsrac01   
ora....b2.inst application    ONLINE    UNKNOWN   ecsrac02   
ora....01.lsnr application    ONLINE    UNKNOWN   ecsrac01   
ora....c01.gsd application    ONLINE    ONLINE    ecsrac01   
ora....c01.ons application    ONLINE    ONLINE    ecsrac01   
ora....c01.vip application    ONLINE    ONLINE    ecsrac01   
ora....02.lsnr application    ONLINE    UNKNOWN   ecsrac02   
ora....c02.gsd application    ONLINE    UNKNOWN   ecsrac02   
ora....c02.ons application    ONLINE    UNKNOWN   ecsrac02   
ora....c02.vip application    ONLINE    ONLINE    ecsrac02   

ecsrac01$crs_stat -v
NAME=ora.ecsdb.db
TYPE=application
RESTART_ATTEMPTS=1
RESTART_COUNT=0
FAILURE_THRESHOLD=1
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01

NAME=ora.ecsdb.ecsdb1.inst
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01

NAME=ora.ecsdb.ecsdb2.inst
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02

NAME=ora.ecsrac01.LISTENER_ECSRAC01.lsnr
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac01

NAME=ora.ecsrac01.gsd
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01

NAME=ora.ecsrac01.ons
TYPE=application
RESTART_ATTEMPTS=3
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01

NAME=ora.ecsrac01.vip
TYPE=application
RESTART_ATTEMPTS=0
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01

NAME=ora.ecsrac02.LISTENER_ECSRAC02.lsnr
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02

NAME=ora.ecsrac02.gsd
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02

NAME=ora.ecsrac02.ons
TYPE=application
RESTART_ATTEMPTS=3
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02

NAME=ora.ecsrac02.vip
TYPE=application
RESTART_ATTEMPTS=0
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac02




ecsrac01$crsctl check crsd
CRS appears healthy


--------------------------------------------------------------------------------------

 

root:
#crsctl enable crs     之后重新启动还是不行 。

 

----------------------------------------------------------------------------------------- 

 

升级到 10.2.0.4 不知道能不能解决 。

---------------------------------------------------------------------------------------------

发现一个问题点:  

   原来安装的10g (10.2.0.3) RAC 数据库,重新启动不会出现不启动服务的问题。本次安装的
   数据库,节点1 使用的是共享磁盘上的spfile参数 /ocfs_data1/ecsdb/spfileecsdb.ora ,
     但是不知道为什么节点2 使用的却是  $ORACLE_HOME/dbs/spfileecsdb2.ora 文件 ,这个
   目录下也存在着 initecsdb2.ora , 其中写的就是一个链接 spfile='/ocfs_data1/ecsdb/spfileecsdb.ora ' ,
     不过show paramete spfile 查看发现节点2 用的spfile和节点1 不是同一个spfile . 也就是不是共享
   磁盘上的spfile .  

     升级到Oracle 10.2.0.4 之后, 运行 SQL> ALTER SYSTEM SET CLUSTER_DATABASE=TRUE SCOPE=spfile;  的时候发现的 。 后来删除了节点2 上的 $ORACLE_HOME/dbs/spfileecsdb2.ora 文件 。 结果正常 。目前还不知道是spfile 不一样导致的,还是升级有效果 。

----------------------------------------------------------------------------------------------------

 

还有一点就是

节点1, 2  OS启动后,等5~8分钟之后两个节点才会显示正常的 crs 服务 。
crs_stat -t  都是online.  否则crs_stat -t 报错或 显示offline .  

会不会以前太着急没有等 就直接下了一些命令导致以为有问题 。

 

-----------------------------------------------------------------------------------------------------------

 

http://www.itpub.net/viewthread.php?tid=1088801&extra=&page=1 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/35489/viewspace-498142/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
Oracle , MySQL, SAP IQ, SAP HANA, PostgreSQL, Tableau 技术讨论,希望在这里一起分享知识,讨论技术,畅谈人生 。

注册时间:2007-12-10

  • 博文量
    5595
  • 访问量
    13334780