ITPub博客

首页 > Linux操作系统 > Linux操作系统 > TSM配置不好导致备份不正常,从而导致数据库性能问题

TSM配置不好导致备份不正常,从而导致数据库性能问题

原创 Linux操作系统 作者:mengzhaoliang 时间:2009-05-21 14:58:06 0 删除 编辑

具体原因: 问题1:数据库服务器为什么在2009年5月12日 9:00左右发生IO频繁操作?
原因:这是因为做TSM实施的工程师在TSM Server中没有做好正确的调度配置,本来在凌晨2:00执行数据库的1级备份,因为TSM实施工程师没有在TSM Server中设置调度时间的限制,导致2009年5月12日 8:53分才执行数据库的1级备份,备份时间正好遇上了系统的繁忙登陆时间,系统迫于IO压力自动切换到备库(10.1.1.34). 这是因为数据库中做了HA,数据库因为负载问题刚切换到另一台数据库服务器中。

问题2:为什么切换到备库(10.1.1.34),数据库还不能备份。
原因:当初TSM实施工程师没有彻底的配置好另一台数据库的配置文件。需要重新配置TSM Client备库(10.1.1.34)的配置文件。

问题3:TSM在执行备份时,为什么调用数据库的RMAN脚本,当RMAN脚本只有一个通道(channel)时,可以正常备份数据到带库,用两个通道(channel)就不能备份。
原因:当初TSM实施工程师在TSM Server中配置错误,在一个带库中,配置了两个Library(带库),一个Library分别分配了一个驱动(Driver),所以两个通道(channel)需要Library的两个驱动(Driver),则导致了上面的问题。在TSM Server中删除Library和Driver,重新配置一个Library,一个Library配置两个Driver,则解决了上述问题。


解决方法: 解决问题1:
在TSM Server的命令行中输入:q sched 看到下面信息
JTXXTSM01 ANS8000I Server command: 'q sched'
JTXXTSM01 
JTXXTSM01             域: STANDARD
JTXXTSM01              *:
JTXXTSM01       调度名称: DATE
JTXXTSM01           操作: CMD
JTXXTSM01 启动日期/时间: 05/15/2009 09:48:00
JTXXTSM01       持续时间: 10 分钟
JTXXTSM01           周期: 1 小时
JTXXTSM01             天: 任何
JTXXTSM01 
JTXXTSM01             域: STANDARD
JTXXTSM01              *:
JTXXTSM01       调度名称: ORACLE_0_BCK_SCH
JTXXTSM01           操作: CMD
JTXXTSM01 启动日期/时间: 04/30/2008 02:00:00
JTXXTSM01       持续时间: 10 分钟
JTXXTSM01           周期:
JTXXTSM01             天: (*)
JTXXTSM01 
JTXXTSM01             域: STANDARD
JTXXTSM01              *:
JTXXTSM01       调度名称: ORACLE_1_BCK_SCH
JTXXTSM01           操作: CMD
JTXXTSM01 启动日期/时间: 04/30/2008 02:00:00
JTXXTSM01       持续时间: 不确定的
JTXXTSM01           周期:
JTXXTSM01             天: (*)

红色字段中的配置导致了本应该2:00的备份,在8:53分才开始备份。解决方法为:打开ISC
http://10.1.1.53:8421/ibm/console ,在“策略域和客户机节点”——》“STANDARD属性”——》“客户机节点调度”中选中——》“ORACLE_1_BCK_SCH”,修改该调度的“高级选项”,在“可以指定一个时间限制,在此时间限制期间必须启动调度的操作。此时间限制不限制完成此操作可能花费的时间。”中设置“10”分钟。如果不能修改,可以把该调度信息删除,然后重建调度,在重建中设置“10”分钟限制即可解决上面的问题。

解决问题2:
检查备库中的配置文件
/usr/tivoli/tsm/client/ba/bin/dsm.sys 这是配置TSM Client的调度节点文件
/usr/tivoli/tsm/client/api/bin64/dsm.sys
/usr/tivoli/tsm/client/oracle/bin64/tdpo.opt 这是数据库的配置文件
(把下面的10.2.1.53改成现在TSM Server 的10.1.1.53地址)
(把下面的10.2.1.34改成现在TSM Client 的10.1.1.34地址)
JTXXDBS02:> pwd
/usr/tivoli/tsm/client/ba/bin
JTXXDBS02:> cat dsm.sys
SErvername      TSMServer
        COMMMethod              TCPip
        TCPPort                 1500
        PasswordAccess          generate
        TCPServeraddress        10.2.1.53
        NODENAME                JTXXDBS

        ENABLELANFREE            YES
        LANFREECommmethod        TCPIP
        LANFREETCPServerAddress  10.2.1.34
        LANFREETCPport           1502

SErvername      TSMoraServ
        COMMMethod                   TCPip
        TCPPort                      1500
        TCPServeraddress             10.2.1.53
        PasswordAccess               generate
        NodeName                     TDPOMS

        ENABLELANFREE                YES
        LANFREECommmethod            TCPIP
        LANFREETCPServerAddress      10.2.1.34
        LANFREETCPport               1502
JTXXDBS02:>

修改/usr/tivoli/tsm/client/api/bin64/dsm.sys
(把下面的10.2.1.53改成现在TSM Server 的10.1.1.53地址)
(把下面的10.2.1.34改成现在TSM Client 的10.1.1.34地址)
JTXXDBS02:> cat dsm.sys
SErvername      TSMoraServ
        COMMMethod                   TCPip
        TCPPort                      1500
        TCPServeraddress             10.2.1.53
        PasswordAccess               prompt
        NodeName                     TDPOMS

        ENABLELANFREE                YES
        LANFREECommmethod            TCPIP
        LANFREETCPServerAddress      10.2.1.34
        LANFREETCPport               1502

然后启动TSM Client的调度进程
JTXXDBS02:> pwd
/usr/tivoli/tsm/script
JTXXDBS02:> ./oraclebcksched.sh  &    (一般在UNIX、Linux系统中,让进程在后台运行加上“&”)

确认TSM Client是否启动
JTXXDBS02:> ps -ef|grep dsmc
    root  606376       1   0 10:16:40  pts/1  0:02 dsmc sched -servername=TSMoraserv
    root  909332  708728   0 10:45:25  pts/1  0:00 grep dsmc

可以再次检查TSM Client的调度日志和错误日志
/usr/tivoli/tsm/logs/dsmsched.log
已经可以把下次执行的调度时间列了出来
05/13/09   10:16:47 --- SCHEDULEREC QUERY BEGIN
05/13/09   10:16:47 --- SCHEDULEREC QUERY END
05/13/09   10:16:47 Next operation scheduled:
05/13/09   10:16:47 ------------------------------------------------------------
05/13/09   10:16:47 Schedule Name:         ORACLE_ARCLOG_BCK_SCH
05/13/09   10:16:47 Action:                Command
05/13/09   10:16:47 Objects:               /usr/tivoli/tsm/script/backuparchive.sh
05/13/09   10:16:47 Options:
05/13/09   10:16:47 Server Window Start:   12:00:00 on 05/13/09
05/13/09   10:16:47 ------------------------------------------------------------
05/13/09   10:16:47 Command will be executed in 1 hour and 45 minutes.


/usr/tivoli/tsm/logs/dsmerror.log没有错误信息

注:如果还没有解决,可以查看TSM Client(数据库服务器)下面的配置文件是否正常
/usr/tivoli/tsm/client/ba/bin/dsm.sys 这是配置TSM Client的调度节点文件
/usr/tivoli/tsm/client/api/bin64/dsm.sys
/usr/tivoli/tsm/client/oracle/bin64/tdpo.opt 这是数据库的配置文件


问题3:
可以备份的一个通道的脚本如下:
run{ 
 allocate channel t1 type 'sbt_tape' parms 'ENV=(TDPO_OPTFILE=/usr/tivoli/tsm/client/oracle/bin64/tdpo.opt)'; 
 sql 'alter system archive log current';
 BACKUP FILESPERSET 10 MAXSETSIZE 10G    
 FORMAT 'arch_%T_%s_%p'    
 SKIP INACCESSIBLE   
 ARCHIVELOG ALL DELETE INPUT;   
 release channel t1; 
}

不能备份的两个通道脚本如下:
run{ 
 allocate channel t1 type 'sbt_tape' parms 'ENV=(TDPO_OPTFILE=/usr/tivoli/tsm/client/oracle/bin64/tdpo.opt)';
  allocate channel t2 type 'sbt_tape' parms 'ENV=(TDPO_OPTFILE=/usr/tivoli/tsm/client/oracle/bin64/tdpo.opt)'; 
 sql 'alter system archive log current';
 BACKUP FILESPERSET 10 MAXSETSIZE 10G    
 FORMAT 'arch_%T_%s_%p'    
 SKIP INACCESSIBLE   
 ARCHIVELOG ALL DELETE INPUT;   
 release channel t1; 
release channel t2;
 
}

在TSM Server中命令行中输入下面的命令删除和重新配置:
# delete path   删除TSM Server 中的Library 和Driver
del path TSMSERVER 3100LIB srct=SERVER destt=LIBRARY
del path TSMSERVER 3100LIB02 srct=SERVER destt=LIBRARY
del path TSMSERVER DRV01 srct=SERVER destt=DRIVE libr=3100LIB02
del path TSMSERVER DRV02 srct=SERVER destt=DRIVE libr=3100LIB02
del path TSMSERVER DRV01 srct=SERVER destt=DRIVE libr=3100LIB
del path STORAGEADB01 DRV02 srct=SERVER destt=DRIVE libr=3100LIB02
del dr 3100LIB02 DRV01
del dr 3100LIB02 DRV02
del dr 3100LIB DRV01
del library 3100LIB02
del library 3100LIB
#重新定义Library 和Driver
def library 3100LIB02 libtype=scsi share=yes
def path TSMSERVER 3100LIB02 srct=SERVER destt=LIBRARY device=lb5.1.0.5

def dr 3100LIB02 DRV01
def dr 3100LIB02 DRV02

def path TSMSERVER DRV01 srct=SERVER destt=DRIVE libr=3100LIB02 device=mt4.0.0.5
def path TSMSERVER DRV02 srct=SERVER destt=DRIVE libr=3100LIB02 device=mt5.0.0.5

checkin libv 3100LIB02 search=yes status=scr
#10分钟后 
checkin libv 3100LIB02 search=yes status=private

然后在TSM Client(数据库)执行
现在只有一个Library就是3100LIB02,下面的原来的备份数据移动到3100LIB02
JTXXDBS01:> pwd
/usr/tivoli/tsm/client/ba/bin
JTXXDBS01:> dsmadmc
IBM Tivoli Storage Manager
Command Line Administrative Interface - Version 5, Release 4, Level 0.0
(c) Copyright by IBM Corporation and other(s) 1990, 2007. All Rights Reserved.

Enter your user id:  admin

Enter your password:

Session established with server TSMSERVER: Windows
  Server Version 5, Release 4, Level 0.0
  Server date/time: 05/21/09   13:28:07  Last access: 05/21/09   12:47:37
tsm: TSMSERVER>move data Z15937L3
ANR2232W 此命令将把存储在卷 Z15937L3 上的全部数据移动到同一个存储池内的其他卷?
?o you wish to proceed? (Yes (Y)/No (N))y
ANS8003I Process number 7 started.

tsm: TSMSERVER>

这样就解决了上面的问题。
如果再有问题,可以再次查看TSM Server和Client的活动日志。

问题四:如果在TSM Client(数据库中)发现ANS9201W LAN-free path failed. 错误,
JTXXDBS02:> dsmc -servername=TSMoraServ
IBM Tivoli Storage Manager
Command Line Backup/Archive Client Interface
  Client Version 5, Release 4, Level 0.0
  Client date/time: 05/15/09   10:57:55
(c) Copyright by IBM Corporation and other(s) 1990, 2007. All Rights Reserved.
Node Name: TDPOMS
ANS9201W LAN-free path failed.
Node Name: TDPOMS
Session established with server TSMSERVER: Windows
  Server Version 5, Release 4, Level 0.0
  Server date/time: 05/15/09   10:57:51  Last access: 05/15/09   10:51:25
tsm> q sched
Node Name: TDPOMS
ANS9201W LAN-free path failed.
Node Name: TDPOMS
Session established with server TSMSERVER: Windows
  Server Version 5, Release 4, Level 0.0
  Server date/time: 05/15/09   10:58:10  Last access: 05/15/09   10:57:51
    Schedule Name: BACKUPARCHIVE.SH
      Description: Oracle数据库库归档日志备份
   Schedule Style. Classic

原因:是TSM实施工程师的配置文件错误
解决:
JTXXDBS02:> pwd
/usr/tivoli/tsm/client/ba/bin
JTXXDBS02:> cat dsm.sys
SErvername      TSMServer
        COMMMethod              TCPip
        TCPPort                 1500
        PasswordAccess          generate
        TCPServeraddress        10.1.1.53
        NODENAME                JTXXDBS

        ENABLELANFREE            YES
        LANFREECommmethod        TCPIP
        LANFREETCPServerAddress  10.1.1.34
        LANFREETCPport           1502

SErvername      TSMoraServ
        COMMMethod                   TCPip
        TCPPort                      1500
        TCPServeraddress             10.1.1.53
        PasswordAccess               generate
        NodeName                     TDPOMS

        ENABLELANFREE                YES
        LANFREECommmethod            TCPIP
        LANFREETCPServerAddress      10.1.1.34
        LANFREETCPport               1502

JTXXDBS02:>

把红色的“YES”改成了“NO”,这样不会发生下面的“ANS9201W”红色字体错误

问题五:确定带库中是否做了2个虚拟的Library(逻辑带库)?
一般来说一个物理的带库对应一个Library。
打开带库的IP,如:http://10.1.1.59
左边“Manager Library”——》“Logical  Libraries”,在网页的右边看到一个Library,则为一个Library,如果看到两个,则有两个逻辑带库。

问题3:在TSM Server操作系统2003中识别带库时,出现两个介质变换器是否正常?
如下图:
 
经过800电话,IBM带库工程师说,一般情况是一个带库,一般出现一个介质变换器。如果出现两个介质变换器,也是正常的。在配置TSM Server时,只需要用一个介质变换器就没有问题。

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12778571/viewspace-600674/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
暂无介绍

注册时间:2008-01-30

  • 博文量
    335
  • 访问量
    2913580