ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 针对大量小文件数据环境的备份策略

针对大量小文件数据环境的备份策略

原创 Linux操作系统 作者:tivoli2000 时间:2009-02-13 09:24:34 0 删除 编辑

备份策略很重要,可是用户都很少在意。。。

在实际的it工作环境中,经常存在着具有如下特点的数据环境:

1.  文件的数量非常巨大,也就是说存在着数量庞大的独立文件;

2.  每个独立文件的数据量很小;

3.  数据变化并不频繁,特别是改变每个独立文件的频率相对很低。

 

面对这种环境,使用常规的增量备份或者差异备份方式,不太容易取得完美的效果。这是由于常规备份方式判断文件是否发生改变的方式造成的。常规备份方式判断文件是否改变,通常采用如下的判断方式:

 

当备份或者过期请求发起时:

1.  客户端程序搜索整个客户端需要备份的文件系统以建立一个文件特性描述列表;

2.  服务器端程序搜索整个文件空间,建立一个服务器端的的文件特性列表;

3.  比较这两个列表,如果某一个文件符合备份或者过期的条件,则执行相应的操作。例如该文件仅存在于客户端,但不存在于服务器端,则进行相应的备份操作。

 

显然,当用户客户端的数据属于大量小数据环境的时候,再沿用这种判断方式,肯定会有相当的时间会花费在文件特性列表的建立和比较过程中。

 

针对这种情况,ibm tivoli storage manager(以下简称tsm),采用了一种基于日志的备份方式(journal based bakckup)。当采用这种方式的时候,用户需要在备份客户端启动日志服务引擎(journal service engine)。该引擎会记录客户端自上次工作结束后,发生改变的所有独立文件。因此,当进行备份的时候,备份客户端会直接从日志服务中获得要备份数据的信息,避免了两个文件特性列表的建立和比较工作,从而极大的提高备份处理速度。当此次备份完成后,日志服务会自动清除独立文件登记的信息,并继续跟踪客户端文件以后的变化。

 

目前tsm基于日志的备份方式的适用平台为windows ntwindows2000windows 2003window xp。需要注意的是在tsm 5.2.2版本中,windows 2003 64 bit的客户端不支持基于日志的备份。

 

实现基于日志的备份,需要在客户端启动日志服务,并预留日志数据库所需要的空间。启动日志服务的方式有两种,一种是使用命令行工具dsmcutil;一种是使用图形化的配置工具。

 

关于dsmcutil的使用方式,用户可以在命令行中敲入:

       dsmcutil help

       获取命令的格式。

 

由于基于日志的服务主要应用在windows平台上,所以建议用户使用图形化的工具来进行配置。

 

使用图形化的配置工具,用户可以在进入windows备份归档客户端工具后,点击:utilitiessetup wizard,系统弹出如下图的窗口:      

选择配置journal engine,然后进入下一步。

 

在这个向导的帮助下,用户可以非常容易的完成日志引擎和日志数据库的配置。当完成这一工作后,用户所进行的配置存储在tsmjbbd.ini文件中。

 

当完成配置,并启动日志引擎后,用户以后所做的incremental备份就全部都是基于日志的备份。

 

一般说来,如果使用基于日志的备份,用户需要注意以下几点:

1.  一般说来至少运行一次full incremental备份,这样日志服务可以记录所有的文件状态信息,并生成相应的数据库;

2.  用户不能随意改动服务器端对应的文件空间,否则有可能使日志服务所记录的信息不准确;

3.  客户端由于在发起备份之前,不会查询服务器端的信息,所以,将忽略注入备份频率等服务器端维护的数据。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/18983976/viewspace-550359/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2009-02-10

  • 博文量
    103
  • 访问量
    127463