ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 近线存储弥补两极存储模式的中间空白

近线存储弥补两极存储模式的中间空白

原创 Linux操作系统 作者:无聊岁月 时间:2009-12-01 14:52:34 0 删除 编辑

两极存储模式(在线存储与离线存储)在数据分级存储模式的主要代表。在线存储又被叫做工作级别的存储,其特点就是存储设备和所保存的数据时刻“在线”。 简单的说,只要存储服务器开着,这些存储设备与数据不管要不要用,都时刻“待命”。显然这种存储形式可以提高数据的存储与访问效率。不过也会浪费能源,导致存储设备的寿命缩短。而离线存储模式刚好相反,它在使用的时候必须用户先“唤醒”他,它平时都是休眠的,只有在用到的时候才会启用。这种存储模式主要用于对在线存储模式下的数据进行备份,以防止可能出现的灾难事故。离线存储可以节省设备的能源消耗,延长存储设备的寿命。不过其不能够时刻在线为用户提供数据访问与存储。

  一、两极存储模式下出现的中间空白。

  两极存储模式可以说是数据分级存储技术中的元老,有很大的代表意义。在线存储与离线存储不能够说那种存储技术好,他们各有各的特点。在实际工作中,往往这在线存储与离线存储是相互配合、协调工作的。在线存储主要用来做日常数据访问与存储,而离线存储则主要用来对数据的备份。如一个邮件服务器,其日常的邮件数据保存在在线存储设备中。然后每隔一个周期,如每隔一天,通过相关的备份文件将在线存储设备中的邮件信息备份到离线设备中。也就是说,此时离线存储设备只有在数据备份的那一段时间启用,其余时间都是休眠的。这主要是出于节省设备能源与延长存储产品使用寿命而考虑的。为此离线存储也可以说是一种绿色存储方案。

  但是在在线存储中也不是所有数据用户都是需要经常访问的。如在线存储中存储着邮件信息。有些用户可能出于信息保存的需要,会两年、甚至更长时间不删除邮件。而他们日常工作所需要的邮件可能就是最近半年的。也就是说,在在线存储设备中可能有三分之二的数据都是不怎么需要访问到的。但是实际上这些数据仍然在时刻“待命”,恭候用户的检阅。这显然是一种非常浪费的行为。而且这些数据又无法保存到离线设备中。万一用户真的需要这些邮件,则必须通过恢复等手段来提供这些信息。这就是在两极模式下出现的空白。该如何弥补这段真空地段呢?也就是说,能够让那些平时不怎么访问的数据保存到某个特定的设备中,平时也让其休眠。然后等到用户提出访问需求的时候,再将设备设备唤醒。如此的话,即可以保证用户正常数据访问,同时又降低存储产品能源的正常消耗。

  二、近线存储弥补两极存储模式的中间空白。

  为了弥补这两极存储模式之间的空白,业界提出了近线存储的思路。简单的说,近线存储就是将那些不怎么使用的数据保存到性能较低的存储设备中。也就是说,存储系统要根据用户访问的历史数据,将数据分为两类:用户经常需要访问的数据与不经常需要访问的数据。然后将后者从原来的存储设备中转移出来,转移到另外一块硬盘或者其他的存储设备中。这与这块硬盘的性能要求并不是很高。不过为了保重用户也能够尽快的访问到这些不怎么使用的数据,而且这个不经常使用的数据量比较多。根据20/80原则,基本上有80%的数据会归于这一类。为此往往对于硬盘的寻址能力,即在众多数据中能够尽快找到所需要的数据,有比较高的要求。同时由于不常用的数据占总的数据量比较多,可能会达到四倍之多,为此对于这个硬盘的容量也有比较大的要求。现在市面上基于近线存储技术的设备已经有不少。如Quantum推出的DX30,就有近线存储的理念。

  三、近线存储技术实现的难点。

  笔者也给客户实施过不少类似的项目,那么在这个近线存储技术的实现过程中,有哪些难点呢?

  第一个难点在于如何判断数据是经常访问还是不经常访问。也就是说,系统自动判断的规则可能与用户的切身感受有所区别。用户可能认为某个文件需要经常用到,但是系统根据规则判断为不经常需要用到,而将其存放到性能低的硬盘中。从而用户反而感觉到访问速度的下降。其实现在市面上虽然有很多基于近线存储技术实现的存储设备,但是不同厂商的存储设备往往采用不同的算法来解决这个问题。如storagetek公司推出的近线存储产品,采用的是数据生命周期的算法。不同的算法往往会得到不同的结果。而每个企业可能情况不同,或者根据应用环境不同,需要采用不同的算法。这就要求企业的IT负责人有这方面的工作经验。能够根据企业的实际业务与应用软件,来判断采用哪种算法的近线存储产品更加适合。不过要做出这个合理的判断,对于企业要求比较高。通常情况下,企业IT负责人可能需要经过大量的测试才能够得出正确的结果。对于这一点,笔者认为IT负责人在考虑这个问题的时候,不要太在意个别用户的使用感受。只要大部分用户没有感觉到访问效率降低了就可以了。毕竟近线存储的思路就是在节省成本的前提下提高部分数据的访问效率,同时也会就降低那些不怎么访问到的数据的访问速度。

  第二个难点是企业不知道在哪些情形下适合采用近线存储。虽然说近线存储在所有环境中都可以使用。因为根据20/80原则,总有一些数据是处于不怎么需要访问的状态。但是在实际工作中,企业并不是在任何应用环境中都可以从中带来收益。如对于视频监控系统,其数据存储量大,而且存储的数据除非有意外情况基本上不会使用。也就是说,99%以上的数据不会用到。此时虽然从近线存储产品中也可以带来一定的收益。但是笔者认为,其还是采用其他绿色存储方案为好。如MAID存储方案。有些售前咨询顾问为了自己公司的利益,在推销产品的时候往往会违心的宣传,向不适合或者采用这种近线存储产品不能够带来经济价值的用户推荐这种近线存储产品,让用户使用后不能够看到其带来的价值。反而影响了这个近线存储产品的推广。所以说,近线存储虽然在全球已经有大量的用户,但是要真的被企业用户所接受与了解,可能还需要一个过程。

  第三需要注意在项目部署的过程中存储设备的分配。在使用近线存储产品中至少要使用两块硬盘(一般会超过这个数量),分别用于存储这两类数据。那么这硬盘这么分配呢?一般来说,经常需要访问的数据需要存放在性能要求比较高的硬盘或者其他存储设备中。而由于这类数据的容量不会很大,为此对其存储容量没有很大的要求。性能越高,由此带来的访问速度的提升会越明显。而对于存放那些不怎么用到的数据,其最重要的一个参数就是存储容量。一般情况下,这个硬盘至少需要比另一块硬盘容量大4倍以上。

  最后需要注意的是,近线存储设备往往还需要跟离线存储设备结合使用。因为近线存储设备中的数据也需要进行备份。从节省成本的角度出发,一般会为备份专门设置一个离线存储设备。在保证数据安全的前提下,从整体上降低存储系统能源的消耗。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13129063/viewspace-621074/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-06-05

  • 博文量
    677
  • 访问量
    671018