ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 数据仓库的逻辑划分

数据仓库的逻辑划分

原创 Linux操作系统 作者:lxk_8080 时间:2011-02-25 11:28:03 0 删除 编辑
数据仓库的逻辑区域的划分及各区域的功能和特点:
(1) 暂存区(Staging Area):是为了保证数据移动的顺利进行而开设的增量性的数据存储空间,它是业务系统原始数据进入数据仓库前的缓存区。从业务系统到Staging的数据传输,应该避免进行复杂的数据处理,以保证数据的快速导入而尽量减少对业务系统造成的压力。一般,可以创建与OLTP交易系统实体结构相同的属性,同时在STAGING区域需要增加两个属性,1)SOURCE CODE,用来表示来源系统;2)LAST MODIFIED DATE,用来获得数据处理时间;如果原来的数据中已经有了上述两个属性,则需要在新属性中增加DW后缀进行标识;数据成功导入数据仓库之后,应清空Staging Area中的数据;
(2) 数据存储区Operational Data Store (ODS):ODS的数据作为数据仓库系统数据存储。ODS区域可以从逻辑上可以分为两部分,一部分用来存放OLTP系统的历史数据,这部分需要考虑是否需要对OLTP中的数据进行LIFE CYCLE的记录(包括交易数据与基础数据,即缓慢变化的处理);另一部分存放数据仓库部分加工的信息,即通过ODS历史数据经过整合后的信息,这些信息更加全面地反映出一个主题中某件事物的全貌。
(3) 中央数据仓库(BASELINE)是真正具有星型结构的多维数据存储区,这个部分包括的实体包括FACT  ENTITY和DIMENSION ENTITY。BASELINE部分需要能够支持最细粒度级别,保证可以在最细粒度级别实现多维的分析;即能够同时支持汇总数据以及明细数据的多维查询;
(4) 数据集市(DATAMART)是某一主题领域的专有的多维数据区;实现某一主题领域的多维查询需求;这个部分包括的实体也包括FACT  ENTITY和DIMENSION ENTITY两部分,但与BASELINE不同的是这部分的FACT  ENTITY和DIMENSION ENTITY都是某一业务主题服务。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/9080460/viewspace-687921/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 很有用的DS
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2008-11-12

  • 博文量
    3
  • 访问量
    2413