ITPub博客

首页 > Linux操作系统 > Linux操作系统 > The Data Warehouse ETL Toolkit学习笔记-架构(数据流主线―数据访问)

The Data Warehouse ETL Toolkit学习笔记-架构(数据流主线―数据访问)

原创 Linux操作系统 作者:phoenix-nirvana 时间:2013-07-03 09:32:42 0 删除 编辑

        ETL系统的最终目的就是为了在展示层中提供维度模型,便于查询工具、报表工具、仪表盘和OLAP立方体的访问。

        前台的数据就是最终用户实际看到的数据。

        (一)数据集市

        数据集市是前台一个重要的组成部分。它是为支撑某个业务流程而建立的维表集合。

        1、数据集市基于数据来源,而非部门的视图。

        2、数据集市包含全部的原子级粒度数据,支持向下钻取到最低的数据级别。

        数据集市只包含聚合数据的观点是数据仓库设计人员最容易犯下的错误之一。

        3、数据集市即可以集中管理也可以分布式管理。

 

        注意:

        Inmon在Building The Data Warehouse一书中将数据集市定义为面向部门应用的数据库,所有部门的数据源都是数据仓库,部门层常被称为“数据集市层”、OLAP层或“多维DBMS”层。

        Building The Data Warehouse一书与上述观点有以下几个不同点:

        1、数据仓库本身就是原子级的数据;

        2、数据集市来源于数据仓库,与上述的数据集市可来源于数据仓库也可独立开发不同;

        3、由现在数据库到数据仓库,由数据仓库至部门数据库,由部门数据库到个体数据库的一个逐步深入与细化的过程;

        4、数据集市是面向部门的。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/16239395/viewspace-765362/,如需转载,请注明出处,否则将追究法律责任。

下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-03-23

  • 博文量
    12
  • 访问量
    13157