ITPub博客

首页 > Linux操作系统 > Linux操作系统 > DW事实表分类讨论

DW事实表分类讨论

原创 Linux操作系统 作者:zhgazn 时间:2013-06-27 21:39:02 0 删除 编辑
        在构建数据仓库过程中,最终构建的模型是星型模型或者雪花模型,而星型模型中的核心是事实表,因此对事实表的剖析和分类一定要非常清楚,这样在设计过程中,才明白我们需要采用哪种事实表设计才能符合业务的需要。
       一般事实表有三种类型:事务事实表、快照事实表、和累积快照。
       本文主要关注第一种
      事务事实表:
       事务事实表跟踪定义业务过程的个体行为,并且支持几种描述这种行为的事实。可以提供丰富的分析型能力,时常充当原子数据的粒度化仓库。事务事实表获取事件或者行为的细节,通过存储事实和与之关联的维度细节,允许单独或者聚集地研究行为。事实度量行为可以有:订单的利润、发货的数量或者付款的额度。记录在事实表中的值描述了行所表示的特定事件。
        事务事实表具有三个特性:粒度、稀疏性和可加性。
        - 事务事实表的粒度:对粒度的声明是设计星型模型时的一个关键步骤。通常有两种方式可用于声明事务事实表的粒度。粒度可以通过引用实际的事务标识定义,例如订单行;或者可以采用维度术语定义,像在“某天的订单、客户、产品、销售人员”中那样。特别声明一点:尽管这里讨论的是事务事实表,但是粒度不一定那个是单独事务。比如一个销售人员在同一天处理了来自同一个客户关于同一个产品的两个订单,如果两个订单在事实表中合并成同一行,那么事实表的每一行描述了特定事件,尽管不是单个事件。
        - 事务事实表是稀疏的:事实表的数据来自于维度表组合,并且是维度表发生时的组合。比如销售人员,产品和客户的每个组合而记录每天的行,这样事实表就会有大量的零值存在,因此当订单发生时才进行记录。
        - 事务事实表包含可加的事实:大多数非可加的度量,例如比例,能够分解成完全可加的组件,这样才能允许事实表的粒度数据以任何希望的细节等级被聚集,这样比例或者非可加性的事实就能被计算。
         关于快照和积累快照,请看下文。
 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/647161/viewspace-764970/,如需转载,请注明出处,否则将追究法律责任。

上一篇: DW2.0和统计分析
下一篇: DW事实表快照
请登录后发表评论 登录
全部评论

注册时间:2013-06-05

  • 博文量
    16
  • 访问量
    56590