ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 《数据仓库工具箱-维度建模》--基本概念

《数据仓库工具箱-维度建模》--基本概念

原创 Linux操作系统 作者:zhangqi0718 时间:2012-03-08 22:37:03 0 删除 编辑

从今天开始系统学习整理数据仓库-纬度建模相关技能。
1、数据仓库是一个建设过程,而不是一个产品。对数据仓库而言,业务需求是第一位。 
2、信息的两个领域
OLTP(信息存入):操作型数据库
解决处理的高性能和可用性
OLAP(信息读取):数据仓库
思考:数据仓库产生的原因,及两种数据库之区别和应用场景差异、特性差异
3、数据仓库建设
易阅读:数据仓库内容对开发人员、业务人员易于阅读
一致性:不同系统的数据一致性,即要规范化数据格式
扩展性:需求、业务场景、技术、数据内容变化时,可便捷修改
安全性:权限控制,权限最小化访问策略
OLAP: 为决策提供支持
应充分让客户意识到商业智能及数据仓库建设的重要性,调动积极性。
4、数据仓库构成
针对数据仓库构建的几个环节
(1)操作型数据源
外部平面文件。
(2)数据聚集环节
ETL过程。
(3)数据展现环节
数据中心的集成:维度、原子型数据或汇总数据、单个业务处理为基础
数据应该是以维度形式进行展示、存储和访问,维度模型为数据仓库用户提交数据最可行的技术手段。
(4)数据存取工具
特殊查询工具、报表书写器、分析型应用程序、建模
5、词汇
事实表:维度模型中存储业务性能的度量值。
(1)可加性、半加性、非可加性。避免将度量设置为文本型。
(2)粒度:事务、周期快照、累计快照
(3)表示维度间多对多关系
维度表:包含业务的文字描述
(1)维度表有多列或属性
(2)倾向于行数做得相当少,将列数做得特别大
(3)访问事实表的入口,使用数据仓库的接口
(4)文本型或描述性
一数字型字段用做实事还是维度属性判别标准
(1)含有许多取值并参与运算的度量值->当实事看待
(2)变化不多并参与作为约束条件的离散取值的描述->当维属性看待
实事与维度融合
(1)规范化ER图
将ER图分解为分散的业务过程单独建模,将ER图具有数字型或可加性非关键字实事的多对多关系作为实事表,将所有表复合成具有直接连接到实事表的平面表做为维度表。可作为聚集环节范围内的角色而非最终目标
(2)维度建模
EAI:Enterprise Application Intergration(企业应用集成)
ODS:Operational Data Store(操作数据存储)

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21392612/viewspace-718096/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-08-27

  • 博文量
    12
  • 访问量
    18382