ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 关于数据仓库的几个概念

关于数据仓库的几个概念

原创 Linux操作系统 作者:hquxiaoqi 时间:2011-05-10 07:59:37 0 删除 编辑
      “什么是数据库”:数据仓库是一个面向主题的集成的时变的非易失数据集合,支持管理决策制定。
 
面向主题的:
         数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是构造组织机构的日常操作和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明视图。
 
集成的:
         通常,构造数据仓库是将多个异种数据源,如关系数据库、一般文件和联机事务处理记录,集成在一起。使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量的一致性。
 
时变的:
        数据存储从历史的角度(例如,过去5-10 年)提供信息。数据仓库中的关键结构,隐式或显式地包含时间元素。
 
非易失的:
         数据仓库总是物理地分离存放数据;这些数据源于操作环境下的应用数据。由于这种分离,数据仓库不需要事务处理、恢复和并行控制机制。通常,它只需要两种数据访问:数据的初始化装入和数据访问。
 
 
        “什么是建立数据仓库(data warehousing) ":构造和使用数据仓库的过程.
 
         "数据仓库与数据集市的区别":
          数据仓库收集了关于整个组织的主题(如顾客、商品、销售、资产和人员)信息,因此是企业范围的。对于数据仓库,通常使用事实星座模式,因为它能对多个相关的主题建模。另一方面,数据集市是数据仓库的一个部门子集,它针对选定的主题,因此是部门范围的。对于数据集市,流行星形或雪花模式,因为它们都适合对单个主题建模,尽管星形模式更流行、更有效。
         
        "数据仓库的结构是什么样的?":
         底层是数据仓库服务器,它几乎总是一个关系数据库系统.
         中间层是OLAP 服务器,其典型的实现或者是(1)关系OLAP(ROLAP)模型,即扩充的关系DBMS,它将多维数据上的操作映射为标准的关系操作;或者是(2)多维OLAP(MOLAP)模型,即特殊的服务器,它直接实现多维数据和操作。
         顶层是客户,它包括查询和报告工具、分析工具、和/或数据挖掘工具(例如,趋势分析、预测等)。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/25281640/viewspace-694881/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2011-01-22

  • 博文量
    22
  • 访问量
    83641