ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 数据质量:BI集成策略的“拦路虎”

数据质量:BI集成策略的“拦路虎”

原创 Linux操作系统 作者:renjixinchina 时间:2012-06-13 14:32:48 0 删除 编辑
【IT168信息化】数据集成是商业智能(BI)流程的关键组成部分,可将来自多个源系统的数据进行整合,并将它们合并到数据仓库以作分析。不过,对于BI数据集成策略,数据管理分析师提醒从业者不可掉以轻心;一旦设计执行不得当,策略很容易就会出现漏洞。

   美国Intelligent Solutions咨询公司的总裁Claudia Imhoff说,数据必须及时上传到数据仓库为BI计划所使用,若时机不当,所有的工作就会毁于一旦。由于有些用户需要对数据进行实时处理,这就要求BI 和数据集成团队充分理解企业的BI需求。

  Imhoff提到,数据质量非常重要,对不良数据进行校对与清理不应该只是BI数据集成流程的 专有功能。“错误无处不在,我们需要找出它们的来源。”只有这样,我们才能从一开始就预防源系统的数据错误。实际上,合并错误数据本来就是数据集成和BI 专家们工作的一部分,所以出了纰漏他们是要负责任的。她说:“我们需要让员工明白,他们的任务不仅仅是做一个传输者。”

  Gartner 分析师Ted Friedman认为,BI数据集成存在的最大问题就是人们对数据质量的关注度不够。“我已经从事数据集成工作超过十年之久了,但还是要花很多精力去说服 企业,让他们了解BI的作用和价值,使他们接受并信任自己的BI决策,这主要是由于他们还没找到正确的方法保证数据的质量。”

  Friedman说,对于“倔强”的企业,数据质量问题的负面影响不仅仅在于BI方面,但糟糕的数据质量绝对是BI项目获得成功实施的主要障碍之一。企业在将信息载入到数据仓库的过程中,从头到尾都忽视数据的质量、发现问题后也不采取任何减缓措施就会造成这样的局面。

  James Kobielus曾在Forrester公司担任分析师,今年初跳槽到了一家技术供应商。他指出,数据质量方面的失误已经成了BI数据集成工作中普遍存在的问题。

  Kobielus曾说过:“企业总以为把后台应用程序中的数据导入数据仓库以后,不需要做任何清理、匹配、融合或者转换工作就可以直接使用。”这样一来,公司总会碰到各种各样出其不意的问题。例如,“同一个名下出现六条记录,没人知道哪条才是正确的。”

  BI数据集成的影响力不可小觑

   Baseline Consulting公司的创始人之一Jill Dyche称,还有一个造成数据不一致而产生负面影响的原因,就是企业内部对记录系统结构存在分歧。打个比方,工作人员无法确定哪一个交易系统应该用作客 户地址信息源。这样的争论通常涉及“地址”的定义——在各不相同的情况下,到底以客户的账单地址为准?还是送货地址?抑或是公司地址?

  Dyche说:“就这样,论战相继而发,于是业务人员开始怀疑BI团队对于正确数据的理解及传输能力。然后,有人就会建议干脆把全部信息丢进一个数据库里,可业务人员又不愿意这么做。”

   9sight Consulting公司的创始人Barry Devlin认为,在制定BI数据集成的策略与方案过程中,员工不会造成什么太大的失误。“他们是业务团队中一个特殊的群体,拥有多年的数据处理经验,对 数据理解颇深;他们是十足的专家和达人。”因此,对于数据如何进行集成、怎样生成高效的BI应用程序,他们拥有最佳决定权。

   Devlin说,尽管如此,IT部门员工在大多数时候不仅负责实施工作,还需要改进数据集成方案。在Devlin看来,虽然IT专业人士可能对企业数据有 着很好的理解,但他们还不能称其为真正的专家。他说,使这两个团队联合起来共同完成BI数据集成困难重重,却别无选择。

  Imhoff 称,目前一些企业对BI毫无经验可言,也不具备满足BI项目数据集成需求的能力,却急于达成目标,制定出不切实际的计划。然而,对数据进行集成并上传到数 据仓库这一流程占据了整个BI项目60%到80%的工作量。如果一个项目团队想要一次完成所有的工作,那么他们不久后就会以失败告终。她认为这样的趋势正 在愈演愈烈,于是告诫道:“不要指望一口吃成一个胖子。”

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15747463/viewspace-732679/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 查询hba卡wwn号
请登录后发表评论 登录
全部评论

注册时间:2011-01-30

  • 博文量
    373
  • 访问量
    2047263