ITPub博客

首页 > Linux操作系统 > Linux操作系统 > BI: Microsoft能与Oracle较量?

BI: Microsoft能与Oracle较量?

原创 Linux操作系统 作者:idba 时间:2008-08-16 22:12:38 0 删除 编辑
BI现在比较火,就像几年前的ERP那样。目前BI厂商都在急速的扩张中,年初Oracle把Hyperion收购了,最近SAP又把BO收购了,IBMCOGNOS收购了。从目前的一些行业分析报告来看,Oracle和SAS无疑是最有前途的厂商。  

diversity 

BID 

Market Leader Analysis


  从数据库来看,SQL Server显然不适合VLDB。Oracle的分区,索引,ASM,集群等特性,作为数据仓库应用合适。虽然SQL Server也有集群、分区等,但于Oracle DB比还不是一个档次的。SQL Server的数据仓库体系中,SSAS是非常有创新部分,特别是UDM的概念,使传统的数据仓库结构发生了很大的变化,很多情况下可以将SSAS的OLAP作 为一个数据集市满足需求。SQL Server的数据库引擎还是非常传统的关系型数据库,所以SSAS是一个独立的组件。而Oracle DB算是一种混合数据库,比如它可以有嵌套表;Dimension是一种类型,可以定义层次……Oracle的聚合查询可以使用物化视图,不必像SQL Server那样一定要通过SSAS的MOLAP实现。 

  通过收购,Oracle用一大堆的商业软件,其技术资源和市场资源都是它的优势。但是它的产品布局似乎有问题。比如它的ETL工具,那个ODI 似乎也是Oracle收购过来的,以前有朋友跟我说不要用OWB了,ODI才是未来的主打产品。不过现在看来OWB似乎才是主打,但是Siebel BI和Hyperion的产品中,又使用了Informatica的OEM产品。OLAP方面,Hyperion的Essbase跟Oracle DB中的OLAP显然不是一路货色,两者基本上不可能整合到一起。

  在收购Siebel之前,Oracle还没有专业的BI工具,所以现在的Siebel BI被改名叫Oracle BI。但不知道Hyperion被Oracle收购后命运如何,Hyperion的强项是OLAP,绩效管理和财务方面的应用,但是某些功能模块跟 Oracle原有体系的重合或者不相容,不知是否会被抛弃。可能性之一就是发展多套产品线,比如Oracle DB原有的OLAP,OWB,DataMining等,作为数据仓库的组件之一免费供应,就像SQL Server那样,而Siebel BI和Hyperion作为两套独立的BI产品。另一种可能性就是让Siebel BI作为专门的Operational BI,将Hyperion发展为专门的绩效管理工具。

  Microsoft的PerformancePoint正式版本我还没时间安装,CTP2和CTP3我是看过的,总体感觉还是比较简单的。另外 还有两个在开发中的组件,一个好像是Management Reporter的,一个是Data Integration的,目前都是CTP2版本。  


 从容量上对比一下Microsoft PerformancePoint和Hyperion Performance Management:

  Microsoft PerformancePoint一共96MB。

  Hyperion Performance Management,包括65个打包的zip文件,Windows和Linux版本一共20.4GB。

  在看看Siebel BI和Oracle DB 11g:

 

  Microsoft的DW / BI包括SQL Server,Excel,PerformancePoint,最多再加上SharePoint。光从容量上来看,Microsoft的内容只有Oracle的十几分之一。

  Oracle的另一优势就是跟其他商业软件整合。不过现在微软也有自己的Dynamics系列。比如Microsoft Dynamics CRM和Oracle Siebel CRM:

  800MB。

  Linux版本15G。

  800 : 15000就是Microsoft和世界第一CRM的差距。


 

  ETL工具最近用的是Informatica PowerCenter 8.1.1。总体来说,PowerCenter和SSIS各有各的优缺点。从易用性来说,Informaitca有四个开发管理组件,初学者可能不知道如 何下手,所以关键先要了解PowerCenter的开发流程。SSIS有BIDS和SSMS,主要的开发工作在BIDS上完成,但是BIDS是基于 Visaul Studio的,如果是没有做过.NET开发的人员,VS的复杂的开发环境可能让他们不知所措,但是对于熟悉VS的开发人员来说,通过VS,他们可以使用 更多的资源,比如源管理器,VSTFS等。从界面的人性化上看,SSIS无疑更好,这是Microsoft的一贯特色,PowerCenter有些地方连 右键菜单都没有。

  SSIS的数据流如同PowerCenter的Mapping,SSIS的控制流如同PowerCenter的Task,SSIS的 Package如同PowerCenter的WorkFlow。PowerCenter的Mapping和WorkFlow分开开发,在一个大型开发团队 中,开发人员开发Mapping,而有管理人员将多个Mapping在WorkFlow中统一调度。但如果是只有几个人的开发团队中,这种模式的效率就不 如SSIS了,因为小型团队中每个人都独立工作,开发人员需要开发好Mapping后,再在WorkFlow建立Session,需要再一次为 Session配置连接和参数。相反,SSIS不适合多人开发,因为不像PowerCenter将Mapping和WorkFlow分开开发,所以当一个 人在开发Package时,其他人就插不上手。

  SSIS的运行监控是非常棒的设计,可以看到数据流的执行情况。如果数据流出问题,可以马上知道在那个转换组件上发生了问题。而 PowerCenter的Monitor只能看到源和目标的情况,一旦出状况,就只能看日志了,但在日志大量的文本里,很多时候是找不出问题的所在。除了 执行时监控外,SSIS在开发时可以动态的Validate,而且它的Validate也严格得多。只要发现字段类型对应不上就会报错。 PowerCenter中Port的对应比较自由,比如一个Output的Port可以随意对应到多个Input的Port,而SSIS中一定要用多播组 件才行。所以在数据质量方面,SSIS比PowerCenter更有保障,PowerCenter最郁闷的是,报错后却找不到出错的地方。

  就组件的功能上,SSIS比PowerCenter要丰富,像SSIS控制流的循环组件,数据流中的模糊查找、词频计算、数据挖掘评分等组件都 是Informaitca没有的。特别是有很多针对SQL Server组件。如果使用非SQL Server数据库的话,SSIS功能上要打个七折。

  SSIS最致命的问题是数据库连接的兼容性上,数据流中很多组件只认OLE DB连接,而且只有OLE DB数据源组件才可以加参数,这显然是Microsoft有意为之。加上SSIS的Validate比较严格,所以连接到那些对OLE DB兼容不好的数据库就会报错,像我之前连接Oracle 9i就碰到这样的问题。PowerCenter支持更多的数据源,此外还可以连接SAP, PeopleSoft等商业软件,在大型企业中,这些功能是非常方便的。  

http://www.pcbeta.com/article/20071228/1382.html

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/1384/viewspace-429563/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-03-25

  • 博文量
    210
  • 访问量
    395464