ITPub博客

首页 > 大数据 > Hadoop > 推荐几个开源的数据挖掘软件[转]

推荐几个开源的数据挖掘软件[转]

Hadoop 作者:scottsw 时间:2010-04-02 21:03:43 0 删除 编辑

1 weka http://www.cs.waikato.ac.nz/ml/weka/

2 Yale http://rapid-i.com/

3 KNIME http://www.knime.org/index.html

4 R (统计软件) http://www.r-project.org/

5 Rattle(R基础上的GUI) http://rattle.togaware.com/" TARGET=_blank> http://rattle.togaware.com/

AlphaMiner(哈工大基于weka内核开发) http://bi.hitsz.edu.cn/AlphaMiner/index.htm

在Excel中实现了决策树、神经网络等算法。可惜VBA工程被作者加密了,不能看到源码。

 

http://www.geocities.com/adotsaha/

Apache Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。

http://lucene.apache.org/

传统的数据挖掘套件(Classic suites):
SAS Enterprise Miner 5.3
SPSS Clementine 12
 
开源数据挖掘软件(Open Source):
RapidMiner 4.2
KNIME 1.3.5
Weka 3.4.13
 
自动化数据挖掘软件(Self-Acting):
KXEN Analytic Framework 4.04
 
专门化的数据挖掘软件(Specialized):
Viscovery SOMiner 5.0
prudsys Discovery 5.5 / Basket Analyzer 5.2
Bissantz Delta Master 5.3.6
 
BI产品内置的数据挖掘软件(BI Vendors):
SAP NetWear 7.0 Data Mining Workbench
Oracle 11g Data Mining
Microsoft SQL Server 2005 Analysis Services

 

    SAS公司的 Enterprise Miner

    IBM公司的 Intelligent Miner

    SPSS公司的 Clementine

    Statsoft公司的Statistica Data Miner

    DB Miner公司的 DBMiner

    NCR公司的Teradata Warehouse Miner

    Unica公司的Affinium Model

    Insightful公司的Insightful Miner

    Data Miner 公司的RIK, EDM and DMSK

    Information Discovery 公司的Data Mining Suite

    Angoss 公司的 KnowledgeSTUDIO

    Data Mining Technologies 公司的 Nuggets

    Fujitsu公司的 GhostMiner

    Oracle公司的 Darwin

 

比较著名的有IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine等,它们都能够提供常规的挖掘过程和挖掘模式。

    3.1 Intelligent Miner

    由美国IBM公司开发的数据挖掘软件Intelligent Miner是一种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括Intelligent Miner for Data和Intelligent Miner for Text。Intelligent Miner for Data可以挖掘包含在数据库、数据仓库和数据中心中的隐含信息,帮助用

    户利用传统数据库或普通文件中的结构化数据进行数据挖掘。它已经成功应用于市场分析、诈骗行为监测及客户联系管理等;Intelligent Miner for Text允许企业从文本信息进行数据挖掘,文本数据源可以是文本文件、Web页面、电子邮件、Lotus Notes数据库等等。

    3.2 Enterprise Miner[5]

    这是一种在我国的企业中得到采用的数据挖掘工具,比较典型的包括上海宝钢配矿系统应用和铁路部门在春运客运研究中的应用。SAS Enterprise Miner是一种通用的数据挖掘工具,按照“抽样——探索——转换——建模——评估”的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的“端到端”知识发现。

    3.3 SPSS Clementine

    SPSS Clementine是一个开放式数据挖掘工具,曾两次获得英国政府SMART 创新奖,它不但支持整个数据挖掘流程,从数据获取、转化、建模、评估到最终部署的全部过程,还支持数据挖掘的行业标准——CRISP-DM。Clementine的可视化数据挖掘使得"思路"分析成为可能,即将集中精力在要解决的问题本身,而不是局限于完成一些技术性工作(比如编写代码)。提供了多种图形化技术,有助理解数据间的关键性联系,指导用户以最便捷的途径找到问题的最终解决办法。

    其它常用的数据挖掘工具还有LEVEL5 Quest 、MineSet (SGI) 、Partek 、SE-Learn 、SPSS 的数据挖掘软件Snob、Ashraf Azmy 的SuperQuery 、WINROSA 、XmdvTool 等。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22425139/viewspace-1120756/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-08-27