ITPub博客

首页 > 大数据 > 数据挖掘 > 数据挖掘的步骤

数据挖掘的步骤

数据挖掘 作者:jnkpacking 时间:2013-05-07 11:30:45 0 删除 编辑

1、明确挖掘的任务,比如说是要进行分类、聚类或寻找关联规则等。

2、根据任务对所选择的数据进行预处理

3、选择具体的算法进行挖掘

4、对挖掘出来的模式进行评价,消减其中重复的部分,将最终的结果展现出来。

数据挖掘从一开始就是面向应用的,尤其在银行、电信、保险、交通、零售(如超级市场)等商业领域有着极其广泛的应用前景。

数据仓库DW、OLAP和数据挖掘DW是作为三种独立的信息处理技术出现的。数据仓库用于数据的存储和组织,OLAP集中于数据的分析,数据挖掘则致力于知识的自动发现。

它们都可以分别应用到信息系统的设计和实现中,以提高相应部分的处理能力。由于这三种技术内在的联系性和互补性,将它们结合起来就成为一种新的DSS(decision support system)架构,成为商务智能(Business Intelligence,BI)的3个支柱。即:DW+OLAP+DM--->支持BI的可行方案。这一架构以数据库中的大量数据为基础,其特点如下:

(1) 在底层的数据库中保存了大量的事务级细节数据。这些数据时整个DSS系统的数据来源。

(2)数据仓库对底层数据库中的事务级数据进行集成、转换、综合,重新组织成面向全局的数据视图,为DSS提供数据存储和组织的基础。

(3)OLAP从数据仓库中的集成数据出发, 构建面向分析的多维数据模型,再使用多维分析方法从多个不同的角度对多维数据进行分析、比较,分析活动从以前的方法驱动转向了数据驱动,分析方法和数据结构实现了分离。

(4)数据挖掘以数据仓库和数据库中的大量数据为基础,自动地发现数据中的潜在模式,并以这些模式为基础自动地进行预测分析。

数据挖掘表明知识就隐藏在日常积累下来的大量数据之中,仅靠复杂的算法和推理并不能发现知识,数据才是知识的源泉。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22478577/viewspace-1118883/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-09-05