ITPub博客

首页 > 大数据 > 数据挖掘 > 葡萄酒质量分析系统69

葡萄酒质量分析系统69

数据挖掘 作者:lintong1985 时间:2013-05-10 14:20:39 0 删除 编辑

 

基于模式识别方法的葡萄酒质量预测研究60(3) 对聚类算法进行研究,特别是针对划分的聚类算法,详细研究了 K-Means 聚类算法。(4) 设计并实现 KNN 和 K-Means 算法结合使用的实验,采用米尼奥大学(Universityof Minho, Guimar)提供的 Wine Quality 数据作为实验数据。通过反复实验,分别得到两组数据: 1) KNN 的运算时间; 2) KNN K-Means 混合算法的运算时间和误差率。 并对这两组数据进行分析,结果表明,使用 K-Means 会出现误差,为了降低误差率,必须要提高 K-Means 算法的 K,但同时就会提高混合算法的整体运算时间,所以,选择合适的参数,在可以接受的误差范围内,使用KNN K-Means 混合算法可以提高运算速度,进而提高模式识别分析预测速度。7.2 展望分类和预测是模式识别的一个重要技术,无论在 Internet 信息检索还是信息处理领域,该技术都有广阔的应用前景。本文虽然在模式识别分类, 聚类算法和分类算法改进的研究和应用上做了一些有益的探索工作,但是还有很多地方需要做进一步的研究:(1) 本文所用的测试数据集数据量还不是很大,下一步工作需要寻找更大量的数据集进行反复实验。(2) 聚类算法中的聚类初始中心点的选择以及如何移除噪声点,孤立点的研究也是今后研究的一个重要方面。(3) 本文未将 KNN 分类算法的 K 以及 K-Means 聚类算法的 K2 的选择及优化纳入研究范围,在下一步工作中需要将其纳入研究范围。(4) 分类算法还有其他好多种成熟的算法,考虑将来采用一些成熟的算法,如 SVM,贝叶斯等,作横向比较。(5) 质量分析系统的进一步的完善。

基于模式识别方法的葡萄酒质量预测研究61参考文献[1] 中华人民共和国国家标准――葡萄酒(GB 15037-2006)[S],中华人民共和国国家质量监督检验检疫总局,2006,4-7[2] Richard A.Johnson,Dean W.Wichern,Applied Multivariate Statistical Analysis[M],Prentice Hall,2007,13-17[3] J.P.Marques de Sa 著,吴逸飞译,模式识别原理、方法及应用[M],清华大学出版社,2002,1-4,12-17[4] 边肇祺,张学工,模式识别(第二版)[M],北京: 清华大学出版社,2000,1-6[5] 刘成林,谭铁牛,模式识别研究进展[C],科学出版社,2007 年 12 月, 2-9[6] 杨淑莹,模式识别与智能计算――Matlab 技术实现[M],电子工业出版社,2008,1-7[7] Keinosuke Funkunaga,Introduction to Statistical Pattern Recognition,SecondEdition[M],Academic Press,1990,1-9,508-514[8] 宋彦坡、彭小奇,数据挖掘技术及其在工业生产中的应用[J],计算机测量与控制,2004,12(10),944-947[9] D.P.Ballou,G. K.Tayi,Enhancing data quality in data warehouse environments[C],Communication of ACM,1999,42,73-78[10] Piatetsky-Shapiro G , Data mining and Knowledge Discovery in BusinessDatabases[J], ISMIS'96,56-57[11] 陈文伟,智能决策技术[M],北京,电子工业出版社,1998,5-6,114-149[12] A.Arning,R. Agrawal,P. Raghavan,A linear method for deviation detection in largedatabases[C],In Proc.1996 Int.Conf.Data Mining and Knowledge Discovery (KDD'96),1996,8,164-199[13] Mihael Ankerst, Christian Elsen, Martin Ester, Hans-Peter Kriegel,An interactiveapproach to decision tree construction[C] , In Proc.1999 Int.Conf.KnowledgeDiscovery and Data Mining(KDD' 99),1999,8,392-396[14] 汤宇松,数据挖掘系统设计,系统工程理论与实践[M],2000,9,57-63[15] Jiawei Han,Micheline Kamber 著,范明、孟小峰译,数据挖掘概念与技术[M],机械工业出版社,2001,223-262[16] 李初民,吴中福,王康,数值属性的离散化方法研究[J],计算机工程与科学,

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21581742/viewspace-1119063/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-05-06