ITPub博客

首页 > 大数据 > 数据挖掘 > 世界临床医学论文发表浅析数据挖掘技术的作用

世界临床医学论文发表浅析数据挖掘技术的作用

数据挖掘 作者:徐辉军 时间:2013-09-10 14:47:11 0 删除 编辑

[摘要] 介绍数据挖掘的概念、过程、方法、医学数据的特点以及数据挖掘在临床医学中的应用情况。

  [关键词] 世界临床医学论文发表,医学论文发表,数据挖掘,医学,人工智能

  数据挖掘是近年来随着数据库和人工智能技术的发展而出现的一种全新信息技术,是指从大量的、不完全的、有噪声的、模糊的数据中提取隐含在其中的人们事先不知道的、但又是潜在有用的信息的过程。数据挖掘又是一种决策支持过程,它能高度自动化地分析数据仓库中原有的数据,做出归纳性推理,从中挖掘出潜在的模式,帮助决策者做出正确决策。医学领域同样存在大量的数据,包括完整的人类遗传密码信息,大量关于病人的病史、诊断、检验和治疗的临床信息、药品管理信息、医院管理信息等。数据挖掘理论应用于医学,通过对医学数据进行分析,提取隐含在其中的有价值有意义的信息,对于医生明确诊断、治疗病人及促进疾病和健康的研究都具有极其重要的意义。然而,目前大多数医院对数据库的处理仅限数据的录入、修改、查询、删除等平凡过程,属于医学数据库的低端操作,缺乏数据的集成和分析,更谈不上医学决策和知识的自动获取。如何利用这些海量的信息资源来为疾病的诊断和治疗提供科学的决策,总结各种医治方案的疗效,更好地为医院的决策管理、医疗、科研和教学服务,已越来越为人们所关注,正是在这种背景下,医学数据挖掘应运而生。

  一、医学数据挖掘的过程

  数据挖掘的过程是很难定义的。一些研究者定义了一系列的步骤,从而为此提供了一个框架,目的在于为各种数据挖掘方法在不同领域的应用提供指导,这些框架可能在步骤上略有不同,但同样适用于医学数据挖掘。一般都涉及下列6个方面的医学知识探求过程:理解所要解决的问题在医学领域的价值;理解数据;准备数据;数据挖掘;对所得到的结论的评估;利用得到的结论二、医学数据挖掘的工具对医学数据库进行数据挖掘和知识发现的主要目的是预测疾病和对疾病进行分类。分类和预测是两种数据分析形式,可以用于描述重要数据类的模型或预测未来的数据趋势 医学数据挖掘常用的用于分类和预测的智能化方法有粗糙集理论、人工神经网络、决策树、进化计算法等1.粗糙集理论。粗糙集理论近年来得到了迅速的发展和完善,是一种用于处理不确定性和含糊性知识的计算方法,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则,并从中发现隐含的知识,揭示潜在的规律。

  2.人工神经网络。人工神经网络是近年来颇受关注的一种算法,它为解决复杂的问题提供了一种相对有效且简单的方法。人工神经网络方法模拟人脑神经元结构,是通过训练来学习的非线性预测模型,可以完成分类、聚类、关联规则挖掘等多种数据挖掘任务,人工神经网络具有很强的自组织性和容错性。

  3.决策树。决策树是一种用树枝状展现数据受各变量影响情况的分析预测模型,根据对目标变量产生效应的不同,而制定分类规则,它是建立在信息论基础之上对数据进行分类的一种方法。它首先通过一批已知的训练数据建立一颗决策树,然后采用建好的决策树对数据进行预测。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。

  4.进化计算法。进化计算法是由生物进化规律而演化出的一种搜索和优化的计算方法,它包括遗传算法、进化规划、进化策略和遗传编程。进化计算法从任何一个初始的群体出发,通过随机选择、交叉和变异等过程,使群体进化到搜索空间中越来越好的区域。

  三、医学数据挖掘的特点

  1.医学数据的异质性。医学数据具有大容量和复杂性,医学数据包括各种不同的图像、与病人交谈、医生的注释和解释等,这些都是疾病诊断预后及治疗的基础,是数据挖掘应该考虑的问题。医生对图像信号及其他临床数据的解释是用非结构化的语言来表示的,很难标准化,甚至于同一部门专家对病人状态的含糊描述也不能达到一致意见,他们不仅用不同的名称描述同一个疾病,还用不同的语法结构描述医学条目之间的关系,因此对其数据挖掘是很困难的。医学数据的低数学特性,医学数据如语言的描述及其图像很难用公式等式以及模式来描述。非规范形式,生物医学领域中,甚至于对一个基本概念也没有规范化描述。本文来源世界临床医学论文发表:http://www.yixueqikanw.com

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23458363/viewspace-1121775/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2010-03-06