数据库与数据挖掘技术

 

广义而言,数据挖掘是在大型数据库中,自动、深入地发现有用信息的过程,它能够发现未知的有用模式、预测未来的观测结果。狭义而言,数据挖掘是指技术上的一类算法,如K-Means方法聚类分析方法、决策树方法等等...



提示:点击上方"质量大数据"快速关注

在如今的企业中,数据库可以说是人人皆知,它是相互关联的数据集和用以访问和管理这些数据集的程序组成的有机整体。数据库的发展和计算机技术以及数据存储和处理技术是紧密相关的:



什么是数据挖掘?

广义而言,数据挖掘是在大型数据库中,自动、深入地发现有用信息的过程,它能够发现未知的有用模式、预测未来的观测结果。比如分析某一段时间内机台的实际表现,以预测机台未来一段时间宕机的可能性,以及研究如何进一步提高机台的工作效率。狭义而言,数据挖掘是指技术上的一类算法,如K-Means方法聚类分析方法、决策树方法等等。

广义的数据挖掘是综合性的,它融合了数据存储与管理技术、统计学、人工智能、机器学习、信号处理、信息可视化等诸多方面的内容。

1989年,在第十一届国际联合人工智能学术会议上,“从数据库中发现知识”的说法被首次提出,“数据挖掘”的定义也在随后被确定下来。数据挖掘(Data Mining)又称为数据库中的知识发现(KDD:Knowledge Discovery in Database),是指从数据库中提取出隐含的、未知的、有用的信息或模式,以为实践提供决策支持(包括过程控制)。

数据挖掘技术的分类

数据挖掘技术一般有两种分类方法:根据发现知识的种类可以分为:分类(Classification)、关联分析(Association Analysis)、聚类分析(Clustering)、异常检测(Deviation Detection)等。根据所采用的技术可以分为:决策树、人工神经网络、关联规则、遗传算法、粗糙集等。值得一提的是,数据挖掘技术正在飞速发展,每年都会有新的方法和技术被提出。

[总结]两种分类方法的结合



本文部分信息为根据互联网公开资料整理,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。


    关注 质量大数据


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册