📅  最后修改于: 2021-01-11 06:27:33             🧑  作者: Mango
数据挖掘的定义是从大量数据中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识。此信息可以用于以下任何应用程序-
数据挖掘引擎对于数据挖掘系统非常重要。它由一组执行以下功能的功能模块组成-
这是领域知识。该知识用于指导搜索或评估结果模式的趣味性。
有些人将数据挖掘与知识发现等同对待,而另一些人则将数据挖掘视为知识发现过程中的重要步骤。这是知识发现过程中涉及的步骤列表-
用户界面是数据挖掘系统的模块,有助于用户与数据挖掘系统之间的通信。用户界面允许以下功能-
数据集成是一种数据预处理技术,它将来自多个异构数据源的数据合并到一个一致的数据存储中。数据集成可能涉及不一致的数据,因此需要清除数据。
数据清理是一种用于删除嘈杂数据并纠正数据不一致的技术。数据清理涉及转换以纠正错误的数据。在为数据仓库准备数据时,将数据清理作为数据预处理步骤执行。
数据选择是从数据库中检索与分析任务相关的数据的过程。有时,数据转换和合并是在数据选择过程之前执行的。
群集是指一组相似类型的对象。聚类分析是指形成一组非常相似但与其他聚类中的对象有很大不同的对象。
在此步骤中,通过执行摘要或聚合操作,将数据转换或合并为适合挖掘的形式。