📜  数据挖掘-术语

📅  最后修改于: 2021-01-11 06:27:33             🧑  作者: Mango


数据挖掘

数据挖掘的定义是从大量数据中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识。此信息可以用于以下任何应用程序-

  • 市场分析
  • 欺诈识别
  • 客户保留
  • 产品控制
  • 科学探索

数据挖掘引擎

数据挖掘引擎对于数据挖掘系统非常重要。它由一组执行以下功能的功能模块组成-

  • 表征
  • 关联和相关分析
  • 分类
  • 预测
  • 聚类分析
  • 离群分析
  • 进化分析

知识库

这是领域知识。该知识用于指导搜索或评估结果模式的趣味性。

知识发现

有些人将数据挖掘与知识发现等同对待,而另一些人则将数据挖掘视为知识发现过程中的重要步骤。这是知识发现过程中涉及的步骤列表-

  • 数据清理
  • 资料整合
  • 资料选择
  • 数据转换
  • 数据挖掘
  • 模式评估
  • 知识介绍

用户界面

用户界面是数据挖掘系统的模块,有助于用户与数据挖掘系统之间的通信。用户界面允许以下功能-

  • 通过指定数据挖掘查询任务与系统进行交互。
  • 提供信息以帮助集中搜索。
  • 基于中间数据挖掘结果进行挖掘。
  • 浏览数据库和数据仓库架构或数据结构。
  • 评估采掘模式。
  • 以不同形式可视化模式。

资料整合

数据集成是一种数据预处理技术,它将来自多个异构数据源的数据合并到一个一致的数据存储中。数据集成可能涉及不一致的数据,因此需要清除数据。

数据清理

数据清理是一种用于删除嘈杂数据并纠正数据不一致的技术。数据清理涉及转换以纠正错误的数据。在为数据仓库准备数据时,将数据清理作为数据预处理步骤执行。

资料选择

数据选择是从数据库中检索与分析任务相关的数据的过程。有时,数据转换和合并是在数据选择过程之前执行的。

集群

群集是指一组相似类型的对象。聚类分析是指形成一组非常相似但与其他聚类中的对象有很大不同的对象。

数据转换

在此步骤中,通过执行摘要或聚合操作,将数据转换或合并为适合挖掘的形式。