📜  数据挖掘模型

📅  最后修改于: 2021-08-24 16:30:53             🧑  作者: Mango

先决条件–数据挖掘

数据挖掘的动机是识别现有数据中的有效,可能的有利且可理解的连接和模式。数据库技术已经变得更加发达,需要将大量数据存储在数据库中,而那些数据集中隐藏的知识被商人收集起来,作为制定重要业务决策的有用工具。数据挖掘使人们更加着迷,因为它有义务从原始数据中提取有价值的信息,企业可以使用这些信息通过有利可图的决策过程来扩大自己的业务。

数据挖掘用于描述数据库中的智能;它是使用数学,统计,人工智能和机器学习技术从数据库中提取和识别有用信息和后续知识的过程。数据挖掘整合了许多不同的算法来完成不同的任务。所有这些算法将模型吸收到数据中。该算法检查数据并调制与被检查数据的特征最接近的数据。数据挖掘算法可以描述为由三部分组成。

模型–模型的目的是使模型适合数据。
首选项–必须使用某些识别测试才能将一个模型拟合到另一个模型。
搜索–所有处理查找数据所需的算法。

数据挖掘模型的类型

  1. 预测模型
  2. 描述模型

数据挖掘模型

预测模型:
预测模型使用从各种数据中找到的已知结果来构成数据的预测关注值。可以基于变体历史数据的使用来进行预测建模。预测模型数据挖掘任务包括回归,时间序列分析,分类,预测。

预测模型称为统计回归。这是一种监视学习技术,它结合了将相似属性中的几个属性值对其他属性值的依存关系的说明与可以预测最近情况下这些属性值的模型的增长结合在一起。

  • 分类 –
    这是将对象分配给几个预定义类别之一的动作。或者,我们可以将分类定义为目标函数的学习函数,该目标函数将每个属性设置为预定义的类标签。
  • 回归–
    它用于适当的数据。这是一种验证函数数据值的技术。回归有两种类型-
    1.线性回归与搜索最佳线以适合两个属性相关联,因此可以将一个属性应用于预测另一个属性。
    2.多线性回归涉及两个或两个以上的属性,数据适合多维空间。
  • 时间序列分析–
    它是基于时间的一组数据。时间序列分析用作自变量,以估计时间上的因变量。
  • 预言 –
    它预测一些缺失或未知的值。

描述型号:
描述性模型区分数据中的关系或模式。与预测模型不同,描述性模型用作探索正在检查的数据的属性的方法,而不是预测新属性,聚类,汇总,关联规则和序列发现是描述性模型数据挖掘任务。

描述性分析专注于将数据汇总和转换为重要信息以进行监视和报告。

  • 聚类
    它是将一组抽象对象转换为相同对象类的技术。
  • 总结
    它以更深入,更易于理解的形式保存一组数据。
  • 关联规则–
    他们发现大量数据对象之间令人兴奋的一致性或因果关系。
  • 顺序 –
    这是数据中有趣模式的发现与有趣程度的某种客观或主观测量有关。