📜  数据挖掘

📅  最后修改于: 2021-09-09 10:13:54             🧑  作者: Mango

一般而言, “挖掘”是从地球中提取一些有价值的材料的过程,例如煤矿开采、钻石开采等。 在计算机科学的背景下, “数据挖掘”是指从大量数据中提取有用信息或数据仓库。可以看出,该术语本身有点令人困惑。在煤炭或钻石开采的情况下,提取过程的结果是煤炭或钻石。但是在数据挖掘的情况下,提取过程的结果不是数据!!相反,数据挖掘的结果是我们在提取过程结束时获得的模式和知识。从这个意义上说,数据挖掘也被称为知识发现或知识提取。 Gregory Piatetsky-Shapiro 在 1989 年创造了术语“数据库中的知识发现”。然而,术语“数据挖掘”在商业和新闻界变得越来越流行。目前,数据挖掘和知识发现可以互换使用。现在,几乎所有存储和处理大量数据的地方都使用数据挖掘。例如,银行通常使用“数据挖掘”来找出可能对信用卡、个人贷款或保险感兴趣的潜在客户。由于银行拥有客户的交易细节和详细资料,他们分析所有这些数据并尝试找出模式,帮助他们预测某些客户可能对个人贷款等感兴趣。

数据挖掘的主要目的
基本上,从数据挖掘收集的信息有助于预测隐藏的模式、未来趋势和行为,并允许企业做出决策。

从技术上讲,数据挖掘是从不同的角度、维度、角度分析数据并将其分类/总结为有意义的信息的计算过程。
数据挖掘可以应用于任何类型的数据,例如数据仓库、交易数据库、关系数据库、多媒体数据库、空间数据库、时间序列数据库、万维网。

数据挖掘全过程
数据挖掘的整个过程包括三个主要阶段:
1. 数据预处理——数据清洗、集成、选择和转换发生
2. 数据提取——精确数据挖掘的发生
3. 数据评估和展示——分析和展示结果数据挖掘

在以后的文章中,我们将详细介绍每个阶段。

数据挖掘的应用
1. 财务分析
2. 生物分析
3.科学分析
4. 入侵检测
5. 欺诈检测
6. 研究分析

数据挖掘的真实案例——市场篮子分析
市场篮子分析是一种技术,可以仔细研究客户在超市中的购买行为。该概念基本上用于识别客户一起购买的物品。比如说,如果一个人买了面包,那么他/她也购买黄油的可能性有多大?这种分析有助于促进公司的报价和交易。在数据挖掘的帮助下也是如此。