📜  数据挖掘-应用程序和趋势

📅  最后修改于: 2021-01-11 06:34:19             🧑  作者: Mango


数据挖掘被广泛应用于各个领域。今天有许多商业数据挖掘系统可用,但是在这一领域中存在许多挑战。在本教程中,我们将讨论数据挖掘的应用程序和趋势。

数据挖掘应用

这是广泛使用数据挖掘的区域列表-

  • 财务数据分析
  • 零售业
  • 电信业
  • 生物数据分析
  • 其他科学应用
  • 入侵检测

财务数据分析

银行和金融业中的金融数据通常是可靠且高质量的,这有助于系统的数据分析和数据挖掘。一些典型的情况如下-

  • 设计和构建用于多维数据分析和数据挖掘的数据仓库。

  • 贷款支付预测和客户信贷政策分析。

  • 对客户进行分类和分类以进行有针对性的营销。

  • 侦查洗钱和其他金融犯罪。

零售业

数据挖掘在零售行业中具有广泛的应用,因为它从销售,客户购买历史,货物运输,消费和服务中收集了大量数据。很自然,由于网络的易用性,可用性和普及性不断提高,收集的数据量将继续快速增长。

零售行业中的数据挖掘有助于确定客户的购买模式和趋势,从而改善客户服务质量并保持良好的客户保留率和满意度。这是零售业中数据挖掘的示例列表-

  • 基于数据挖掘优势的数据仓库的设计和构建。

  • 对销售,客户,产品,时间和区域进行多维分析。

  • 分析销售活动的有效性。

  • 客户保留。

  • 产品推荐和项目的交叉引用。

电信业

如今,电信行业是提供各种服务(如传真,传呼机,蜂窝电话,Internet Messenger,图像,电子邮件,Web数据传输等)的新兴行业之一。由于新计算机和通信技术的发展,电信行业正在迅速发展。这就是为什么数据挖掘对于帮助和理解业务变得非常重要的原因。

电信行业中的数据挖掘有助于识别电信模式,捕获欺诈活动,更好地利用资源并提高服务质量。以下是数据挖掘可改善电信服务的示例列表-

  • 电信数据的多维分析。

  • 欺诈模式分析。

  • 识别异常模式。

  • 多维关联和顺序模式分析。

  • 移动电信服务。

  • 在电信数据分析中使用可视化工具。

生物数据分析

最近,我们看到了生物学领域的巨大发展,例如基因组学,蛋白质组学,功能基因组学和生物医学研究。生物数据挖掘是生物信息学中非常重要的一部分。以下是数据挖掘为生物数据分析做出贡献的各个方面-

  • 异构,分布式基因组和蛋白质组数据库的语义集成。

  • 比对,索引,相似性搜索和比较分析多个核苷酸序列。

  • 发现结构模式并分析遗传网络和蛋白质途径。

  • 关联和路径分析。

  • 遗传数据分析中的可视化工具。

其他科学应用

上面讨论的应用程序倾向于处理统计技术适合的相对较小且同质的数据集。已经从诸如地球科学,天文学等科学领域收集了大量数据。由于在各个领域(例如气候和生态系统建模,化学工程,流体动力学等)中的快速数值模拟,正在生成大量数据集。 。以下是数据挖掘在科学应用领域中的应用-

  • 数据仓库和数据预处理。
  • 基于图的挖掘。
  • 可视化和特定领域的知识。

入侵检测

入侵是指威胁完整性,机密性或网络资源可用性的任何类型的行为。在这个连通性世界中,安全性已成为主要问题。随着Internet使用的增加以及入侵和攻击网络的工具和技巧的可用性,入侵检测已成为网络管理的重要组成部分。这是可以将数据挖掘技术应用于入侵检测的区域列表-

  • 开发用于入侵检测的数据挖掘算法。

  • 关联和相关性分析,聚合可帮助选择和建立区分属性。

  • 流数据分析。

  • 分布式数据挖掘。

  • 可视化和查询工具。

数据挖掘系统产品

有许多数据挖掘系统产品和特定于域的数据挖掘应用程序。新的数据挖掘系统和应用程序将添加到以前的系统中。另外,正在努力使数据挖掘语言标准化。

选择数据挖掘系统

数据挖掘系统的选择取决于以下功能-

  • 数据类型-数据挖掘系统可以处理格式化的文本,基于记录的数据和关系数据。数据也可以是ASCII文本,关系数据库数据或数据仓库数据。因此,我们应该检查数据挖掘系统可以处理的确切格式。

  • 系统问题-我们必须考虑数据挖掘系统与不同操作系统的兼容性。一个数据挖掘系统只能在一个操作系统上运行,也可以在多个操作系统上运行。还有一些数据挖掘系统,它们提供基于Web的用户界面并允许XML数据作为输入。

  • 数据源-数据源是指数据挖掘系统将以其运行的数据格式。某些数据挖掘系统可能仅适用于ASCII文本文件,而其他数据挖掘系统则可能适用于多个关系源。数据挖掘系统还应该支持ODBC连接或OLE DB for ODBC连接。

  • 数据挖掘功能和方法-有些数据挖掘系统仅提供一种数据挖掘函数,例如分类,而有些则提供多种数据挖掘功能,例如概念描述,发现驱动的OLAP分析,关联挖掘,链接分析,统计分析,分类,预测,聚类,离群分析,相似性搜索等。

  • 将数据挖掘与数据库或数据仓库系统耦合-数据挖掘系统需要与数据库或数据仓库系统耦合。耦合的组件集成到统一的信息处理环境中。这是下面列出的耦合类型-

    • 无耦合
    • 松耦合
    • 半紧联轴器
    • 紧耦合
  • 可伸缩性-数据挖掘中存在两个可伸缩性问题-

    • 行(数据库大小)可伸缩性-当数量或行数扩大10倍时,数据挖掘系统被认为是行可伸缩的。执行查询的时间不超过10次。

    • 列(维度)可销售性-如果挖掘查询的执行时间随列数线性增加,则数据挖掘系统被视为列可伸缩。

  • 可视化工具-数据挖掘中的可视化可分为以下几类-

    • 数据可视化
    • 挖掘结果可视化
    • 采矿过程可视化
    • 可视数据挖掘
  • 数据挖掘查询语言和图形用户界面-易于使用的图形用户界面对于促进用户指导的交互式数据挖掘非常重要。与关系数据库系统不同,数据挖掘系统不共享基础数据挖掘查询语言。

数据挖掘趋势

数据挖掘概念仍在发展,这是我们在该领域看到的最新趋势-

  • 应用探索。

  • 可扩展的交互式数据挖掘方法。

  • 数据挖掘与数据库系统,数据仓库系统和Web数据库系统的集成。

  • S标准化数据挖掘查询语言。

  • 可视数据挖掘。

  • 挖掘复杂类型数据的新方法。

  • 生物数据挖掘。

  • 数据挖掘和软件工程。

  • 网络挖掘。

  • 分布式数据挖掘。

  • 实时数据挖掘。

  • 多数据库数据挖掘。

  • 数据挖掘中的隐私保护和信息安全。