📜  数据挖掘中的多级关联规则

📅  最后修改于: 2021-09-09 10:54:40             🧑  作者: Mango

多级关联规则:
挖掘信息经过不同程度的反映而产生的关联规则称为多层次关联规则或交错关联规则。
在帮助确定性系统下,可以利用想法进展有效地挖掘多级关联规则。
高想法级别的规则可能会增加良好的判断力,而低想法级别的规则可能不会始终如一地有价值。

对所有级别使用统一最小帮助:

  • 在使用统一的最小帮助边缘时,将重新安排追踪系统。
  • 该技术同样简单明了,因为客户端只需要指出一个最小的帮助边缘。
  • 在每个深思熟虑的程度下进行挖掘时,都会使用类似的最小帮助边。 (例如从“PC”挖掘到“PC”)。 “PC”和“PC”都被发现是不间断的,而“PC”不是。

多维规则的需求:

  • 有时在低数据级别,数据没有显示出任何重要的模式,但背后隐藏着有用的信息。
  • 目的是在抽象层次中或抽象层次之间找到隐藏的信息。

多级关联规则挖掘的方法:

  1. 统一支持(对所有级别使用统一的最小支持)
  2. 减少支持(在较低级别使用减少的最低支持)
  3. 基于组的支持(使用基于项目或基于组的支持)

让我们一一讨论。

  1. 统一支持 –
    在使用统一的最小帮助边时,搜索方法被简化。该技术同样是基本的,因为客户端只需要确定一个最小帮助阈值。基于祖先是其后代的超集的信息,可以采用先进技术。搜索避免分析包含任何没有最低支持度的项目集。然而,统一支持方法有一些困难。较低抽象级别的项目不太可能像较高抽象级别的项目那样频繁出现。如果最小支持阈值设置得太高,它可能会错过在低抽象级别发生的几个有意义的关联。这为以下方法提供了动机。
  2. 减少支持 –
    为了挖掘支持减少的各种级别关系,有以下各种选择性狩猎技术。
    • 逐级独立——
      这是一个全广度搜索,其中没有使用常规项目集的基础信息进行修剪。无论是否发现其父集线器是不间断的,都会检查每个集线器。
    • 水平——通过单一事物交叉分离——
      当且仅当 (I-1) 级别的父集线器是常规的时,检查 I 级别的事物。总而言之,我们从更广泛的关系中研究更明确的关系。如果一个集线器很频繁,它的孩子将被检查;否则,它的后代将从查询中删除。
    • 通过 – K-itemset – 进行水平交叉分离
      I 级的 A 项集被检查是否且仅当它是为了挖掘支持减少的各种级别关系,有各种可选的狩猎技术。
    • 逐级独立——
      这是一个全广度搜索,其中没有使用常规项目集的基础信息进行修剪。无论是否发现其父集线器是不间断的,都会检查每个集线器。
    • 水平——通过单一事物交叉分离——
      当且仅当其在 (I-1) 级别的父集线器是常规的时,检查第 1 级的事物。总而言之,我们从更广泛的关系中研究更明确的关系。如果一个集线器是频繁的,它的孩子将被检查否则,它的后代将从查询中删除。
    • 水平交叉分离通过 – K-项目集 –
      当且仅当其对应的父项集 (i-1) 级别是频繁的时,检查 I 级别的 A 项集。
  3. 基于团体的支持 –
    支持度和置信度的分组阈值由用户或专家输入。该组是根据产品价格或项目集选择的,因为专家通常了解哪些组比其他组更重要。
    例子 –
    例如,专家对非电子类笔记本电脑或衣服的购买模式感兴趣。因此为该组设置了低支持阈值以关注这些项目的购买模式。