📜  数据挖掘中的多级关联规则

📅  最后修改于: 2021-08-25 17:50:33             🧑  作者: Mango

多级关联规则:
从挖掘信息的不同反射程度创建的关联规则称为各种级别或交错的关联规则。
在帮助确定性系统下,可以利用思想进展有效地挖掘多级关联规则。
高主意级别的规则可能会增加良好的判断力,而低主意级别的规则可能不会始终保持有价值。

在所有级别使用统一的最少帮助:

  • 在使用统一的最小帮助边缘时,重新安排了追踪系统。
  • 该技术同样简单明了,因为只需要客户指示一个最小的帮助边缘即可。
  • 在每个审议级别进行挖掘时,都会利用类似的最小帮助边缘。 (例如,从“ PC”向下挖掘到“ PC”)。发现“ PC”和“ PC”都是必需的,而“ PC”不是必需的。

多维规则的需求:

  • 有时,在低数据级别上,数据没有显示出任何重要的模式,但是背后隐藏着有用的信息。
  • 目的是在抽象级别之中或之间找到隐藏的信息。

多层关联规则挖掘的方法:

  1. 统一支持(对所有级别使用统一的最低支持)
  2. 减少支持(在较低级别上使用减少的最低支持)
  3. 基于组的支持(使用基于项目或基于组的支持)

让我们一一讨论。

  1. 统一支持–
    在使用统一的最小帮助边缘时,简化了搜索方法。该技术同样是基本的,因为仅需要客户确定单个最小帮助阈值。基于祖先是其后代的超集的信息,可以采用先进的技术。搜索不会分析项目集,其中包含没有最少支持的任何项目。但是,统一支持方法存在一些困难。较低抽象级别的项目不太可能像较高抽象级别的项目那样频繁发生。如果最小支持阈值设置得太高,则可能会错过低抽象级别上发生的几个有意义的关联。这为以下方法提供了动力。
  2. 减少支持–
    为了在支持减少的情况下挖掘各种级别的关系,可以使用以下各种选猎技术。
    • 各级独立性–
      这是一项全面的搜索,其中没有将常规项目集的基础信息用于修剪。检查每个集线器,而不管其父集线器是否被发现是连续的。
    • 级别–单项交叉分隔–
      会检查I级别的事物是否以及其(I-1)级别的父中心是否规则。总而言之,我们从更广泛的角度研究更明确的关系。如果中心很频繁,将对其孩子进行检查;否则,将从查询中删除其后代。
    • 十字路口分隔– – K-itemset –
      检查I级的一个项目集是否以及是否要进行检查。为了挖掘支持程度降低的各种级别的关系,有多种选择性的搜寻技术。
    • 各级独立性–
      这是一项全面的搜索,其中没有将常规项目集的基础信息用于修剪。会检查每个集线器,而不管其父集线器是否被发现是连续的。
    • 级别–单项交叉分隔–
      检查第一个级别的事物是否以及其父中心在(I-1)级别是否规则。总而言之,我们从更广泛的角度研究一种更明确的关系。如果中心很频繁,则将对它的孩子进行检查,否则将从查询中删除其后代。
    • 十字路口分隔– – K-项目集–
      检查是否在I级别设置的一个项目是否频繁以及是否恰好其对应的父项目集(i-1)级别很频繁。
  3. 基于组的支持–
    用户或专家输入用于支持和置信度的分组阈值。基于产品价格或项目集选择组,因为通常专家会了解哪些组比其他组更重要。
    例子 –
    例如,专家对非电子和非电子类别的笔记本电脑或衣服的购买方式感兴趣。因此,为此组设置了较低的支持阈值,以关注这些项目的购买方式。