📜  apyori - Python (1)

📅  最后修改于: 2023-12-03 14:59:21.995000             🧑  作者: Mango

apyori - Python

apyori 是一个开源 Python 模块,用于在大型数据集中发现频繁项集并构建关联规则。该库使用 Apriori 算法来实现此目的。

安装

安装 apyori 库只需使用 pip 命令:

pip install apyori
使用

要使用 apyori 库,需要先导入它并创建一个 transactions 列表,其中每个子列表包含一个或多个项目。以下是一个简单的使用示例:

from apyori import apriori

transactions = [
    ['beer', 'nuts'],
    ['beer', 'cheese'],
    ['cheese', 'nuts'],
    ['beer', 'nuts', 'cheese'],
    ['wine', 'cheese', 'nuts']
]

results = list(apriori(transactions))

此代码将生成一个包含所有频繁项集和关联规则的列表 results。每个频繁项集和规则都是一个命名元组,其中包含一些有用的信息,例如支持度和置信度。

要访问每个频繁项集或规则,可以使用以下示例代码:

for result in results:
    print(result)
参数

apyori 函数接受多个可选参数,以根据数据集的不同特征优化 Apriori 算法的行为。这些包括:

  • min_support:频繁项集的最小支持度阈值,默认为 0.1。
  • min_confidence:关联规则的最小置信度阈值,默认为 0.5。
  • min_lift:关联规则的最小提升度阈值,默认为 1.0。
  • max_length:频繁项集的最大长度,默认为 None。

以下代码展示了如何使用这些参数:

results = list(apriori(transactions, min_support=0.2, min_confidence=0.7))
结论

apyori 是一个简单易用的 Python 库,可用于在大型数据集中发现频繁项集和关联规则。它提供了多个可选参数,以便用户优化算法的行为。