📅  最后修改于: 2023-12-03 14:59:21.995000             🧑  作者: Mango
apyori
是一个开源 Python 模块,用于在大型数据集中发现频繁项集并构建关联规则。该库使用 Apriori 算法来实现此目的。
安装 apyori
库只需使用 pip
命令:
pip install apyori
要使用 apyori
库,需要先导入它并创建一个 transactions
列表,其中每个子列表包含一个或多个项目。以下是一个简单的使用示例:
from apyori import apriori
transactions = [
['beer', 'nuts'],
['beer', 'cheese'],
['cheese', 'nuts'],
['beer', 'nuts', 'cheese'],
['wine', 'cheese', 'nuts']
]
results = list(apriori(transactions))
此代码将生成一个包含所有频繁项集和关联规则的列表 results
。每个频繁项集和规则都是一个命名元组,其中包含一些有用的信息,例如支持度和置信度。
要访问每个频繁项集或规则,可以使用以下示例代码:
for result in results:
print(result)
apyori
函数接受多个可选参数,以根据数据集的不同特征优化 Apriori 算法的行为。这些包括:
min_support
:频繁项集的最小支持度阈值,默认为 0.1。min_confidence
:关联规则的最小置信度阈值,默认为 0.5。min_lift
:关联规则的最小提升度阈值,默认为 1.0。max_length
:频繁项集的最大长度,默认为 None。以下代码展示了如何使用这些参数:
results = list(apriori(transactions, min_support=0.2, min_confidence=0.7))
apyori
是一个简单易用的 Python 库,可用于在大型数据集中发现频繁项集和关联规则。它提供了多个可选参数,以便用户优化算法的行为。