数据挖掘中的市场篮子分析
一种用于在任何零售环境中发现购买模式的数据挖掘技术被称为购物篮分析。简单来说,数据挖掘中的购物篮分析基本上是分析一起购买的产品的组合。
这是一种仔细研究顾客在超市购物的技术。这个概念确定了客户频繁购买商品的模式。这种分析可以帮助促进公司的交易、报价、销售,而数据挖掘技术有助于实现这种分析任务。例子:
- 数据挖掘概念用于销售和市场营销,以提供更好的客户服务、改善交叉销售机会、提高直邮回复率。
- 通过数据挖掘,以模式识别和预测可能的缺陷的形式保留客户是可能的。
- 风险评估和欺诈领域也使用数据挖掘概念来识别不当或异常行为等。
购物篮分析主要使用关联规则 {IF} -> {THEN}。
- IF表示前件:前件是在数据中找到的项目
- THEN表示后果:后果是与前件结合的项目。
让我们看看数据挖掘中市场篮子分析中使用的关联规则 {IF} -> {THEN} 规则。例如,购买域的客户意味着他们肯定需要额外的插件/扩展来使用户更容易。
就像我们上面所说的,前因是数据中可用的项目集。通过从规则制定意味着{if}组件,从示例中是域。
与后件相同的是与前件组合找到的项目。通过从规则制定意味着{THEN}组件,并且从示例中是额外的插件/扩展。
借助这些,我们能够预测客户的行为模式。由此,我们能够与客户可能会购买这些产品的报价进行某些组合。这将自动增加公司的销售额和收入。
借助 Apriori 算法,我们可以进一步对消费者经常购买的商品集进行分类和简化。
APRIORI ALGORITHM 包含三个组件:
- 支持
- 信心
- 举起
现在举个例子,假设通过一个流行的电子商务网站进行了 5000 笔交易。现在他们想要计算这两种产品的支持度、置信度和提升度,例如笔和笔记本,其中 5000 笔交易、500 笔笔交易、700 笔笔记本交易以及两者的 1000 笔交易。
支持:它的计算方法是交易数量除以交易总数,
支持(笔)=笔相关的交易/总交易
即支持 -> 500/5000=10%
CONFIDENCE:计算产品销量是单卖热销还是组合销售热销。这是通过合并交易/单独交易计算的。
信心=合并交易/个人交易
即置信度-> 1000/500=20%
LIFT:计算提升是为了了解销售额的比率。
提升-> 20/10=2
当 Lift 值低于 1 时,意味着该组合不被消费者频繁购买。但在这种情况下,与单独出售的商品的交易相比,这表明同时购买这两样东西的可能性很高。
有了这个,我们对数据挖掘中的市场购物篮分析以及如何计算组合产品的销售额有了一个整体的看法。