介绍
先验(Apriori)算法是挖掘关联式规则(Association Rules)的经典算法之一。
它的作用就是用来寻找数据当中的强关联式规则(Strong Association Rules)。
强关联式规则是满足最低支持度(minimum support)和最低置信度(minimum confidence)的规则。
规则:
X→Y;X和Y都属于I,且X和Y的交集为空。
支持度(support):
support(X → Y) = P(X U Y)
置信度(confidence):
confidence(X → Y) = P(Y | X)
算法

Step1:
遍历数据库,并且得出不同项(Item)的频数。
这个表被记为C1。

Apriori算法是数据挖掘中用于发现关联规则的经典方法,主要寻找满足最小支持度和最小置信度的规则。它通过遍历数据库生成项集,并逐步构造候选集,直至无法找到满足条件的项集为止。该算法在大型数据库中效率较低,易产生大量候选集。总结了Apriori算法的7个步骤及其计算置信度的方法。

3534

被折叠的 条评论
为什么被折叠?



