加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据挖掘回顾十二:关联规则挖掘之 FP-Growth 算法

发布时间:2020-12-14 02:39:06 所属栏目:大数据 来源:网络整理
导读:1,鉴于Apriori算法需要反复地扫描事务数据库,产生频繁项集候选的数量巨大,并且在计算支持度计数时工作量巨大。 2,为了 避免在产生候选时巨大的工作量 , J.Han(韩家炜) , J.Pei(裴健) ,and Y.Yin 提出了频繁模式增长算法,即本文中要说的FP-Growth 算法


1,鉴于Apriori算法需要反复地扫描事务数据库,产生频繁项集候选的数量巨大,并且在计算支持度计数时工作量巨大。

2,为了避免在产生候选时巨大的工作量J.Han(韩家炜),J.Pei(裴健),and Y.Yin 提出了频繁模式增长算法,即本文中要说的FP-Growth 算法。此算法最主要的有点就是避免了产生候选频繁集。


3,FP-Growth 算法利用了如下的性质局部频繁项由短模式生长出长模式,即先求短的频繁项,然后由短的频繁项衍生出长的频繁项。

4,FP-Growth 算法主要的步骤就是构造一棵 FP 树。如下图:



5, FP 树的优点如下:



6,条件模式基和条件FP 树:



7,FP-Growth 算法的思想和方法:



8,FP-Growth 算法 PK ?Apriori 算法:

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读