关联规则挖掘
?1.Apriori关联规则挖掘 ? ----->Apriori算法希望的是完全的标称型数据,如果有数值型属性,必须先进行离散化。接下来我们导入数据集,切换至Associate面板,启动Apriori运行 ----->Apriori算法输出的10条规则,按照每一条规则后括号内的置信度量进行排序。规则按照"前件 num.1--->结论 num.2"的形式表示,前件后面的数字表示有多少个实例满足前件,结论后的数字表示有多少个实例满足整个规则,这即是规则的支持度. ------->现在研究Apriori参数的设置 ------->设置outputItemSets为true,再次运行Apriori算法,会显示所有这些不同项集和支持的实例数 ?2.挖掘现实数据集 ? ----->下面以美国国会议员投票信息的分析挖掘为例,我们的任务是基于投票模式预测其所属党派。 ?------>现在加载数据集,切换至Associate面板,选择Apriori算法。 ------->首先,输出中列出的最小支持度为0.45(196个实例),最小置信度度量为0.9,执行的次数为11.具体的10条规则就不一一分析了 ------->下面我们单击Visualize All按钮,弹出可视化窗口 ------>图中蓝色代表民主党,红色代表共和党。在前四行的16项属性中,由多项属性蓝色占据绝对的统治地位,基本全是蓝色柱;而红色占据统治地位的只有很少的几个属性,又因为覆盖率低而不具备竞争优势,未能入选。在人数上民主党占优势(267:168),加上有明确的政治观点,因此前十条关联规则都打上民主党的印 ?3.市场购物篮分析 ? ------->加载数据,单击预处理的“Edit”,打开数据集的Viewer窗口,查看数据文件,理解该数据结构 --------->切换至关联面板,启动Apriori算法 -------->分析十条关联规则,对于超市的经理来说,这些信息十分重要,可以根据挖掘到的知识重新安排货架,重新布局超市,提供快速付款通道以及安排送货的附加服务,以期提升市场竞争力。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |