失效链接处理 |
《数据挖掘与数据仓库》课程实验指导书 PDF 下载
本站整理下载:
相关截图:
主要内容:
一、实验目的
1、掌握Apriori算法对于关联规则挖掘中频繁集的产生以及关联规则集合的产生过程;
2、根据算法描述编程实现算法,调试运行。并结合相关实验数据进行应用,得到分析结果。
数据和删除数据的操作。
实验类型:综合
计划课间:3学时
二、实验内容
1、频繁项集的生成与Apriori算法实现;
2、关联规则的生成过程与规则算法实现;
3、结合样例对算法进行分析;
三、实验步骤
编写程序完成下列算法:
1、Apriori算法
输入: 数据集D;最小支持数minsup_count;
输出: 频繁项目集L
L1={large 1-itemsets}
For (k=2; Lk-1≠Φ; k++)
Ck=apriori-gen (Lk-1); // Ck是k个元素的候选集
For all transactions t∈D do
begin Ct=subset(Ck,t); //Ct是所有t包含的候选集元素
for all candidates c ∈Ct do c.count++;
end
Lk={c ∈Ck| c.count ≧ minsup_count }
End
L=∪Lk;
2、apriori-gen (Lk-1) 候选集产生算法
输入: (k-1)-频繁项目集Lk-1
输出: k-频繁项目集Ck
For all itemset p∈Lk-1 do
For all itemset q∈Lk-1 do
If p.item1=q.item1, p.item2=q.item2, …,p.itemk-2=q.itemk-2, p.itemk-1<q.itemk-1
then
begin c=p∞q
if has_infrequent_subset(c, Lk-1)
then delete c
else add c to Ck
End
Return Ck
3、has_infrequent_subset(c, Lk-1)
功能:判断候选集的元素
输入: 一个k-频繁项目集Lk-1 ,(k-1)-频繁项目集Lk-1
输出:c是否从候选集中删除的布尔判断
For all (k-1)-subsets of c do
If Not(S∈Lk-1) THEN return TRUE;
Return FALSE;
4、Rule-generate(L,minconf)
输入:频繁项目集;最小信任度
输出:强关联规则
算法:
FOR each frequent itemset lk in L
generules(lk,lk);
|