计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2010年
10期
108-111
,共4页
梁碧珍%陆月然%耿立中%秦亮曦
樑碧珍%陸月然%耿立中%秦亮晞
량벽진%륙월연%경립중%진량희
频繁模式%目标频繁模式%最大目标频繁模式%挖掘算法
頻繁模式%目標頻繁模式%最大目標頻繁模式%挖掘算法
빈번모식%목표빈번모식%최대목표빈번모식%알굴산법
通用的频繁模式挖掘算法通常产生庞大的频繁模式集,其中很多是用户不感兴趣的非目标模式.要排除这些非目标模式,用户必须进行"二次挖掘".TFP-growth虽然生成所有最大目标频繁模式,但要从中获得目标频繁模式,还需经过"二次挖掘".若在挖掘的早期就对非目标频繁模式的产生加以限制,则有望提高算法的效率.本文在TFP- growth 和SFP-growth的基础上,提出一种目标频繁模式挖掘算法STFP-growth,通过对TFP-树的排序、根据树根结点的不同情形采用不同的建子树方法和目标频繁模式筛选方法等来提高算法的效率.STFP-growth挖掘的结果是所有满足用户需求的目标频繁模式,不需"二次挖掘".实验表明,STFP-growth的效率高于TFP-growth,也明显优于Apriori和Eclat.
通用的頻繁模式挖掘算法通常產生龐大的頻繁模式集,其中很多是用戶不感興趣的非目標模式.要排除這些非目標模式,用戶必鬚進行"二次挖掘".TFP-growth雖然生成所有最大目標頻繁模式,但要從中穫得目標頻繁模式,還需經過"二次挖掘".若在挖掘的早期就對非目標頻繁模式的產生加以限製,則有望提高算法的效率.本文在TFP- growth 和SFP-growth的基礎上,提齣一種目標頻繁模式挖掘算法STFP-growth,通過對TFP-樹的排序、根據樹根結點的不同情形採用不同的建子樹方法和目標頻繁模式篩選方法等來提高算法的效率.STFP-growth挖掘的結果是所有滿足用戶需求的目標頻繁模式,不需"二次挖掘".實驗錶明,STFP-growth的效率高于TFP-growth,也明顯優于Apriori和Eclat.
통용적빈번모식알굴산법통상산생방대적빈번모식집,기중흔다시용호불감흥취적비목표모식.요배제저사비목표모식,용호필수진행"이차알굴".TFP-growth수연생성소유최대목표빈번모식,단요종중획득목표빈번모식,환수경과"이차알굴".약재알굴적조기취대비목표빈번모식적산생가이한제,칙유망제고산법적효솔.본문재TFP- growth 화SFP-growth적기출상,제출일충목표빈번모식알굴산법STFP-growth,통과대TFP-수적배서、근거수근결점적불동정형채용불동적건자수방법화목표빈번모식사선방법등래제고산법적효솔.STFP-growth알굴적결과시소유만족용호수구적목표빈번모식,불수"이차알굴".실험표명,STFP-growth적효솔고우TFP-growth,야명현우우Apriori화Eclat.