国防科技大学学报
國防科技大學學報
국방과기대학학보
JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY
2009年
2期
90-93
,共4页
敖富江%杜静%陈彬%黄柯棣
敖富江%杜靜%陳彬%黃柯棣
오부강%두정%진빈%황가체
Top-K 最频繁模式%边界支持度%混合搜索%FP-Tree
Top-K 最頻繁模式%邊界支持度%混閤搜索%FP-Tree
Top-K 최빈번모식%변계지지도%혼합수색%FP-Tree
挖掘数据集中的Top-K最频繁模式具有重要意义.已有Top-K最频繁模式挖掘算法通常采用最频繁的k个项目作为初始项目,并将初始项目中频率最低的项目的支持度作为初始边界支持度.但实际组成Top-K最频繁模式的项目数目可能远少于k,从而制约了算法的效率.为此,提出了一种基于混合搜索方式的高效Top-K最频繁模式挖掘算法MTKFP.该算法首先利用宽度优先搜索获得少量的短项集,并利用短项集确定数目少于k的初始项目范围以及较高的初始边界支持度;然后利用深度优先搜索获得所有Top-K最频繁模式.实验表明,MTKFP算法所获得的初始项目数目至少低于已有算法70%,初始边界支持度高于已有算法;NTKFP算法的性能优于已有最好算法.
挖掘數據集中的Top-K最頻繁模式具有重要意義.已有Top-K最頻繁模式挖掘算法通常採用最頻繁的k箇項目作為初始項目,併將初始項目中頻率最低的項目的支持度作為初始邊界支持度.但實際組成Top-K最頻繁模式的項目數目可能遠少于k,從而製約瞭算法的效率.為此,提齣瞭一種基于混閤搜索方式的高效Top-K最頻繁模式挖掘算法MTKFP.該算法首先利用寬度優先搜索穫得少量的短項集,併利用短項集確定數目少于k的初始項目範圍以及較高的初始邊界支持度;然後利用深度優先搜索穫得所有Top-K最頻繁模式.實驗錶明,MTKFP算法所穫得的初始項目數目至少低于已有算法70%,初始邊界支持度高于已有算法;NTKFP算法的性能優于已有最好算法.
알굴수거집중적Top-K최빈번모식구유중요의의.이유Top-K최빈번모식알굴산법통상채용최빈번적k개항목작위초시항목,병장초시항목중빈솔최저적항목적지지도작위초시변계지지도.단실제조성Top-K최빈번모식적항목수목가능원소우k,종이제약료산법적효솔.위차,제출료일충기우혼합수색방식적고효Top-K최빈번모식알굴산법MTKFP.해산법수선이용관도우선수색획득소량적단항집,병이용단항집학정수목소우k적초시항목범위이급교고적초시변계지지도;연후이용심도우선수색획득소유Top-K최빈번모식.실험표명,MTKFP산법소획득적초시항목수목지소저우이유산법70%,초시변계지지도고우이유산법;NTKFP산법적성능우우이유최호산법.