计算机应用
計算機應用
계산궤응용
Journal of Computer Applications
2015年
7期
1921-1926
,共6页
不确定数据%频繁模式%频繁项集%模式增长
不確定數據%頻繁模式%頻繁項集%模式增長
불학정수거%빈번모식%빈번항집%모식증장
uncertain data%Frequent Pattern (FP)%frequent itemset%pattern-growth
为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法.首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阔值进行比较,以确定某一项集是否为候选频繁项集,并对候选项集建立子树以递归挖掘频繁模式.实验中,UFPM-MP算法与AT-Mine算法进行了对比,并在6个典型的数据集上进行实验验证.实验结果表明,UFPM-MP算法的时空效率得到了提高,稀疏数据集上提高约30%,稠密数据集上的效率提高更为明显(约3~4倍).预估期望支持数的策略有效地减少了子树和头表项的数量.从而提高了算法的时空效率;且最小期望支持数越小,或需要挖掘的频繁模式越多的时候,算法的时间效率提高越多.
為提高不確定數據頻繁模式(FP)挖掘算法的時空效率,提齣瞭基于最大概率的不確定頻繁模式挖掘(UFPM-MP)算法.首先,利用事務項集中的最大概率值預估期望支持數;然後,使用該期望支持數與最小期望支持數闊值進行比較,以確定某一項集是否為候選頻繁項集,併對候選項集建立子樹以遞歸挖掘頻繁模式.實驗中,UFPM-MP算法與AT-Mine算法進行瞭對比,併在6箇典型的數據集上進行實驗驗證.實驗結果錶明,UFPM-MP算法的時空效率得到瞭提高,稀疏數據集上提高約30%,稠密數據集上的效率提高更為明顯(約3~4倍).預估期望支持數的策略有效地減少瞭子樹和頭錶項的數量.從而提高瞭算法的時空效率;且最小期望支持數越小,或需要挖掘的頻繁模式越多的時候,算法的時間效率提高越多.
위제고불학정수거빈번모식(FP)알굴산법적시공효솔,제출료기우최대개솔적불학정빈번모식알굴(UFPM-MP)산법.수선,이용사무항집중적최대개솔치예고기망지지수;연후,사용해기망지지수여최소기망지지수활치진행비교,이학정모일항집시부위후선빈번항집,병대후선항집건립자수이체귀알굴빈번모식.실험중,UFPM-MP산법여AT-Mine산법진행료대비,병재6개전형적수거집상진행실험험증.실험결과표명,UFPM-MP산법적시공효솔득도료제고,희소수거집상제고약30%,주밀수거집상적효솔제고경위명현(약3~4배).예고기망지지수적책략유효지감소료자수화두표항적수량.종이제고료산법적시공효솔;차최소기망지지수월소,혹수요알굴적빈번모식월다적시후,산법적시간효솔제고월다.