计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2012年
2期
326-329
,共4页
频繁项目集%最大频繁项目集%条件模式基%项头表%剪枝策略%压缩策略
頻繁項目集%最大頻繁項目集%條件模式基%項頭錶%剪枝策略%壓縮策略
빈번항목집%최대빈번항목집%조건모식기%항두표%전지책략%압축책략
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销.在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率.最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性.实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍.
針對已有算法為瞭減少PF-tree中路徑被重複遍歷的次數,需要保存FP-tree中所有頻繁1-項集的條件模式基的問題,對FP-tree的數據結構進行脩改,使得隻需要保存FP-tree中每箇葉子節點的父節點到根節點路徑上項目組成的條件模式基,降低瞭保存條件模式基的存儲空間開銷.在分析最大頻繁項目集挖掘算法中搜索空間以及數據錶示方法的基礎上,通過理論分析和證明,設計瞭剪枝策略和壓縮策略,縮小瞭算法搜索空間,壓縮瞭FP-tree的規模,提高瞭算法的執行效率.最後將新算法分彆與NHTFPG算法、FpMAX算法進行對比,驗證算法的正確性和有效性.實驗結果錶明,新算法保存FP-tree條件模式基所需要的存儲空間不到NHTFPG算法的50%,執行效率比FpMAX算法提高瞭2~3倍.
침대이유산법위료감소PF-tree중로경피중복편력적차수,수요보존FP-tree중소유빈번1-항집적조건모식기적문제,대FP-tree적수거결구진행수개,사득지수요보존FP-tree중매개협자절점적부절점도근절점로경상항목조성적조건모식기,강저료보존조건모식기적존저공간개소.재분석최대빈번항목집알굴산법중수색공간이급수거표시방법적기출상,통과이론분석화증명,설계료전지책략화압축책략,축소료산법수색공간,압축료FP-tree적규모,제고료산법적집행효솔.최후장신산법분별여NHTFPG산법、FpMAX산법진행대비,험증산법적정학성화유효성.실험결과표명,신산법보존FP-tree조건모식기소수요적존저공간불도NHTFPG산법적50%,집행효솔비FpMAX산법제고료2~3배.