计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
2期
229-234
,共6页
数据挖掘%数据流%频繁项集%闭频繁项集
數據挖掘%數據流%頻繁項集%閉頻繁項集
수거알굴%수거류%빈번항집%폐빈번항집
数据流闭频繁项集挖掘算法得到了广泛的研究,其中一个典型的工作就是NewMoment算法.针对NewMoment算法存在搜索空间大而造成算法时间效率低的问题,提出了一种改进的数据流闭频繁项集挖掘算法A-New-Moment.它设计了一个二进制位表示项目与扩展的频繁项目列表相结合的数据结构,来记录数据流信息及闭频繁项集.在窗体初始阶段,首先挖掘频繁1-项集所产生的支持度为最大的最长闭频繁项集,接着提出新的“不需扩展策略”和“向下扩展策略”来避免生成大量中间结果,快速发现其余闭频繁项集,达到极大缩小搜索空间的目的.在窗体滑动阶段,提出“动态不频繁剪枝策略”来从已生成的闭频繁项集中快速删除非闭频繁项集,并提出“动态不搜索策略”来动态维护所有闭频繁项集的生成,以降低闭频繁项集的维护代价,提高算法的效率.理论分析与实验结果表明,A-New-Moment算法具有较好的性能.
數據流閉頻繁項集挖掘算法得到瞭廣汎的研究,其中一箇典型的工作就是NewMoment算法.針對NewMoment算法存在搜索空間大而造成算法時間效率低的問題,提齣瞭一種改進的數據流閉頻繁項集挖掘算法A-New-Moment.它設計瞭一箇二進製位錶示項目與擴展的頻繁項目列錶相結閤的數據結構,來記錄數據流信息及閉頻繁項集.在窗體初始階段,首先挖掘頻繁1-項集所產生的支持度為最大的最長閉頻繁項集,接著提齣新的“不需擴展策略”和“嚮下擴展策略”來避免生成大量中間結果,快速髮現其餘閉頻繁項集,達到極大縮小搜索空間的目的.在窗體滑動階段,提齣“動態不頻繁剪枝策略”來從已生成的閉頻繁項集中快速刪除非閉頻繁項集,併提齣“動態不搜索策略”來動態維護所有閉頻繁項集的生成,以降低閉頻繁項集的維護代價,提高算法的效率.理論分析與實驗結果錶明,A-New-Moment算法具有較好的性能.
수거류폐빈번항집알굴산법득도료엄범적연구,기중일개전형적공작취시NewMoment산법.침대NewMoment산법존재수색공간대이조성산법시간효솔저적문제,제출료일충개진적수거류폐빈번항집알굴산법A-New-Moment.타설계료일개이진제위표시항목여확전적빈번항목렬표상결합적수거결구,래기록수거류신식급폐빈번항집.재창체초시계단,수선알굴빈번1-항집소산생적지지도위최대적최장폐빈번항집,접착제출신적“불수확전책략”화“향하확전책략”래피면생성대량중간결과,쾌속발현기여폐빈번항집,체도겁대축소수색공간적목적.재창체활동계단,제출“동태불빈번전지책략”래종이생성적폐빈번항집중쾌속산제비폐빈번항집,병제출“동태불수색책략”래동태유호소유폐빈번항집적생성,이강저폐빈번항집적유호대개,제고산법적효솔.이론분석여실험결과표명,A-New-Moment산법구유교호적성능.