微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
30期
144-145,164
,共3页
分布式数据流%频繁项%多线程并发技术
分佈式數據流%頻繁項%多線程併髮技術
분포식수거류%빈번항%다선정병발기술
在数据流挖掘领域中,频繁项集的挖掘是基础性的,也是比较关键的问题,但是现在的算法大多都是基于在单数据流中挖掘频繁项集,传统在单数据流上挖掘频繁项集的算法有Apriori算法,由于挖掘多个数据流上的频繁项集存在数据和模式冗余问题,对算法的时间和空间效率都具有很大的挑战性.本文基于Apriori算法和多线程并发技术的思想改进了Apriori算法生成在分布式数据流上挖掘频繁项算法A-Apriori,它采用逐层迭代和并发技术来解决多个数据流同时到来频繁项的挖掘问题.实验表明,该算法在保证挖掘精度的前提下,可以比其它在分布式数据流中挖掘频繁项的算法获得更好的效率.
在數據流挖掘領域中,頻繁項集的挖掘是基礎性的,也是比較關鍵的問題,但是現在的算法大多都是基于在單數據流中挖掘頻繁項集,傳統在單數據流上挖掘頻繁項集的算法有Apriori算法,由于挖掘多箇數據流上的頻繁項集存在數據和模式冗餘問題,對算法的時間和空間效率都具有很大的挑戰性.本文基于Apriori算法和多線程併髮技術的思想改進瞭Apriori算法生成在分佈式數據流上挖掘頻繁項算法A-Apriori,它採用逐層迭代和併髮技術來解決多箇數據流同時到來頻繁項的挖掘問題.實驗錶明,該算法在保證挖掘精度的前提下,可以比其它在分佈式數據流中挖掘頻繁項的算法穫得更好的效率.
재수거류알굴영역중,빈번항집적알굴시기출성적,야시비교관건적문제,단시현재적산법대다도시기우재단수거류중알굴빈번항집,전통재단수거류상알굴빈번항집적산법유Apriori산법,유우알굴다개수거류상적빈번항집존재수거화모식용여문제,대산법적시간화공간효솔도구유흔대적도전성.본문기우Apriori산법화다선정병발기술적사상개진료Apriori산법생성재분포식수거류상알굴빈번항산법A-Apriori,타채용축층질대화병발기술래해결다개수거류동시도래빈번항적알굴문제.실험표명,해산법재보증알굴정도적전제하,가이비기타재분포식수거류중알굴빈번항적산법획득경호적효솔.