计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
z2期
379-385
,共7页
不确定数据%数据流%频繁项集
不確定數據%數據流%頻繁項集
불학정수거%수거류%빈번항집
在很多应用中,不确定性数据都是以流的形式产生,例如传感器网络数据,移动对象跟踪数据等等.已有的基于不确定性数据流的频繁项集挖掘算法往往具有数据流储存结构繁琐、维护困难以及算法的计算量大等缺点.针对这种情况,提出了一种有效的数据结构SRUF-tree用于储存不确定性数据事务流的项集,该结构由全局树SRtree、临时表Table和窗口队列Queue三部分组成,其中全局树压缩着最近窗口容纳的所有的项集,临时表存储着每批项集的信息.基于该结构设计了一种新的算法SRUF-mine,它挖掘流频繁项集时只需要深度遍历全局树,动态维护SRUF-tree结构只需要处理窗口队列中最旧一批项集的临时表.理论和实验结果表明,SRUF-mine算法是一种有效的挖掘不确定性数据流频繁项集的算法,时空效率和扩展性均优于UF-streaming算法.
在很多應用中,不確定性數據都是以流的形式產生,例如傳感器網絡數據,移動對象跟蹤數據等等.已有的基于不確定性數據流的頻繁項集挖掘算法往往具有數據流儲存結構繁瑣、維護睏難以及算法的計算量大等缺點.針對這種情況,提齣瞭一種有效的數據結構SRUF-tree用于儲存不確定性數據事務流的項集,該結構由全跼樹SRtree、臨時錶Table和窗口隊列Queue三部分組成,其中全跼樹壓縮著最近窗口容納的所有的項集,臨時錶存儲著每批項集的信息.基于該結構設計瞭一種新的算法SRUF-mine,它挖掘流頻繁項集時隻需要深度遍歷全跼樹,動態維護SRUF-tree結構隻需要處理窗口隊列中最舊一批項集的臨時錶.理論和實驗結果錶明,SRUF-mine算法是一種有效的挖掘不確定性數據流頻繁項集的算法,時空效率和擴展性均優于UF-streaming算法.
재흔다응용중,불학정성수거도시이류적형식산생,례여전감기망락수거,이동대상근종수거등등.이유적기우불학정성수거류적빈번항집알굴산법왕왕구유수거류저존결구번쇄、유호곤난이급산법적계산량대등결점.침대저충정황,제출료일충유효적수거결구SRUF-tree용우저존불학정성수거사무류적항집,해결구유전국수SRtree、림시표Table화창구대렬Queue삼부분조성,기중전국수압축착최근창구용납적소유적항집,림시표존저착매비항집적신식.기우해결구설계료일충신적산법SRUF-mine,타알굴류빈번항집시지수요심도편력전국수,동태유호SRUF-tree결구지수요처리창구대렬중최구일비항집적림시표.이론화실험결과표명,SRUF-mine산법시일충유효적알굴불학정성수거류빈번항집적산법,시공효솔화확전성균우우UF-streaming산법.