计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
11期
2283-2293
,共11页
李海峰%章宁%朱建明%曹怀虎
李海峰%章寧%硃建明%曹懷虎
리해봉%장저%주건명%조부호
频繁项集%数据流%时间敏感%滑动窗口%数据挖掘
頻繁項集%數據流%時間敏感%滑動窗口%數據挖掘
빈번항집%수거류%시간민감%활동창구%수거알굴
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率.
數據流中的數據分佈隨著時間動態變化,但傳統基于事務的滑動窗口模型難以體現該特徵,因此挖掘結果併不精確.首先提齣時間敏感數據流處理中存在的問題,然後建立基于時間戳的滑動窗口模型,併轉換為基于事務的可變滑動窗口進行處理,提齣瞭頻繁項集的挖掘算法FIMoTS.該算法引入瞭類型變化界限的概唸,將項集進行動態分類,根據滑動窗口大小的變化對項集進行延遲處理,僅噹項集的類型變化界限超齣一定閾值的時候纔進行支持度的重新計算,能夠達到剪枝的目的.在4種不同密度的數據集上完成的實驗結果顯示,該算法能夠在保證內存開銷基本不變的情況下顯著提高計算效率.
수거류중적수거분포수착시간동태변화,단전통기우사무적활동창구모형난이체현해특정,인차알굴결과병불정학.수선제출시간민감수거류처리중존재적문제,연후건립기우시간착적활동창구모형,병전환위기우사무적가변활동창구진행처리,제출료빈번항집적알굴산법FIMoTS.해산법인입료류형변화계한적개념,장항집진행동태분류,근거활동창구대소적변화대항집진행연지처리,부당항집적류형변화계한초출일정역치적시후재진행지지도적중신계산,능구체도전지적목적.재4충불동밀도적수거집상완성적실험결과현시,해산법능구재보증내존개소기본불변적정황하현저제고계산효솔.