计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
2期
466-469
,共4页
数据流%数据挖掘%频繁项%滑动窗口
數據流%數據挖掘%頻繁項%滑動窗口
수거류%수거알굴%빈번항%활동창구
分析了数据流频繁项挖掘算法EC的不足之处,如不能准确地挖掘最近一段时间内数据流的频繁项.提出了一种频繁项样本特征复合四元组的数据结构来保存样本集合,在此基础上,提出了一种基于滑动窗口的数据流频繁项挖掘算法--SWFPM.该算法能准确地挖掘出该滑动窗口中的频繁项.实验数据采用IBM合成数据发生器产生的顾客购物数据和1998年世界杯官方网站的访问日志数据.实验结果表明,该算法具有很高的频繁项挖掘准确度、快速的数据处理能力.
分析瞭數據流頻繁項挖掘算法EC的不足之處,如不能準確地挖掘最近一段時間內數據流的頻繁項.提齣瞭一種頻繁項樣本特徵複閤四元組的數據結構來保存樣本集閤,在此基礎上,提齣瞭一種基于滑動窗口的數據流頻繁項挖掘算法--SWFPM.該算法能準確地挖掘齣該滑動窗口中的頻繁項.實驗數據採用IBM閤成數據髮生器產生的顧客購物數據和1998年世界杯官方網站的訪問日誌數據.實驗結果錶明,該算法具有很高的頻繁項挖掘準確度、快速的數據處理能力.
분석료수거류빈번항알굴산법EC적불족지처,여불능준학지알굴최근일단시간내수거류적빈번항.제출료일충빈번항양본특정복합사원조적수거결구래보존양본집합,재차기출상,제출료일충기우활동창구적수거류빈번항알굴산법--SWFPM.해산법능준학지알굴출해활동창구중적빈번항.실험수거채용IBM합성수거발생기산생적고객구물수거화1998년세계배관방망참적방문일지수거.실험결과표명,해산법구유흔고적빈번항알굴준학도、쾌속적수거처리능력.