数据采集与处理
數據採集與處理
수거채집여처리
JOURNAL OF DATA ACQUISITION & PROCESSING
2012年
4期
508-513
,共6页
挖掘算法%闭合频繁项集%滑动窗口%数据流
挖掘算法%閉閤頻繁項集%滑動窗口%數據流
알굴산법%폐합빈번항집%활동창구%수거류
提出了一种新的CMNL-SW(Closed map and num list-sliding window)挖掘算法.具体使用数据结构Closed map存储挖掘到的闭合项集和Num list存储所有不同项的序号,通过对添加新事务和删除旧事务包含的项序号进行简单的并集和该事务与之相关已经挖掘到的闭合项集进行交集运算来更新当前滑动窗口,使之能够根据用户任意指定的支持度阈值在线输出数据流上闭合频繁项集信息.通过理论分析和对真实数据集Mushroom,Retail-chain和人工合成数据集T40I10D100K的挖掘结果表明,提出的算法在时空效率上明显优于同类经典算法Moment和CFI-Stream,并且随着数据流上处理事务数的递增和快速改变表现出良好的稳定性.
提齣瞭一種新的CMNL-SW(Closed map and num list-sliding window)挖掘算法.具體使用數據結構Closed map存儲挖掘到的閉閤項集和Num list存儲所有不同項的序號,通過對添加新事務和刪除舊事務包含的項序號進行簡單的併集和該事務與之相關已經挖掘到的閉閤項集進行交集運算來更新噹前滑動窗口,使之能夠根據用戶任意指定的支持度閾值在線輸齣數據流上閉閤頻繁項集信息.通過理論分析和對真實數據集Mushroom,Retail-chain和人工閤成數據集T40I10D100K的挖掘結果錶明,提齣的算法在時空效率上明顯優于同類經典算法Moment和CFI-Stream,併且隨著數據流上處理事務數的遞增和快速改變錶現齣良好的穩定性.
제출료일충신적CMNL-SW(Closed map and num list-sliding window)알굴산법.구체사용수거결구Closed map존저알굴도적폐합항집화Num list존저소유불동항적서호,통과대첨가신사무화산제구사무포함적항서호진행간단적병집화해사무여지상관이경알굴도적폐합항집진행교집운산래경신당전활동창구,사지능구근거용호임의지정적지지도역치재선수출수거류상폐합빈번항집신식.통과이론분석화대진실수거집Mushroom,Retail-chain화인공합성수거집T40I10D100K적알굴결과표명,제출적산법재시공효솔상명현우우동류경전산법Moment화CFI-Stream,병차수착수거류상처리사무수적체증화쾌속개변표현출량호적은정성.