计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
4期
121-124,166
,共5页
序列模式%数据流挖掘%滑动窗口
序列模式%數據流挖掘%滑動窗口
서렬모식%수거류알굴%활동창구
序列模式发现是最重要的数据挖掘任务之一,并有着广阔的应用前景.针对静态数据库,序列模式挖掘已经被深入地研究,但针对基于数据流的序列模式挖掘的研究还不是十分深入.数据流有着无限性的特性,因此往往不能保存数据流中全部的数据,同时很多时候只对最近的时间段的序列模式感兴趣,提出一个有效的结合滑动窗口技术的挖掘序列模式的算法FPM-SW,算法利用到3个数据结构(PatternTable,CountTable和Ta-tree)来处理基于数据流的序列模式挖掘的复杂性问题.算法通过CountTable结构来保存以往的潜在频繁序列,考虑到在某些情况下CountTable占用内存过多,算法还结合了一种压缩CountTable技术来减少内存占用.FPM-SW的优点是可以最大限度地降低负正例的产生,实验表明FPM-SW具有较高的准确率.
序列模式髮現是最重要的數據挖掘任務之一,併有著廣闊的應用前景.針對靜態數據庫,序列模式挖掘已經被深入地研究,但針對基于數據流的序列模式挖掘的研究還不是十分深入.數據流有著無限性的特性,因此往往不能保存數據流中全部的數據,同時很多時候隻對最近的時間段的序列模式感興趣,提齣一箇有效的結閤滑動窗口技術的挖掘序列模式的算法FPM-SW,算法利用到3箇數據結構(PatternTable,CountTable和Ta-tree)來處理基于數據流的序列模式挖掘的複雜性問題.算法通過CountTable結構來保存以往的潛在頻繁序列,攷慮到在某些情況下CountTable佔用內存過多,算法還結閤瞭一種壓縮CountTable技術來減少內存佔用.FPM-SW的優點是可以最大限度地降低負正例的產生,實驗錶明FPM-SW具有較高的準確率.
서렬모식발현시최중요적수거알굴임무지일,병유착엄활적응용전경.침대정태수거고,서렬모식알굴이경피심입지연구,단침대기우수거류적서렬모식알굴적연구환불시십분심입.수거류유착무한성적특성,인차왕왕불능보존수거류중전부적수거,동시흔다시후지대최근적시간단적서렬모식감흥취,제출일개유효적결합활동창구기술적알굴서렬모식적산법FPM-SW,산법이용도3개수거결구(PatternTable,CountTable화Ta-tree)래처리기우수거류적서렬모식알굴적복잡성문제.산법통과CountTable결구래보존이왕적잠재빈번서렬,고필도재모사정황하CountTable점용내존과다,산법환결합료일충압축CountTable기술래감소내존점용.FPM-SW적우점시가이최대한도지강저부정례적산생,실험표명FPM-SW구유교고적준학솔.