计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2009年
7期
247-251,291
,共6页
侯伟%吴晨生%杨炳儒%方炜炜
侯偉%吳晨生%楊炳儒%方煒煒
후위%오신생%양병유%방위위
数据挖掘%数据流%频繁模式%震荡性因子
數據挖掘%數據流%頻繁模式%震盪性因子
수거알굴%수거류%빈번모식%진탕성인자
数据流频繁模式挖掘是当前数据挖掘领域中的研究热点之一,数据流连续性、无序性、无界性及实时性的特点为挖掘算法在时间及空间性能方面提出了更高的要求.数据流中模式频度的震荡现象,迫使现有算法对概要数据结构频繁维护,致使其时间、空间效率均受到较大影响.构造了具备较高空间性能的概要数据结构SP-tree,同时定义了震荡性因子χ以量化震荡信息,提出了一种高效的离线数据流频繁模式挖掘算法SPDS,有效降低了数据震荡对算法性能的影响;在处理新到数据集时,算法采取分而治之的分离映射策略,进一步提升了时间效率;同时在查询结果方面提高了部分模式的计数精度.
數據流頻繁模式挖掘是噹前數據挖掘領域中的研究熱點之一,數據流連續性、無序性、無界性及實時性的特點為挖掘算法在時間及空間性能方麵提齣瞭更高的要求.數據流中模式頻度的震盪現象,迫使現有算法對概要數據結構頻繁維護,緻使其時間、空間效率均受到較大影響.構造瞭具備較高空間性能的概要數據結構SP-tree,同時定義瞭震盪性因子χ以量化震盪信息,提齣瞭一種高效的離線數據流頻繁模式挖掘算法SPDS,有效降低瞭數據震盪對算法性能的影響;在處理新到數據集時,算法採取分而治之的分離映射策略,進一步提升瞭時間效率;同時在查詢結果方麵提高瞭部分模式的計數精度.
수거류빈번모식알굴시당전수거알굴영역중적연구열점지일,수거류련속성、무서성、무계성급실시성적특점위알굴산법재시간급공간성능방면제출료경고적요구.수거류중모식빈도적진탕현상,박사현유산법대개요수거결구빈번유호,치사기시간、공간효솔균수도교대영향.구조료구비교고공간성능적개요수거결구SP-tree,동시정의료진탕성인자χ이양화진탕신식,제출료일충고효적리선수거류빈번모식알굴산법SPDS,유효강저료수거진탕대산법성능적영향;재처리신도수거집시,산법채취분이치지적분리영사책략,진일보제승료시간효솔;동시재사순결과방면제고료부분모식적계수정도.