计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2007年
17期
80-82
,共3页
序列模式挖掘%WebLog%频繁子序列%SPAM-FPT
序列模式挖掘%WebLog%頻繁子序列%SPAM-FPT
서렬모식알굴%WebLog%빈번자서렬%SPAM-FPT
WebLog访问序列模式挖掘将数据挖掘中的序列模式技术应用于Web服务器上的日志文件,以此来改善Web的信息服务,而在对海量的数据挖掘时,系统资源开销很大.该文结合SPAM、PrefixSpan的思想,提出一个新的算法--SPAM-FPT,该算法通过建立First_Positon_Table,避免了SPAM中的"与操作"、"连接操作"以及PrefixSpan中大量的"投影数据库"的建立,可以快捷地挖掘数据库中所有"频繁子序列".
WebLog訪問序列模式挖掘將數據挖掘中的序列模式技術應用于Web服務器上的日誌文件,以此來改善Web的信息服務,而在對海量的數據挖掘時,繫統資源開銷很大.該文結閤SPAM、PrefixSpan的思想,提齣一箇新的算法--SPAM-FPT,該算法通過建立First_Positon_Table,避免瞭SPAM中的"與操作"、"連接操作"以及PrefixSpan中大量的"投影數據庫"的建立,可以快捷地挖掘數據庫中所有"頻繁子序列".
WebLog방문서렬모식알굴장수거알굴중적서렬모식기술응용우Web복무기상적일지문건,이차래개선Web적신식복무,이재대해량적수거알굴시,계통자원개소흔대.해문결합SPAM、PrefixSpan적사상,제출일개신적산법--SPAM-FPT,해산법통과건립First_Positon_Table,피면료SPAM중적"여조작"、"련접조작"이급PrefixSpan중대량적"투영수거고"적건립,가이쾌첩지알굴수거고중소유"빈번자서렬".