计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2010年
z1期
350-356
,共7页
任家东%解玉洁%何海涛%张爱国
任傢東%解玉潔%何海濤%張愛國
임가동%해옥길%하해도%장애국
最大序列模式%位置信息%序列匹配%PStree
最大序列模式%位置信息%序列匹配%PStree
최대서렬모식%위치신식%서렬필배%PStree
对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性.
對現有最大序列模式挖掘算法候選序列模式過多以及可擴展性差的缺點,提齣瞭一種基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先為所有頻繁1序列構建位置信息錶;然後利用縱嚮、橫嚮結閤搜索位置信息錶的序列擴展匹配方法找到潛在最大序列模式;在進行序列匹配擴展的同時,把每箇找到的潛在最大序列模式存儲在改進的前綴樹PStree(prefix sequential pattern tree)中,樹中每箇結點鏈接到索引Hash錶,Hash錶中保存瞭結點的位置信息,對于那些重複的序列可以直接從Hash錶中找到其位置信息;最後通過對前綴樹PStree進行剪枝,得到由最大序列模式組成的前綴樹MPStree(maximal sequential pattern tree).實驗結果錶明算法CSMS具有較好的時間效率和擴展性.
대현유최대서렬모식알굴산법후선서렬모식과다이급가확전성차적결점,제출료일충기우서렬필배적최대서렬모식알굴산법CSMS(compare sequence finding maximal sequential pattern).산법수선위소유빈번1서렬구건위치신식표;연후이용종향、횡향결합수색위치신식표적서렬확전필배방법조도잠재최대서렬모식;재진행서렬필배확전적동시,파매개조도적잠재최대서렬모식존저재개진적전철수PStree(prefix sequential pattern tree)중,수중매개결점련접도색인Hash표,Hash표중보존료결점적위치신식,대우나사중복적서렬가이직접종Hash표중조도기위치신식;최후통과대전철수PStree진행전지,득도유최대서렬모식조성적전철수MPStree(maximal sequential pattern tree).실험결과표명산법CSMS구유교호적시간효솔화확전성.