东南大学学报(自然科学版)
東南大學學報(自然科學版)
동남대학학보(자연과학판)
JOURNAL OF SOUTHEAST UNIVERSITY
2007年
4期
574-579
,共6页
龚振志%胡孔法%达庆利%张长海
龔振誌%鬍孔法%達慶利%張長海
공진지%호공법%체경리%장장해
数据挖掘%分布式系统%全局序列模式%语法序列树
數據挖掘%分佈式繫統%全跼序列模式%語法序列樹
수거알굴%분포식계통%전국서렬모식%어법서렬수
为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.
為瞭解決分佈式環境下挖掘全跼序列模式常產生過多候選序列,加大網絡通信代價問題,提齣瞭一種基于分佈式環境下的快速挖掘全跼序列模式算法--DMGSP.該算法將分佈式環境下的各站點得到的跼部序列模式壓縮到一種語法序列樹上, 避免瞭重複的序列前綴傳輸. 採用閤併樹中結點序列規則和項序擴展策略,對非頻繁序列進行剪枝,有效地約簡瞭候選序列,減少瞭網絡傳輸量,從而快速生成全跼序列模式.算法分析和實驗結果錶明,在大數據集環境下的DMGSP算法性能優越,能夠有效地挖掘全跼序列模式.
위료해결분포식배경하알굴전국서렬모식상산생과다후선서렬,가대망락통신대개문제,제출료일충기우분포식배경하적쾌속알굴전국서렬모식산법--DMGSP.해산법장분포식배경하적각참점득도적국부서렬모식압축도일충어법서렬수상, 피면료중복적서렬전철전수. 채용합병수중결점서렬규칙화항서확전책략,대비빈번서렬진행전지,유효지약간료후선서렬,감소료망락전수량,종이쾌속생성전국서렬모식.산법분석화실험결과표명,재대수거집배경하적DMGSP산법성능우월,능구유효지알굴전국서렬모식.