吉林大学学报(理学版)
吉林大學學報(理學版)
길림대학학보(이학판)
JOURNAL OF JILIN UNIVERSITY(SCIENCE EDITION)
2009年
2期
299-304
,共6页
胡海龙%孙晨%赫枫龄%左万利
鬍海龍%孫晨%赫楓齡%左萬利
호해룡%손신%혁풍령%좌만리
后缀树%文本聚类%元搜索引擎
後綴樹%文本聚類%元搜索引擎
후철수%문본취류%원수색인경
提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法,通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类,同时用交互聚类的方式替代了传统的递归算法. ISTC算法具有语言无关性,不仅适用于基于单词的西方文字,而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符. 在此算法基础上,设计并实现了基于改进后缀树算法的交互聚类引擎,在不同的网络环境下对其进行了系统测试,并与其他元搜索引擎进行了对比. 实验结果表明,使用改进后缀树算法进行实时交互式聚类是可行的.
提齣一種基于改進後綴樹與交互聚類思想相結閤的算法ISTC算法,通過改造傳統後綴樹結構實現瞭對文檔標題和摘要的層次化聚類,同時用交互聚類的方式替代瞭傳統的遞歸算法. ISTC算法具有語言無關性,不僅適用于基于單詞的西方文字,而且可以在不引入詞典分詞技術的情況下有效地處理基于單字的中文字符. 在此算法基礎上,設計併實現瞭基于改進後綴樹算法的交互聚類引擎,在不同的網絡環境下對其進行瞭繫統測試,併與其他元搜索引擎進行瞭對比. 實驗結果錶明,使用改進後綴樹算法進行實時交互式聚類是可行的.
제출일충기우개진후철수여교호취류사상상결합적산법ISTC산법,통과개조전통후철수결구실현료대문당표제화적요적층차화취류,동시용교호취류적방식체대료전통적체귀산법. ISTC산법구유어언무관성,불부괄용우기우단사적서방문자,이차가이재불인입사전분사기술적정황하유효지처리기우단자적중문자부. 재차산법기출상,설계병실현료기우개진후철수산법적교호취류인경,재불동적망락배경하대기진행료계통측시,병여기타원수색인경진행료대비. 실험결과표명,사용개진후철수산법진행실시교호식취류시가행적.