微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
15期
222-223
,共2页
词聚类%层次聚类%概念聚类%混合聚类
詞聚類%層次聚類%概唸聚類%混閤聚類
사취류%층차취류%개념취류%혼합취류
文本聚类在文本挖掘和信息检索系统中发挥着重要的作用,而词聚类是文本聚类的基拙.提出了一种基于混合聚类的中文词聚类方法,它将层次聚类和概念聚类结合起呆,以缩短登个策类时.首先对预处理石的词采珑仃初始聚类,然后从每个类中各取一个出现次数最多的词组成新的词集,最后对该词集进行再聚类.实验表明,这种方法有效降低了中文词聚类的时间复杂度.
文本聚類在文本挖掘和信息檢索繫統中髮揮著重要的作用,而詞聚類是文本聚類的基拙.提齣瞭一種基于混閤聚類的中文詞聚類方法,它將層次聚類和概唸聚類結閤起呆,以縮短登箇策類時.首先對預處理石的詞採瓏仃初始聚類,然後從每箇類中各取一箇齣現次數最多的詞組成新的詞集,最後對該詞集進行再聚類.實驗錶明,這種方法有效降低瞭中文詞聚類的時間複雜度.
문본취류재문본알굴화신식검색계통중발휘착중요적작용,이사취류시문본취류적기졸.제출료일충기우혼합취류적중문사취류방법,타장층차취류화개념취류결합기태,이축단등개책류시.수선대예처리석적사채롱정초시취류,연후종매개류중각취일개출현차수최다적사조성신적사집,최후대해사집진행재취류.실험표명,저충방법유효강저료중문사취류적시간복잡도.