微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
15期
4-5
,共2页
文本聚类%文本分类%类关联词%K-Means
文本聚類%文本分類%類關聯詞%K-Means
문본취류%문본분류%류관련사%K-Means
提出了一种利用类关联词和K-Means聚类算法实现对文本文档进行分类的方法.类关联词是与类主题相关、能反映类主题的单词或短语.根据文档中包含的类关联词,形成初始聚类中心.在聚类算法过程中,类关联词提供的信息被用来约束待分类文档与聚类中心的相似度比较,加快了算法的执行.实验证明了算法的有效性.
提齣瞭一種利用類關聯詞和K-Means聚類算法實現對文本文檔進行分類的方法.類關聯詞是與類主題相關、能反映類主題的單詞或短語.根據文檔中包含的類關聯詞,形成初始聚類中心.在聚類算法過程中,類關聯詞提供的信息被用來約束待分類文檔與聚類中心的相似度比較,加快瞭算法的執行.實驗證明瞭算法的有效性.
제출료일충이용류관련사화K-Means취류산법실현대문본문당진행분류적방법.류관련사시여류주제상관、능반영류주제적단사혹단어.근거문당중포함적류관련사,형성초시취류중심.재취류산법과정중,류관련사제공적신식피용래약속대분류문당여취류중심적상사도비교,가쾌료산법적집행.실험증명료산법적유효성.