青岛理工大学学报
青島理工大學學報
청도리공대학학보
JOURNAL OF QINGDAO TECHNOLOGICAL UNIVERSITY
2008年
2期
95-99
,共5页
文本%聚类%奇异值分解%概率潜在语义分析
文本%聚類%奇異值分解%概率潛在語義分析
문본%취류%기이치분해%개솔잠재어의분석
根据内容对海量文本信息进行聚类分析,可以改进信息检索和管理的效率.在文本聚类中,首先利用奇异值分解对词-文档矩阵进行化简,达到降秩和去噪的目的;然后在聚类分析中,采用概率潜在语义分析强化文档的区分特征,以k-medoids聚类方法为基础,提出的方法改进了聚类过程的鲁棒性,实验结果表明该算法的有效性.
根據內容對海量文本信息進行聚類分析,可以改進信息檢索和管理的效率.在文本聚類中,首先利用奇異值分解對詞-文檔矩陣進行化簡,達到降秩和去譟的目的;然後在聚類分析中,採用概率潛在語義分析彊化文檔的區分特徵,以k-medoids聚類方法為基礎,提齣的方法改進瞭聚類過程的魯棒性,實驗結果錶明該算法的有效性.
근거내용대해량문본신식진행취류분석,가이개진신식검색화관리적효솔.재문본취류중,수선이용기이치분해대사-문당구진진행화간,체도강질화거조적목적;연후재취류분석중,채용개솔잠재어의분석강화문당적구분특정,이k-medoids취류방법위기출,제출적방법개진료취류과정적로봉성,실험결과표명해산법적유효성.