微型电脑应用
微型電腦應用
미형전뇌응용
MICROCOMPUTER APPLICATIONS
2009年
8期
25-26,29
,共3页
文本聚类%等容特征映射%降维%数据可视化
文本聚類%等容特徵映射%降維%數據可視化
문본취류%등용특정영사%강유%수거가시화
文本聚类中,文本特征向量的高维性使得对样本统计特征的评估十分困难,所以有必要进行有效的维数约简.ISOMAP是一类新近出现的非线性维数约简方法,可以有效地对文本特征空间进行降维处理,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,将高维的文本特征数据映射到2~3维的低维可视化空间上,达到数据降维目的,实现文本数据特征可视化,并在一定程度上解决聚类数问题.最后通过实例,验证了方法的可行性.
文本聚類中,文本特徵嚮量的高維性使得對樣本統計特徵的評估十分睏難,所以有必要進行有效的維數約簡.ISOMAP是一類新近齣現的非線性維數約簡方法,可以有效地對文本特徵空間進行降維處理,該方法改進瞭樣本嚮量之間的距離度量,用測地距離代替傳統的歐式距離,將高維的文本特徵數據映射到2~3維的低維可視化空間上,達到數據降維目的,實現文本數據特徵可視化,併在一定程度上解決聚類數問題.最後通過實例,驗證瞭方法的可行性.
문본취류중,문본특정향량적고유성사득대양본통계특정적평고십분곤난,소이유필요진행유효적유수약간.ISOMAP시일류신근출현적비선성유수약간방법,가이유효지대문본특정공간진행강유처리,해방법개진료양본향량지간적거리도량,용측지거리대체전통적구식거리,장고유적문본특정수거영사도2~3유적저유가시화공간상,체도수거강유목적,실현문본수거특정가시화,병재일정정도상해결취류수문제.최후통과실례,험증료방법적가행성.