计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
35期
129-132,165
,共5页
文本分类%向量空间模型%矩阵投影%特征选择
文本分類%嚮量空間模型%矩陣投影%特徵選擇
문본분류%향량공간모형%구진투영%특정선택
对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法-Matrix Projection(MP)分类算法.矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的.与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%.
對文本分類中降維技術、提高分類精度和效率的方法進行瞭研究,提齣瞭一種基于矩陣投影運算的新型文本分類算法-Matrix Projection(MP)分類算法.矩陣運算將訓練樣例中錶示文本特徵的三維空間投影到二維空間上,得到歸一化嚮量,有效地達到瞭降維與精確計算特徵項權重的目的.與其他多種文本分類算法對比實驗錶明,MP算法的分類精度和時間性能都有明顯提高,在兩套數據集上的宏平均F1值分彆達到92.29%和96.03%.
대문본분류중강유기술、제고분류정도화효솔적방법진행료연구,제출료일충기우구진투영운산적신형문본분류산법-Matrix Projection(MP)분류산법.구진운산장훈련양례중표시문본특정적삼유공간투영도이유공간상,득도귀일화향량,유효지체도료강유여정학계산특정항권중적목적.여기타다충문본분류산법대비실험표명,MP산법적분류정도화시간성능도유명현제고,재량투수거집상적굉평균F1치분별체도92.29%화96.03%.