计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2004年
2期
53-55,68
,共4页
文本分类%隐含语义分析%奇异值分解%Kohonen网络%向量空间模型
文本分類%隱含語義分析%奇異值分解%Kohonen網絡%嚮量空間模型
문본분류%은함어의분석%기이치분해%Kohonen망락%향량공간모형
文中根据隐含语义分析理论(LSA)和Kohonen网络理论提出一种文本分类新方法.应用Kohonen网络进行文本分类存在训练速度慢的缺点,因此在网络训练阶段引入了有监督机制,提高了网络的分类速度和精度;但是对于高维的文本特征向量来说,分类速度很低,甚至应用Kohonen网络进行分类,不能取得理想结果;新方法应用LSA理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,从而大大提高了文本分类的精度和速度,同时根据因子分析理论给出了维数k的选取方法.
文中根據隱含語義分析理論(LSA)和Kohonen網絡理論提齣一種文本分類新方法.應用Kohonen網絡進行文本分類存在訓練速度慢的缺點,因此在網絡訓練階段引入瞭有鑑督機製,提高瞭網絡的分類速度和精度;但是對于高維的文本特徵嚮量來說,分類速度很低,甚至應用Kohonen網絡進行分類,不能取得理想結果;新方法應用LSA理論來建立文本集的嚮量空間模型,在詞條的權重中引入瞭語義關繫,消減瞭原詞條矩陣中包含的"譟聲"因素,從而更加突齣瞭詞和文本之間的語義關繫.通過奇異值分解(SVD),有效地降低瞭嚮量空間的維數,從而大大提高瞭文本分類的精度和速度,同時根據因子分析理論給齣瞭維數k的選取方法.
문중근거은함어의분석이론(LSA)화Kohonen망락이론제출일충문본분류신방법.응용Kohonen망락진행문본분류존재훈련속도만적결점,인차재망락훈련계단인입료유감독궤제,제고료망락적분류속도화정도;단시대우고유적문본특정향량래설,분류속도흔저,심지응용Kohonen망락진행분류,불능취득이상결과;신방법응용LSA이론래건립문본집적향량공간모형,재사조적권중중인입료어의관계,소감료원사조구진중포함적"조성"인소,종이경가돌출료사화문본지간적어의관계.통과기이치분해(SVD),유효지강저료향량공간적유수,종이대대제고료문본분류적정도화속도,동시근거인자분석이론급출료유수k적선취방법.