计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2004年
5期
21-22,37
,共3页
文本聚类%隐含语义分析%奇异值分解%向量空间模型
文本聚類%隱含語義分析%奇異值分解%嚮量空間模型
문본취류%은함어의분석%기이치분해%향량공간모형
根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法.该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,从而提高了文本聚类的精度和速度.
根據隱含語義分析(LSA)理論,提齣瞭一種文本聚類的新方法.該方法應用LSA理論來構建文本集的嚮量空間模型,在詞條的權重中引入瞭語義關繫,消減瞭原詞條矩陣中包含的"譟聲"因素,從而更加突齣瞭詞和文本之間的語義關繫.通過奇異值分解(SVD),有效地降低瞭嚮量空間的維數,從而提高瞭文本聚類的精度和速度.
근거은함어의분석(LSA)이론,제출료일충문본취류적신방법.해방법응용LSA이론래구건문본집적향량공간모형,재사조적권중중인입료어의관계,소감료원사조구진중포함적"조성"인소,종이경가돌출료사화문본지간적어의관계.통과기이치분해(SVD),유효지강저료향량공간적유수,종이제고료문본취류적정도화속도.