清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
JOURNAL OF TSINGHUA UNIVERSITY SCIENCE AND TECHNOLOGY
2005年
9期
1853-1856
,共4页
文本分类%核方法%潜在语义索引%偏最小二乘分析%核偏最小二乘分析
文本分類%覈方法%潛在語義索引%偏最小二乘分析%覈偏最小二乘分析
문본분류%핵방법%잠재어의색인%편최소이승분석%핵편최소이승분석
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型.该模型比LSC模型能更好地表示文档空间的潜在语义结构信息.在Reuter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能.
在信息檢索中,潛在語義索引模型直接應用于文本分類時,由于對分類貢獻大的特徵可能丟失而效果不佳.而攷慮瞭文本特徵及分類信息的潛在語義文本分類模型(LSC)也因為本質上是線性模型而性能不高.為瞭提高分類性能,通過引入覈函數,給齣瞭一種非線性的潛在語義文本分類模型.該模型比LSC模型能更好地錶示文檔空間的潛在語義結構信息.在Reuter-21578文檔集上的實驗結果錶明,潛在語義文本分類模型有很好的分類性能.
재신식검색중,잠재어의색인모형직접응용우문본분류시,유우대분류공헌대적특정가능주실이효과불가.이고필료문본특정급분류신식적잠재어의문본분류모형(LSC)야인위본질상시선성모형이성능불고.위료제고분류성능,통과인입핵함수,급출료일충비선성적잠재어의문본분류모형.해모형비LSC모형능경호지표시문당공간적잠재어의결구신식.재Reuter-21578문당집상적실험결과표명,잠재어의문본분류모형유흔호적분류성능.