计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2011年
9期
2429-2431,2435
,共4页
隐含语意索引%向量空间模型%奇异值分解%文档矩阵%支持向量机
隱含語意索引%嚮量空間模型%奇異值分解%文檔矩陣%支持嚮量機
은함어의색인%향량공간모형%기이치분해%문당구진%지지향량궤
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法.然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力.支持向量机(SVM)高度的泛化能力使它特别适用于高维数据例如文档的分类.为此提出基于支持向量机的特征提取方法用于选择适于分类的LSI特征.该方法利用SVM高度泛化的分类能力,通过使用在每一个规则下训练的分类器的参数对第k个特征对反向平方分解面的贡献wk2的值进行估计.实验表明当需要比LSI更少的训练和测试时间时,该方法能够以更为紧凑的表示方式提高分类性能.
隱含語意索引(LSI)是一箇能有效捕穫文檔中詞的隱含語意特徵的方法.然而,用該方法選擇的特徵空間對文本分類來說可能不是最適閤的,因為這種方法按照詞的變化排序特徵,而沒有攷慮到分類能力.支持嚮量機(SVM)高度的汎化能力使它特彆適用于高維數據例如文檔的分類.為此提齣基于支持嚮量機的特徵提取方法用于選擇適于分類的LSI特徵.該方法利用SVM高度汎化的分類能力,通過使用在每一箇規則下訓練的分類器的參數對第k箇特徵對反嚮平方分解麵的貢獻wk2的值進行估計.實驗錶明噹需要比LSI更少的訓練和測試時間時,該方法能夠以更為緊湊的錶示方式提高分類性能.
은함어의색인(LSI)시일개능유효포획문당중사적은함어의특정적방법.연이,용해방법선택적특정공간대문본분류래설가능불시최괄합적,인위저충방법안조사적변화배서특정,이몰유고필도분류능력.지지향량궤(SVM)고도적범화능력사타특별괄용우고유수거례여문당적분류.위차제출기우지지향량궤적특정제취방법용우선택괄우분류적LSI특정.해방법이용SVM고도범화적분류능력,통과사용재매일개규칙하훈련적분류기적삼수대제k개특정대반향평방분해면적공헌wk2적치진행고계.실험표명당수요비LSI경소적훈련화측시시간시,해방법능구이경위긴주적표시방식제고분류성능.