计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
35期
168-171
,共4页
支持向量机%潜在语义索引%信息查询%监护学习%文本分类
支持嚮量機%潛在語義索引%信息查詢%鑑護學習%文本分類
지지향량궤%잠재어의색인%신식사순%감호학습%문본분류
潜在语义索引(LSI)是一种有效的信息查询方法,同时也被成功地应用到了文本分类中.LSI能解决同义和多义的问题,通过降低原始文档-术语矩阵的噪声来凸现出词条和文档之间的语义关系.为了识别和过滤有害的、不期望的定题的信息或Email,在双语言环境下(包括中文和英文),提出了一个基于改进的LSI方法的定题邮件类信息过滤系统,该系统采用潜在语义模型来表示被过滤的信息类,通过奇异值分解和正例监护学习方法,选择支持向量机(SVM)来识别和分类预定义的定题信息.实验结果表明:基于LSI的特征选择的SVM分类算法是一种更有效的信息识别和文本分类方法,不但具有较好的分类性能,同时也能大大减小计算的复杂性.
潛在語義索引(LSI)是一種有效的信息查詢方法,同時也被成功地應用到瞭文本分類中.LSI能解決同義和多義的問題,通過降低原始文檔-術語矩陣的譟聲來凸現齣詞條和文檔之間的語義關繫.為瞭識彆和過濾有害的、不期望的定題的信息或Email,在雙語言環境下(包括中文和英文),提齣瞭一箇基于改進的LSI方法的定題郵件類信息過濾繫統,該繫統採用潛在語義模型來錶示被過濾的信息類,通過奇異值分解和正例鑑護學習方法,選擇支持嚮量機(SVM)來識彆和分類預定義的定題信息.實驗結果錶明:基于LSI的特徵選擇的SVM分類算法是一種更有效的信息識彆和文本分類方法,不但具有較好的分類性能,同時也能大大減小計算的複雜性.
잠재어의색인(LSI)시일충유효적신식사순방법,동시야피성공지응용도료문본분류중.LSI능해결동의화다의적문제,통과강저원시문당-술어구진적조성래철현출사조화문당지간적어의관계.위료식별화과려유해적、불기망적정제적신식혹Email,재쌍어언배경하(포괄중문화영문),제출료일개기우개진적LSI방법적정제유건류신식과려계통,해계통채용잠재어의모형래표시피과려적신식류,통과기이치분해화정례감호학습방법,선택지지향량궤(SVM)래식별화분류예정의적정제신식.실험결과표명:기우LSI적특정선택적SVM분류산법시일충경유효적신식식별화문본분류방법,불단구유교호적분류성능,동시야능대대감소계산적복잡성.