华南理工大学学报(自然科学版)
華南理工大學學報(自然科學版)
화남리공대학학보(자연과학판)
JOURNAL OF SOUTH CHINA UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2004年
z1期
99-102
,共4页
文本分类%潜在语义索引%偏最小二乘法
文本分類%潛在語義索引%偏最小二乘法
문본분류%잠재어의색인%편최소이승법
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能比LSI模型更好地表示原始文档空间中的潜在语义结构.
潛在語義索引(LSI)模型能在一定程度上解決一詞多義和多詞一義問題,併能過濾一部分文檔譟音.然而在LSI模型中,一些對分類貢獻大的特徵,由于其對應的特徵值小而被濾掉.針對這一問題,文中提齣瞭一種擴展LSI模型的文本分類模型.該模型在儘量保留文檔信息的同時,增加攷慮瞭文檔的類彆信息,從而能比LSI模型更好地錶示原始文檔空間中的潛在語義結構.
잠재어의색인(LSI)모형능재일정정도상해결일사다의화다사일의문제,병능과려일부분문당조음.연이재LSI모형중,일사대분류공헌대적특정,유우기대응적특정치소이피려도.침대저일문제,문중제출료일충확전LSI모형적문본분류모형.해모형재진량보류문당신식적동시,증가고필료문당적유별신식,종이능비LSI모형경호지표시원시문당공간중적잠재어의결구.