清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
JOURNAL OF TSINGHUA UNIVERSITY SCIENCE AND TECHNOLOGY
2005年
9期
1818-1822
,共5页
多类分类%潜在语义%潜在语义分类%偏最小二乘
多類分類%潛在語義%潛在語義分類%偏最小二乘
다류분류%잠재어의%잠재어의분류%편최소이승
在文本分类中,一个文本往往有多类属性,而目前大多数分类模型均为二元分类模型.因此,提出一种基于潜在语义的多类分类模型.该模型同时考虑文档特征信息和文档的类属信息,在提取文档潜在语义信息的同时把对文档分类贡献大的特征信息保留下来.其结果是既能较好地解决文档中同义词和多义词的问题,又能解决多类属分类问题,并且能够探测到新类.在Reuters文档集上的实验表明,在维数较低的情况下,分类效果比较好,性能比较稳定.
在文本分類中,一箇文本往往有多類屬性,而目前大多數分類模型均為二元分類模型.因此,提齣一種基于潛在語義的多類分類模型.該模型同時攷慮文檔特徵信息和文檔的類屬信息,在提取文檔潛在語義信息的同時把對文檔分類貢獻大的特徵信息保留下來.其結果是既能較好地解決文檔中同義詞和多義詞的問題,又能解決多類屬分類問題,併且能夠探測到新類.在Reuters文檔集上的實驗錶明,在維數較低的情況下,分類效果比較好,性能比較穩定.
재문본분류중,일개문본왕왕유다류속성,이목전대다수분류모형균위이원분류모형.인차,제출일충기우잠재어의적다류분류모형.해모형동시고필문당특정신식화문당적류속신식,재제취문당잠재어의신식적동시파대문당분류공헌대적특정신식보류하래.기결과시기능교호지해결문당중동의사화다의사적문제,우능해결다류속분류문제,병차능구탐측도신류.재Reuters문당집상적실험표명,재유수교저적정황하,분류효과비교호,성능비교은정.