计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
35期
78-79,195
,共3页
文本分类%最大熵模型%特征%N-Gram
文本分類%最大熵模型%特徵%N-Gram
문본분류%최대적모형%특정%N-Gram
最大熵模型是一种在广泛应用于自然语言处理中的概率估计方法.文中使用最大熵模型进行了文本分类的研究.通过实验,将其和Bayes、KNN、SVM三种典型的文本分类器进行了比较,并且考虑了不同特征数目和平滑技术对基于最大熵模型的文本分类器的影响.结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法.
最大熵模型是一種在廣汎應用于自然語言處理中的概率估計方法.文中使用最大熵模型進行瞭文本分類的研究.通過實驗,將其和Bayes、KNN、SVM三種典型的文本分類器進行瞭比較,併且攷慮瞭不同特徵數目和平滑技術對基于最大熵模型的文本分類器的影響.結果顯示它的分類性能勝于Bayes方法,與KNN和SVM方法相噹,錶明這是一種非常有前途的文本分類方法.
최대적모형시일충재엄범응용우자연어언처리중적개솔고계방법.문중사용최대적모형진행료문본분류적연구.통과실험,장기화Bayes、KNN、SVM삼충전형적문본분류기진행료비교,병차고필료불동특정수목화평활기술대기우최대적모형적문본분류기적영향.결과현시타적분류성능성우Bayes방법,여KNN화SVM방법상당,표명저시일충비상유전도적문본분류방법.