中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2007年
6期
95-100
,共6页
计算机应用%中文信息处理%文本分类%情感分析%贝叶斯%最大熵
計算機應用%中文信息處理%文本分類%情感分析%貝葉斯%最大熵
계산궤응용%중문신식처리%문본분류%정감분석%패협사%최대적
本文主要研究机器学习方法在新闻文本的情感分类中的应用,判断其是正面还是负面.我们利用朴素贝叶斯和最大熵方法进行新闻及评论语料的情感分类研究.实验表明,机器学习方法在基于情感的文本分类中也能取得不错的分类性能,最高准确率能达到90%.同时我们也发现,对于基于情感的文本分类,选择具有语义倾向的词汇作为特征项、对否定词正确处理和采用二值作为特征项权重能提高分类的准确率.总之,基于情感的文本分类是一个更具挑战性的工作.
本文主要研究機器學習方法在新聞文本的情感分類中的應用,判斷其是正麵還是負麵.我們利用樸素貝葉斯和最大熵方法進行新聞及評論語料的情感分類研究.實驗錶明,機器學習方法在基于情感的文本分類中也能取得不錯的分類性能,最高準確率能達到90%.同時我們也髮現,對于基于情感的文本分類,選擇具有語義傾嚮的詞彙作為特徵項、對否定詞正確處理和採用二值作為特徵項權重能提高分類的準確率.總之,基于情感的文本分類是一箇更具挑戰性的工作.
본문주요연구궤기학습방법재신문문본적정감분류중적응용,판단기시정면환시부면.아문이용박소패협사화최대적방법진행신문급평론어료적정감분류연구.실험표명,궤기학습방법재기우정감적문본분류중야능취득불착적분류성능,최고준학솔능체도90%.동시아문야발현,대우기우정감적문본분류,선택구유어의경향적사회작위특정항、대부정사정학처리화채용이치작위특정항권중능제고분류적준학솔.총지,기우정감적문본분류시일개경구도전성적공작.