中文信息学报
中文信息學報
중문신식학보
Journal of Chinese Information Processing
2015年
4期
134-143
,共10页
中文微博%情感分类%机器学习%特征选择
中文微博%情感分類%機器學習%特徵選擇
중문미박%정감분류%궤기학습%특정선택
Chinese micro blog%sentiment analysis%machine learning%feature selection
随着Web 2.0时代的兴起,微博作为一个新的信息分享平台已经成为人们生活中一个重要的信息来源和传播渠道.近年来针对微博的情感分类问题研究也越来越多地引起人们的关注.该文深入分析了传统的情感文本分类和微博情感分类在特征表示和特征筛选上存在的差异,针对目前微博情感分类在特征选择和使用上存在的缺陷,提出了三种简单但十分有效的特征选取和加入方法,包括词汇化主题特征、情感词内容特征和概率化的情感词倾向性特征.实验结果表明,通过使用该文提出的特征选择和特征加入方法,微博情感分类准确率由传统方法的73.17%提高到了84.17%,显著改善了微博情感分析的性能.
隨著Web 2.0時代的興起,微博作為一箇新的信息分享平檯已經成為人們生活中一箇重要的信息來源和傳播渠道.近年來針對微博的情感分類問題研究也越來越多地引起人們的關註.該文深入分析瞭傳統的情感文本分類和微博情感分類在特徵錶示和特徵篩選上存在的差異,針對目前微博情感分類在特徵選擇和使用上存在的缺陷,提齣瞭三種簡單但十分有效的特徵選取和加入方法,包括詞彙化主題特徵、情感詞內容特徵和概率化的情感詞傾嚮性特徵.實驗結果錶明,通過使用該文提齣的特徵選擇和特徵加入方法,微博情感分類準確率由傳統方法的73.17%提高到瞭84.17%,顯著改善瞭微博情感分析的性能.
수착Web 2.0시대적흥기,미박작위일개신적신식분향평태이경성위인문생활중일개중요적신식래원화전파거도.근년래침대미박적정감분류문제연구야월래월다지인기인문적관주.해문심입분석료전통적정감문본분류화미박정감분류재특정표시화특정사선상존재적차이,침대목전미박정감분류재특정선택화사용상존재적결함,제출료삼충간단단십분유효적특정선취화가입방법,포괄사회화주제특정、정감사내용특정화개솔화적정감사경향성특정.실험결과표명,통과사용해문제출적특정선택화특정가입방법,미박정감분류준학솔유전통방법적73.17%제고도료84.17%,현저개선료미박정감분석적성능.