计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2013年
11期
1033-1039
,共7页
情感词典%情感分类%PMI算法%朴素贝叶斯
情感詞典%情感分類%PMI算法%樸素貝葉斯
정감사전%정감분류%PMI산법%박소패협사
sentiment lexicon%sentiment classification%pointwise mutual information (PMI)%na?ve Bayes
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。
互聯網海量文本的情感分析是噹前的一箇研究熱點。介紹瞭一種中文文本情感詞典構建方法,該方法選用若榦箇情感種子詞,利用搜索引擎返迴的共現數,通過改進的PMI(pointwise mutual information)算法計算情感詞的情感權值。將構建的情感詞典應用到文本情感分類實驗中,在不同的語料環境下,對比基于情感詞典和樸素貝葉斯分類器下的文本情感分類效果,實驗結果錶明,構建的情感詞典,可有效用于情感特徵選擇和直接用于情感分類,併且分類性能穩定。
호련망해량문본적정감분석시당전적일개연구열점。개소료일충중문문본정감사전구건방법,해방법선용약간개정감충자사,이용수색인경반회적공현수,통과개진적PMI(pointwise mutual information)산법계산정감사적정감권치。장구건적정감사전응용도문본정감분류실험중,재불동적어료배경하,대비기우정감사전화박소패협사분류기하적문본정감분류효과,실험결과표명,구건적정감사전,가유효용우정감특정선택화직접용우정감분류,병차분류성능은정。
Massive Internet text sentiment analysis is currently a hot research topic. This paper describes a method on Chinese text sentiment lexicon construction. This method improves the pointwise mutual information (PMI) algo-rithm for computing the weights of general sentiment lexicon, by selecting several sentiment seed words and drawing upon the total result numbers from search engine. In order to examine the validity of this method, this paper uses the established sentiment lexicon for text sentiment, and compares the classification effects of the method based on sentiment lexicon with those of na?ve Bayesian classifier. The experimental results indicate that the high-quality sentiment lexi-con can effectively choose and classify the sentiment characteristics, and has a stable classification function.