计算机工程与应用
計算機工程與應用
계산궤공정여응용
Computer Engineering and Applications
2015年
21期
30-35,101
,共7页
文本情感分析%特征加权%文档频率%情感分类
文本情感分析%特徵加權%文檔頻率%情感分類
문본정감분석%특정가권%문당빈솔%정감분류
sentiment analysis%term weighting%document frequency%sentiment classification
文本情感分析领域内的特征加权一般考虑两个影响因子:特征在文档中的重要性(ITD)和特征在表达情感上的重要性(ITS)。结合该领域内两种分类准确率较高的监督特征加权算法,提出了一种新的ITS算法。新算法同时考虑特征在一类文档集里的文档频率(在特定的文档集里,出现某个特征的文档数量)及其占总文档频率的比例,使主要出现且大量出现在同一类文档集里的特征获得更高的ITS权值。实验证明,新算法能提高文本情感分类的准确率。
文本情感分析領域內的特徵加權一般攷慮兩箇影響因子:特徵在文檔中的重要性(ITD)和特徵在錶達情感上的重要性(ITS)。結閤該領域內兩種分類準確率較高的鑑督特徵加權算法,提齣瞭一種新的ITS算法。新算法同時攷慮特徵在一類文檔集裏的文檔頻率(在特定的文檔集裏,齣現某箇特徵的文檔數量)及其佔總文檔頻率的比例,使主要齣現且大量齣現在同一類文檔集裏的特徵穫得更高的ITS權值。實驗證明,新算法能提高文本情感分類的準確率。
문본정감분석영역내적특정가권일반고필량개영향인자:특정재문당중적중요성(ITD)화특정재표체정감상적중요성(ITS)。결합해영역내량충분류준학솔교고적감독특정가권산법,제출료일충신적ITS산법。신산법동시고필특정재일류문당집리적문당빈솔(재특정적문당집리,출현모개특정적문당수량)급기점총문당빈솔적비례,사주요출현차대량출현재동일류문당집리적특정획득경고적ITS권치。실험증명,신산법능제고문본정감분류적준학솔。
There are two universal factors in term weighting for sentiment analysis:Importance of a Term in a Document (ITD)and Importance of a Term for expressing Sentiment(ITS). An improved ITS algorithm is proposed by combining two state-of-the-art supervised term weighting schemes which have high classification accuracy. The improved algorithm takes both document frequency(the number of documents in which a term occurs)of specific feature and its proportion in the whole document frequency into account. Thus, features which occur predominantly in many documents of one class can be given relatively higher ITS weights. Experiment results show that the proposed algorithm can improve the perfor-mance of sentiment classification.