情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2011年
9期
160-163
,共4页
情感分类%预处理%特征值选择%特征权重%支持向量机(SVM)
情感分類%預處理%特徵值選擇%特徵權重%支持嚮量機(SVM)
정감분류%예처리%특정치선택%특정권중%지지향량궤(SVM)
比较研究了中文情感分类挖掘预处理技术的不同组合对分类效果的影响.预处理中关键技术为文本分词、特征选择和权重计算.考察了文档频率DF、信息增益IG、互信息MI、X2分布CHI、文本证据权(Weight of Evi-dence for Text,WET)5种不同的特征选取方法和布尔权重、词频型特征权重TF、TF-IDF函数3种常用的权重计算方法的15种不同组合.采用支持向量机(SVM)分类器以考察特征选择方法和权重计算方法不同的组合的对情感分类的效果.实验结果表明IG和TF-IDF的组合最为有效,WET和TF的组合效果最差,并给出了效果差异的原因.
比較研究瞭中文情感分類挖掘預處理技術的不同組閤對分類效果的影響.預處理中關鍵技術為文本分詞、特徵選擇和權重計算.攷察瞭文檔頻率DF、信息增益IG、互信息MI、X2分佈CHI、文本證據權(Weight of Evi-dence for Text,WET)5種不同的特徵選取方法和佈爾權重、詞頻型特徵權重TF、TF-IDF函數3種常用的權重計算方法的15種不同組閤.採用支持嚮量機(SVM)分類器以攷察特徵選擇方法和權重計算方法不同的組閤的對情感分類的效果.實驗結果錶明IG和TF-IDF的組閤最為有效,WET和TF的組閤效果最差,併給齣瞭效果差異的原因.
비교연구료중문정감분류알굴예처리기술적불동조합대분류효과적영향.예처리중관건기술위문본분사、특정선택화권중계산.고찰료문당빈솔DF、신식증익IG、호신식MI、X2분포CHI、문본증거권(Weight of Evi-dence for Text,WET)5충불동적특정선취방법화포이권중、사빈형특정권중TF、TF-IDF함수3충상용적권중계산방법적15충불동조합.채용지지향량궤(SVM)분류기이고찰특정선택방법화권중계산방법불동적조합적대정감분류적효과.실험결과표명IG화TF-IDF적조합최위유효,WET화TF적조합효과최차,병급출료효과차이적원인.