计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
11期
2376-2382
,共7页
情感分类%关键句%分类器融合%联合训练%有监督学习%半监督学习
情感分類%關鍵句%分類器融閤%聯閤訓練%有鑑督學習%半鑑督學習
정감분류%관건구%분류기융합%연합훈련%유감독학습%반감독학습
情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
情感分析需要解決的一箇重要問題是判斷一篇文檔的極性是正麵的還是負麵的.情感分類的正確率很難達到普通文本分類的水平,因為情感分類更難更複雜.在判斷文檔的情感極性時,不同的句子具有不同的情感貢獻度,所以,對整篇文檔的關鍵句和細節句進行區分將有助于提高情感分類的性能.關鍵句通常簡短且具有判彆性,而細節描述句通常複雜多樣且容易引入歧義.在關鍵句抽取算法中,攷慮3類屬性:情感屬性、位置屬性和關鍵詞屬性.為瞭更好地利用關鍵句和細節句之間的差異性和互補性,將抽取的關鍵句分彆用于有鑑督的和半鑑督的情感分類.在有鑑督情感分類中,採用的是分類器融閤的方法;在半鑑督情感分類中,採用的是Co-training算法.在8箇領域上進行實驗,結果錶明所提方法性能明顯優于Baseline,從而證明情感關鍵句抽取算法是有效的.
정감분석수요해결적일개중요문제시판단일편문당적겁성시정면적환시부면적.정감분류적정학솔흔난체도보통문본분류적수평,인위정감분류경난경복잡.재판단문당적정감겁성시,불동적구자구유불동적정감공헌도,소이,대정편문당적관건구화세절구진행구분장유조우제고정감분류적성능.관건구통상간단차구유판별성,이세절묘술구통상복잡다양차용역인입기의.재관건구추취산법중,고필3류속성:정감속성、위치속성화관건사속성.위료경호지이용관건구화세절구지간적차이성화호보성,장추취적관건구분별용우유감독적화반감독적정감분류.재유감독정감분류중,채용적시분류기융합적방법;재반감독정감분류중,채용적시Co-training산법.재8개영역상진행실험,결과표명소제방법성능명현우우Baseline,종이증명정감관건구추취산법시유효적.