中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
6期
96-102
,共7页
王志昊%王中卿%李寿山%李培峰%施寒潇
王誌昊%王中卿%李壽山%李培峰%施寒瀟
왕지호%왕중경%리수산%리배봉%시한소
情感分类%半监督学习%二部图%标签传播%特征选择
情感分類%半鑑督學習%二部圖%標籤傳播%特徵選擇
정감분류%반감독학습%이부도%표첨전파%특정선택
sentiment classification%semi-supervised learning%label propagation%bipartite graph%feature selection
特征选择旨在降低高维度特征空间,进而简化问题和优化学习方法.已有的研究显示特征提取方法能够有效降低监督学习的情感分类中的特征维度空间.同以往研究不一样的是,该文首次探讨半监督情感分类中的特征提取方法,提出一种基于二部图的特征选择方法.该方法首先借助二部图模型来表述文档与单词间的关系;然后,结合小规模标注样本的标签信息和二部图模型,利用标签传播(LP)算法计算每个特征的情感概率;最后,按照特征的情感概率进行排序进而实现特征选择.多个领域的实验结果表明,在半监督情感分类任务中,基于二部图的特征选择方法明显优于随机特征选择,在保证分类效果不下降(甚至提高)的前提下有效降低了特征空间维度.
特徵選擇旨在降低高維度特徵空間,進而簡化問題和優化學習方法.已有的研究顯示特徵提取方法能夠有效降低鑑督學習的情感分類中的特徵維度空間.同以往研究不一樣的是,該文首次探討半鑑督情感分類中的特徵提取方法,提齣一種基于二部圖的特徵選擇方法.該方法首先藉助二部圖模型來錶述文檔與單詞間的關繫;然後,結閤小規模標註樣本的標籤信息和二部圖模型,利用標籤傳播(LP)算法計算每箇特徵的情感概率;最後,按照特徵的情感概率進行排序進而實現特徵選擇.多箇領域的實驗結果錶明,在半鑑督情感分類任務中,基于二部圖的特徵選擇方法明顯優于隨機特徵選擇,在保證分類效果不下降(甚至提高)的前提下有效降低瞭特徵空間維度.
특정선택지재강저고유도특정공간,진이간화문제화우화학습방법.이유적연구현시특정제취방법능구유효강저감독학습적정감분류중적특정유도공간.동이왕연구불일양적시,해문수차탐토반감독정감분류중적특정제취방법,제출일충기우이부도적특정선택방법.해방법수선차조이부도모형래표술문당여단사간적관계;연후,결합소규모표주양본적표첨신식화이부도모형,이용표첨전파(LP)산법계산매개특정적정감개솔;최후,안조특정적정감개솔진행배서진이실현특정선택.다개영역적실험결과표명,재반감독정감분류임무중,기우이부도적특정선택방법명현우우수궤특정선택,재보증분류효과불하강(심지제고)적전제하유효강저료특정공간유도.