计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
10期
132-136,142
,共6页
热依莱木·帕尔哈提%孟祥涛%艾斯卡尔·艾木都拉
熱依萊木·帕爾哈提%孟祥濤%艾斯卡爾·艾木都拉
열의래목·파이합제%맹상도%애사잡이·애목도랍
维吾尔语%区分性%文本句子%情感分类%差异性统计量
維吾爾語%區分性%文本句子%情感分類%差異性統計量
유오이어%구분성%문본구자%정감분류%차이성통계량
Uyghur language%discriminative keyword%text sentence%sentiment classification%difference statistics
在研究区分性关键词提取方法的基础上,对维吾尔语中的生气和高兴等常见情感类型进行基于文本句子的情感分类研究。结合维吾尔文本句子中的情感表达特点,以词频和文档频率作为基本统计量,通过计算同一词语在不同组合统计量下的类间差异得到区分性关键词,并基于这些关键词进行特征提取和区分性情感模型构建。从维吾尔语电影字幕、小说等文本库中提取生气和高兴2种情感构造实验数据集,并验证所提出的情感分类方法。实验结果表明,基于区分性关键词的建模方法能有效地对维吾尔文本句子进行情感分类。
在研究區分性關鍵詞提取方法的基礎上,對維吾爾語中的生氣和高興等常見情感類型進行基于文本句子的情感分類研究。結閤維吾爾文本句子中的情感錶達特點,以詞頻和文檔頻率作為基本統計量,通過計算同一詞語在不同組閤統計量下的類間差異得到區分性關鍵詞,併基于這些關鍵詞進行特徵提取和區分性情感模型構建。從維吾爾語電影字幕、小說等文本庫中提取生氣和高興2種情感構造實驗數據集,併驗證所提齣的情感分類方法。實驗結果錶明,基于區分性關鍵詞的建模方法能有效地對維吾爾文本句子進行情感分類。
재연구구분성관건사제취방법적기출상,대유오이어중적생기화고흥등상견정감류형진행기우문본구자적정감분류연구。결합유오이문본구자중적정감표체특점,이사빈화문당빈솔작위기본통계량,통과계산동일사어재불동조합통계량하적류간차이득도구분성관건사,병기우저사관건사진행특정제취화구분성정감모형구건。종유오이어전영자막、소설등문본고중제취생기화고흥2충정감구조실험수거집,병험증소제출적정감분류방법。실험결과표명,기우구분성관건사적건모방법능유효지대유오이문본구자진행정감분류。
This paper presents a classification approach for Uyghur text sentiment,such as angry and happy,based on discriminative key word extraction. Combined with the characteristics of sentiment expression in Uyghur text, the term frequency and document frequency are derived as primary statistics. Various discriminative statistics which reflect the discrepancy of the positive and negative sentiment datasets are derived from the primary statistics for each vocabulary word, and are used to extract discriminative key words. Features are extracted based on these keywords and are used to train discriminative sentiment models. This paper builds a sentiment text database by excerpting two sentiments:angriness and happiness from Uyghur movie transcriptions and novels,and verifies the proposed approach. Experimental results show that the method based on discriminative keyword extraction is effective in Uyghur text sentence sentiment classification.