中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
6期
75-81
,共7页
李寿山%李逸薇%黄居仁%苏艳
李壽山%李逸薇%黃居仁%囌豔
리수산%리일미%황거인%소염
情感分析%双语信息%情感字典%标签传播
情感分析%雙語信息%情感字典%標籤傳播
정감분석%쌍어신식%정감자전%표첨전파
sentiment analysis%bilingual%sentiment lexicon%label propagation algorithm
文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义.情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义.然而,中文情感词典构建存在两个主要问题:1)许多情感词存在多义、歧义的现象,即一个词语在不同语境中它的语义倾向也不尽相同,这给词语的情感计算带来困难;2)由国内外相关研究现状可知,中文情感字典建设的可用资源相对较少.考虑到英文情感分析研究中存在大量语料和词典,该文借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息.在四个领域的实验结果显示我们的方法能获得一个分类精度高、覆盖领域语境的中文情感词典.
文本情感分析是目前自然語言處理領域的一箇熱點研究問題,具有廣汎的實用價值和理論研究意義.情感詞典構建則是文本情感分析的一項基礎任務,即將詞語按照情感傾嚮分為褒義、中性或者貶義.然而,中文情感詞典構建存在兩箇主要問題:1)許多情感詞存在多義、歧義的現象,即一箇詞語在不同語境中它的語義傾嚮也不儘相同,這給詞語的情感計算帶來睏難;2)由國內外相關研究現狀可知,中文情感字典建設的可用資源相對較少.攷慮到英文情感分析研究中存在大量語料和詞典,該文藉助機器翻譯繫統,結閤雙語言資源的約束信息,利用標籤傳播算法(LP)計算詞語的情感信息.在四箇領域的實驗結果顯示我們的方法能穫得一箇分類精度高、覆蓋領域語境的中文情感詞典.
문본정감분석시목전자연어언처리영역적일개열점연구문제,구유엄범적실용개치화이론연구의의.정감사전구건칙시문본정감분석적일항기출임무,즉장사어안조정감경향분위포의、중성혹자폄의.연이,중문정감사전구건존재량개주요문제:1)허다정감사존재다의、기의적현상,즉일개사어재불동어경중타적어의경향야불진상동,저급사어적정감계산대래곤난;2)유국내외상관연구현상가지,중문정감자전건설적가용자원상대교소.고필도영문정감분석연구중존재대량어료화사전,해문차조궤기번역계통,결합쌍어언자원적약속신식,이용표첨전파산법(LP)계산사어적정감신식.재사개영역적실험결과현시아문적방법능획득일개분류정도고、복개영역어경적중문정감사전.