计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
12期
133-137,142
,共6页
陈锋%巢文涵%周庆%李舟军
陳鋒%巢文涵%週慶%李舟軍
진봉%소문함%주경%리주군
情感要素识别%中文微博%卷积树核%依存树修剪
情感要素識彆%中文微博%捲積樹覈%依存樹脩剪
정감요소식별%중문미박%권적수핵%의존수수전
Sentiment target recognition%Chinese microblog%Convolution tree kernel%Pruning strategy
情感要素识别是情感分析的关键子任务之一,其目的是识别出文本情感所作用的情感对象.文本情感要素识别属于最细粒度的情感分析,吸引了大量研究者的关注.中文微博由于其语言简短灵活、文本不规范、噪声较大等特点,给中文微博情感分析研究工作带来了新的挑战.目前大部分情感要素识别方法都是基于规则的方法或者基于扁平化特征的统计学习方法,区分噪声的能力不强,性能提升有限.针对中文微博的特点,提出一种基于卷积树核的情感要素识别算法,即首先对句子进行词性标注与依存关系分析,将句子中的名词作为候选情感要素;然后基于两种不同的修剪策略对依存树进行修剪,以获取每个候选情感要素的结构化信息;最后采用卷积树核计算依存树的相似度,并在此基础上识别句子中的情感要素.NLP& CC2 012和NLP&CC2013中文微博情感分析评测任务中的实验验证了该方法的性能,其准确率相比于传统方法有显著提升.
情感要素識彆是情感分析的關鍵子任務之一,其目的是識彆齣文本情感所作用的情感對象.文本情感要素識彆屬于最細粒度的情感分析,吸引瞭大量研究者的關註.中文微博由于其語言簡短靈活、文本不規範、譟聲較大等特點,給中文微博情感分析研究工作帶來瞭新的挑戰.目前大部分情感要素識彆方法都是基于規則的方法或者基于扁平化特徵的統計學習方法,區分譟聲的能力不彊,性能提升有限.針對中文微博的特點,提齣一種基于捲積樹覈的情感要素識彆算法,即首先對句子進行詞性標註與依存關繫分析,將句子中的名詞作為候選情感要素;然後基于兩種不同的脩剪策略對依存樹進行脩剪,以穫取每箇候選情感要素的結構化信息;最後採用捲積樹覈計算依存樹的相似度,併在此基礎上識彆句子中的情感要素.NLP& CC2 012和NLP&CC2013中文微博情感分析評測任務中的實驗驗證瞭該方法的性能,其準確率相比于傳統方法有顯著提升.
정감요소식별시정감분석적관건자임무지일,기목적시식별출문본정감소작용적정감대상.문본정감요소식별속우최세립도적정감분석,흡인료대량연구자적관주.중문미박유우기어언간단령활、문본불규범、조성교대등특점,급중문미박정감분석연구공작대래료신적도전.목전대부분정감요소식별방법도시기우규칙적방법혹자기우편평화특정적통계학습방법,구분조성적능력불강,성능제승유한.침대중문미박적특점,제출일충기우권적수핵적정감요소식별산법,즉수선대구자진행사성표주여의존관계분석,장구자중적명사작위후선정감요소;연후기우량충불동적수전책략대의존수진행수전,이획취매개후선정감요소적결구화신식;최후채용권적수핵계산의존수적상사도,병재차기출상식별구자중적정감요소.NLP& CC2 012화NLP&CC2013중문미박정감분석평측임무중적실험험증료해방법적성능,기준학솔상비우전통방법유현저제승.