情报学报
情報學報
정보학보
2014年
2期
175-182
,共8页
中文微博%观点挖掘%CRFs模型%观点句识别%语体特征
中文微博%觀點挖掘%CRFs模型%觀點句識彆%語體特徵
중문미박%관점알굴%CRFs모형%관점구식별%어체특정
Chinese microblog%opinion mining%CRFs model%opinion recognition%stylistic features
中文微博包含了用户对热点话题的观点,对其进行观点挖掘可以实现突发事件预警、舆情监控等.目前,微博研究多数基于英文语料,中文微博观点句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的语体特征,导致传统中文文本观点挖掘模型无法取得理想效果.区别于已有的情感挖掘工作,本文依据中文微博的语体特征分析结果选取特征,除了选取情感特征外,还加入主张性动词、语气词、程度副词以及固定词性结构等观点句特征,采用CRFs模型进行观点句识别研究.实验结果表明,仅选取情感特征准确率较高,但召回率仅为32.1%,而加入其他观点句特征后,召回率显著提高到61.8%.该方法应用于2012年中国计算机学会(CCF)组织的“观点句识别”测评任务中,取得了很好的效果.
中文微博包含瞭用戶對熱點話題的觀點,對其進行觀點挖掘可以實現突髮事件預警、輿情鑑控等.目前,微博研究多數基于英文語料,中文微博觀點句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的語體特徵,導緻傳統中文文本觀點挖掘模型無法取得理想效果.區彆于已有的情感挖掘工作,本文依據中文微博的語體特徵分析結果選取特徵,除瞭選取情感特徵外,還加入主張性動詞、語氣詞、程度副詞以及固定詞性結構等觀點句特徵,採用CRFs模型進行觀點句識彆研究.實驗結果錶明,僅選取情感特徵準確率較高,但召迴率僅為32.1%,而加入其他觀點句特徵後,召迴率顯著提高到61.8%.該方法應用于2012年中國計算機學會(CCF)組織的“觀點句識彆”測評任務中,取得瞭很好的效果.
중문미박포함료용호대열점화제적관점,대기진행관점알굴가이실현돌발사건예경、여정감공등.목전,미박연구다수기우영문어료,중문미박관점구적알굴대다혼효재정감알굴중소량제급,유우중문미박특수적어체특정,도치전통중문문본관점알굴모형무법취득이상효과.구별우이유적정감알굴공작,본문의거중문미박적어체특정분석결과선취특정,제료선취정감특정외,환가입주장성동사、어기사、정도부사이급고정사성결구등관점구특정,채용CRFs모형진행관점구식별연구.실험결과표명,부선취정감특정준학솔교고,단소회솔부위32.1%,이가입기타관점구특정후,소회솔현저제고도61.8%.해방법응용우2012년중국계산궤학회(CCF)조직적“관점구식별”측평임무중,취득료흔호적효과.