中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
3期
150-158
,共9页
许延祥%罗铁坚%周佳%王竹
許延祥%囉鐵堅%週佳%王竹
허연상%라철견%주가%왕죽
意见挖掘%评价文本%主观性%主观句%客观句
意見挖掘%評價文本%主觀性%主觀句%客觀句
의견알굴%평개문본%주관성%주관구%객관구
opinion mining%review%subjectivity%subject sentence%object sentence
对评价文本的意见挖掘旨在提取由对象、特征、评价语和倾向构成的元组.当前方法主要依赖情感词和语言学启发信息获得主观句表达的意见,忽略了语义表达因素,导致意见召回率较低.该文以实际语料为数据基础,寻找意见表达方式的分布规律.文中明确了判别意见、主观句和客观句的准则,并对ChnSentiCorp语料集中12 000个句子进行了标注.统计结果表明,意见特征类别有限且领域差异大;特征呈随机分布,隐性特征占31.8%;客观句形式意见占36%;在表达方式上有5种主观句式、3种客观句式,意见在各句式上分布不平均.论文最后给出提升意见挖掘性能的5条策略.
對評價文本的意見挖掘旨在提取由對象、特徵、評價語和傾嚮構成的元組.噹前方法主要依賴情感詞和語言學啟髮信息穫得主觀句錶達的意見,忽略瞭語義錶達因素,導緻意見召迴率較低.該文以實際語料為數據基礎,尋找意見錶達方式的分佈規律.文中明確瞭判彆意見、主觀句和客觀句的準則,併對ChnSentiCorp語料集中12 000箇句子進行瞭標註.統計結果錶明,意見特徵類彆有限且領域差異大;特徵呈隨機分佈,隱性特徵佔31.8%;客觀句形式意見佔36%;在錶達方式上有5種主觀句式、3種客觀句式,意見在各句式上分佈不平均.論文最後給齣提升意見挖掘性能的5條策略.
대평개문본적의견알굴지재제취유대상、특정、평개어화경향구성적원조.당전방법주요의뢰정감사화어언학계발신식획득주관구표체적의견,홀략료어의표체인소,도치의견소회솔교저.해문이실제어료위수거기출,심조의견표체방식적분포규률.문중명학료판별의견、주관구화객관구적준칙,병대ChnSentiCorp어료집중12 000개구자진행료표주.통계결과표명,의견특정유별유한차영역차이대;특정정수궤분포,은성특정점31.8%;객관구형식의견점36%;재표체방식상유5충주관구식、3충객관구식,의견재각구식상분포불평균.논문최후급출제승의견알굴성능적5조책략.