中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
6期
175-182
,共8页
缺省项%识别规则%词法特征%依存句法%C4.5算法
缺省項%識彆規則%詞法特徵%依存句法%C4.5算法
결성항%식별규칙%사법특정%의존구법%C4.5산법
default item%identification rule%lexical feature%dependency syntactic%C4.5 algorithm
在多对象、多属性的评论文本中,评价对象和评价属性的缺省识别对于观点挖掘有着重要的作用.针对情感观点句中评价对象和评价属性的缺省问题,该文提出一种有效的缺省项识别方法.首先构造缺省项识别规则集,用于获取待识别的缺省项侯选集;将缺省项识别问题看作一个二元分类问题,选用词法和依存句法作为特征,使用决策树分类算法C4.5训练分类器模型,在测试集上对待识别的缺省项进行判别.实验结果表明,使用依存句法特征集分类的F值优于词法特征集约2%.将词法和依存句法两类特征融合与单类特征相比,分类精确率和F值分别提高了10%和5%左右,说明词法特征和依存句法特征的融合有利于缺省项识别.
在多對象、多屬性的評論文本中,評價對象和評價屬性的缺省識彆對于觀點挖掘有著重要的作用.針對情感觀點句中評價對象和評價屬性的缺省問題,該文提齣一種有效的缺省項識彆方法.首先構造缺省項識彆規則集,用于穫取待識彆的缺省項侯選集;將缺省項識彆問題看作一箇二元分類問題,選用詞法和依存句法作為特徵,使用決策樹分類算法C4.5訓練分類器模型,在測試集上對待識彆的缺省項進行判彆.實驗結果錶明,使用依存句法特徵集分類的F值優于詞法特徵集約2%.將詞法和依存句法兩類特徵融閤與單類特徵相比,分類精確率和F值分彆提高瞭10%和5%左右,說明詞法特徵和依存句法特徵的融閤有利于缺省項識彆.
재다대상、다속성적평논문본중,평개대상화평개속성적결성식별대우관점알굴유착중요적작용.침대정감관점구중평개대상화평개속성적결성문제,해문제출일충유효적결성항식별방법.수선구조결성항식별규칙집,용우획취대식별적결성항후선집;장결성항식별문제간작일개이원분류문제,선용사법화의존구법작위특정,사용결책수분류산법C4.5훈련분류기모형,재측시집상대대식별적결성항진행판별.실험결과표명,사용의존구법특정집분류적F치우우사법특정집약2%.장사법화의존구법량류특정융합여단류특정상비,분류정학솔화F치분별제고료10%화5%좌우,설명사법특정화의존구법특정적융합유리우결성항식별.