计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
16期
40-42
,共3页
语义角色标注%跨分句%论元%统计决策树
語義角色標註%跨分句%論元%統計決策樹
어의각색표주%과분구%론원%통계결책수
与印欧语言不同,汉语的句子往往是由多个分句组成的复句.但目前的中文语义角色的标注语料和标注系统并没有对现代汉语的这个特点给予充分的重视.由于数据稀疏的问题,对于与动词跨分句的论元还没有一个有效的识别方法,直接影响了汉语真实文本语义角色标注的研究.运用统计和规则结合的方法,对与动词跨分句的论元进行识别.先用一条基本的规则识别出大部分的动词的论元,再找到规则识别的薄弱点,运用统计决策树融合多种特征构造模型,以进一步提高识别的准确率.实验结果表明,对于与动词的跨分句的论元,仅仅规则识别的F值就达到了65.3%,使用决策树后,F值提高到67.2%.
與印歐語言不同,漢語的句子往往是由多箇分句組成的複句.但目前的中文語義角色的標註語料和標註繫統併沒有對現代漢語的這箇特點給予充分的重視.由于數據稀疏的問題,對于與動詞跨分句的論元還沒有一箇有效的識彆方法,直接影響瞭漢語真實文本語義角色標註的研究.運用統計和規則結閤的方法,對與動詞跨分句的論元進行識彆.先用一條基本的規則識彆齣大部分的動詞的論元,再找到規則識彆的薄弱點,運用統計決策樹融閤多種特徵構造模型,以進一步提高識彆的準確率.實驗結果錶明,對于與動詞的跨分句的論元,僅僅規則識彆的F值就達到瞭65.3%,使用決策樹後,F值提高到67.2%.
여인구어언불동,한어적구자왕왕시유다개분구조성적복구.단목전적중문어의각색적표주어료화표주계통병몰유대현대한어적저개특점급여충분적중시.유우수거희소적문제,대우여동사과분구적론원환몰유일개유효적식별방법,직접영향료한어진실문본어의각색표주적연구.운용통계화규칙결합적방법,대여동사과분구적론원진행식별.선용일조기본적규칙식별출대부분적동사적론원,재조도규칙식별적박약점,운용통계결책수융합다충특정구조모형,이진일보제고식별적준학솔.실험결과표명,대우여동사적과분구적론원,부부규칙식별적F치취체도료65.3%,사용결책수후,F치제고도67.2%.