中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2010年
1期
25-29,47
,共6页
王步康%王红玲%袁晓虹%周国栋
王步康%王紅玲%袁曉虹%週國棟
왕보강%왕홍령%원효홍%주국동
计算机应用%中文信息处理%语义角色标注%依存关系%最大熵分类器
計算機應用%中文信息處理%語義角色標註%依存關繫%最大熵分類器
계산궤응용%중문신식처리%어의각색표주%의존관계%최대적분류기
computer application%Chinese information processing%Semantic Role Labeling%Dependency Relations%maximum entropy classifier
依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式.该文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统.该系统针对中文依存关系树,采用有效的剪枝算法和特征,使用最大熵分类器进行语义角色的识别和分类.系统使用了两种不同的语料,一种是由标准短语结构句法分析(CTB5.0)转换而来,另一种是CoNLL2009公布的中文语料.系统分别在两种语料的标准谓词和自动谓词的基础上进行实验,在标准谓词上取得的F1值分别为84.30%和81.68%,在自动谓词上的F1值为81.02%和81.33%.
依存句法是句法分析的一種,相比于短語結構句法分析,依存句法具有更簡潔的錶達方式.該文採用英文語義角色標註的研究方法,實現瞭一箇基于中文依存句法分析的語義角色標註繫統.該繫統針對中文依存關繫樹,採用有效的剪枝算法和特徵,使用最大熵分類器進行語義角色的識彆和分類.繫統使用瞭兩種不同的語料,一種是由標準短語結構句法分析(CTB5.0)轉換而來,另一種是CoNLL2009公佈的中文語料.繫統分彆在兩種語料的標準謂詞和自動謂詞的基礎上進行實驗,在標準謂詞上取得的F1值分彆為84.30%和81.68%,在自動謂詞上的F1值為81.02%和81.33%.
의존구법시구법분석적일충,상비우단어결구구법분석,의존구법구유경간길적표체방식.해문채용영문어의각색표주적연구방법,실현료일개기우중문의존구법분석적어의각색표주계통.해계통침대중문의존관계수,채용유효적전지산법화특정,사용최대적분류기진행어의각색적식별화분류.계통사용료량충불동적어료,일충시유표준단어결구구법분석(CTB5.0)전환이래,령일충시CoNLL2009공포적중문어료.계통분별재량충어료적표준위사화자동위사적기출상진행실험,재표준위사상취득적F1치분별위84.30%화81.68%,재자동위사상적F1치위81.02%화81.33%.
Dependency representations are more simple and intuitive than constituent representations for Chinese parse. This paper implements a Chinese dependency parse based semantic role labeling (SRL) by using the similar methods in English SRL. In the system, effective pruning algorithm and useful features are adopted for Chinese dependency tree, and the semantic role identification and classification are accomplished by a maximum entropy classifier. Two different corpora are adopted to test our system, one is transferred from constituent-based corpus (CTB5.0), and the other is Chinese dataset provided by CoNLL 2009 shared task. Based on the two datasets, the system achieves, respectively, 84.30% and 81.68% in labeled F1 for gold predicates, and 81.02% and 81.33% for automatic predicates.