沈阳航空航天大学学报
瀋暘航空航天大學學報
침양항공항천대학학보
JOURNAL OF SHENYANG INSTITUTE OF AERONAUTICAL ENGINEERING
2014年
6期
66-72
,共7页
刘颖%季铎%黄海红%蔡东风
劉穎%季鐸%黃海紅%蔡東風
류영%계탁%황해홍%채동풍
俄语%基本名词短语%词性搭配模式%CRF
俄語%基本名詞短語%詞性搭配模式%CRF
아어%기본명사단어%사성탑배모식%CRF
针对目前国内鲜有研究且语料资源缺乏的俄语基本名词短语(Base Noun Phrase,BaseNP)识别,提出一种规则与统计相结合的方法,其优势是在有限资源的基础上,既能充分利用俄语BaseNP在词性构成上的规律特点,通过俄汉词典统计得到最佳词性搭配模式库进行模式匹配;又无需人工标注统计工具所需的训练语料,仅依靠词典和词性搭配模式库自动构建,节省标注代价.规则与统计的结合,既能在很大程度上召回BaseNP,又能使用条件随机场(Conditional Random Fields,CRF)纠正规则标注的歧义和错误,处理规则未能覆盖的情况.实验表明,使用该方法实现的俄语基本名词短语识别效果良好,其F值达到了84.14%.
針對目前國內鮮有研究且語料資源缺乏的俄語基本名詞短語(Base Noun Phrase,BaseNP)識彆,提齣一種規則與統計相結閤的方法,其優勢是在有限資源的基礎上,既能充分利用俄語BaseNP在詞性構成上的規律特點,通過俄漢詞典統計得到最佳詞性搭配模式庫進行模式匹配;又無需人工標註統計工具所需的訓練語料,僅依靠詞典和詞性搭配模式庫自動構建,節省標註代價.規則與統計的結閤,既能在很大程度上召迴BaseNP,又能使用條件隨機場(Conditional Random Fields,CRF)糾正規則標註的歧義和錯誤,處理規則未能覆蓋的情況.實驗錶明,使用該方法實現的俄語基本名詞短語識彆效果良好,其F值達到瞭84.14%.
침대목전국내선유연구차어료자원결핍적아어기본명사단어(Base Noun Phrase,BaseNP)식별,제출일충규칙여통계상결합적방법,기우세시재유한자원적기출상,기능충분이용아어BaseNP재사성구성상적규률특점,통과아한사전통계득도최가사성탑배모식고진행모식필배;우무수인공표주통계공구소수적훈련어료,부의고사전화사성탑배모식고자동구건,절성표주대개.규칙여통계적결합,기능재흔대정도상소회BaseNP,우능사용조건수궤장(Conditional Random Fields,CRF)규정규칙표주적기의화착오,처리규칙미능복개적정황.실험표명,사용해방법실현적아어기본명사단어식별효과량호,기F치체도료84.14%.