西安理工大学学报
西安理工大學學報
서안리공대학학보
Journal of Xi'an University of Technology
2015年
3期
277-281
,共5页
统计机器翻译%特定句法结构%“的”结构%POS调序模型
統計機器翻譯%特定句法結構%“的”結構%POS調序模型
통계궤기번역%특정구법결구%“적”결구%POS조서모형
statistical machine translation%specific syntactic construction%“DE”construction%POS reordering model
面向基于短语的汉英统计机器翻译,提出了一种基于特定句法(汉语“的”结构)增强的调序方法,该方法首先在词对齐和源端词性(POS)信息的约束下抽取基本调序规则,然后根据中文端特定句法结构—“的”字结构,将抽取的基本规则自动分类为“调序倾向性强”和“调序倾向性弱”两类,最后采用不同的优化和剪枝策略对两类规则进行处理,得到最终的源语言端调序规则集合。在NIST汉英数据集上的实验表明,相对于基线系统,本文所提方法在 NIST MT2005测试集上显著提高了0.69 BLEU值。
麵嚮基于短語的漢英統計機器翻譯,提齣瞭一種基于特定句法(漢語“的”結構)增彊的調序方法,該方法首先在詞對齊和源耑詞性(POS)信息的約束下抽取基本調序規則,然後根據中文耑特定句法結構—“的”字結構,將抽取的基本規則自動分類為“調序傾嚮性彊”和“調序傾嚮性弱”兩類,最後採用不同的優化和剪枝策略對兩類規則進行處理,得到最終的源語言耑調序規則集閤。在NIST漢英數據集上的實驗錶明,相對于基線繫統,本文所提方法在 NIST MT2005測試集上顯著提高瞭0.69 BLEU值。
면향기우단어적한영통계궤기번역,제출료일충기우특정구법(한어“적”결구)증강적조서방법,해방법수선재사대제화원단사성(POS)신식적약속하추취기본조서규칙,연후근거중문단특정구법결구—“적”자결구,장추취적기본규칙자동분류위“조서경향성강”화“조서경향성약”량류,최후채용불동적우화화전지책략대량류규칙진행처리,득도최종적원어언단조서규칙집합。재NIST한영수거집상적실험표명,상대우기선계통,본문소제방법재 NIST MT2005측시집상현저제고료0.69 BLEU치。
This paper presents a specific syntactic structure (Chinese “DE”structure)enhanced reordering model for phrase-based Chinese-English SMT.This method first extracts the basic re-ordering rules in the case of constraint of word alignment and part of speech (POS)information, and then classifies the extracted basic rules automatically into two types of “strong reordering tendency”and “weak reordering tendency”in terms of Chinese and specific syntactic structure–“Chinese “DE”structure”.Finally,the different optimization and pruning strategies are adopted to deal with the rules of two types,whereby obtaining the reordering rule set of the source side. The experimental results on Chinese-English NIST 2005 data set indicate that the proposed meth-od significantly raises the baseline by relatively 0.69 BLEU against baseline system.