中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
6期
134-138,150
,共6页
付晓寅%魏玮%卢世祥%徐波
付曉寅%魏瑋%盧世祥%徐波
부효인%위위%로세상%서파
统计机器翻译%层次短语%强制对齐%模型训练
統計機器翻譯%層次短語%彊製對齊%模型訓練
통계궤기번역%층차단어%강제대제%모형훈련
statistical machine translation%hierarchical phrase-based model%forced alignment%model training
该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法不需要引入任何语言学知识,适合大规模语料训练模型.在大规模中英翻译评测任务中,采用该方法训练的模型与传统层次短语模型相比,不仅能够过滤50%左右规则,同时获得0.8~1.2BLEU值的提高.
該文提齣一種層次短語模型過濾和優化方法.該方法在採用傳統方法訓練得到層次短語規則的基礎上,通過彊製對齊同時構建源語言和目標語言的解析樹,從中過濾併抽取對齊的層次短語規則,最後利用這些規則重新估計翻譯模型的翻譯概率.該方法不需要引入任何語言學知識,適閤大規模語料訓練模型.在大規模中英翻譯評測任務中,採用該方法訓練的模型與傳統層次短語模型相比,不僅能夠過濾50%左右規則,同時穫得0.8~1.2BLEU值的提高.
해문제출일충층차단어모형과려화우화방법.해방법재채용전통방법훈련득도층차단어규칙적기출상,통과강제대제동시구건원어언화목표어언적해석수,종중과려병추취대제적층차단어규칙,최후이용저사규칙중신고계번역모형적번역개솔.해방법불수요인입임하어언학지식,괄합대규모어료훈련모형.재대규모중영번역평측임무중,채용해방법훈련적모형여전통층차단어모형상비,불부능구과려50%좌우규칙,동시획득0.8~1.2BLEU치적제고.