中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
2期
72-77
,共6页
句对质量评价%覆盖度%统计机器翻译%线性句对质量评价模型%训练语料选取
句對質量評價%覆蓋度%統計機器翻譯%線性句對質量評價模型%訓練語料選取
구대질량평개%복개도%통계궤기번역%선성구대질량평개모형%훈련어료선취
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价.该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法.在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值).
該文研究的目的是在待翻譯文本未知的情況下,從已有的大規模平行語料中選取一箇高質量的子集作為統計機器翻譯繫統的訓練語料,以降低訓練和解碼代價.該文綜閤覆蓋度和句對翻譯質量兩方麵因素,提齣一種從已有平行語料中穫取高質量小規模訓練子集的方法.在CWMT2008漢英翻譯任務上的實驗結果錶明,利用本文的方法能夠從現有大規模語料中選取高質量的子集,在減少80%訓練語料的情況下達到與Baseline繫統(使用全部訓練語料)相噹的翻譯性能(BLEU值).
해문연구적목적시재대번역문본미지적정황하,종이유적대규모평행어료중선취일개고질량적자집작위통계궤기번역계통적훈련어료,이강저훈련화해마대개.해문종합복개도화구대번역질량량방면인소,제출일충종이유평행어료중획취고질량소규모훈련자집적방법.재CWMT2008한영번역임무상적실험결과표명,이용본문적방법능구종현유대규모어료중선취고질량적자집,재감소80%훈련어료적정황하체도여Baseline계통(사용전부훈련어료)상당적번역성능(BLEU치).