计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
3期
224-227
,共4页
米莉万?雪合来提%麦热哈巴?艾力%吐尔根?依布拉音%姜文斌
米莉萬?雪閤來提%麥熱哈巴?艾力%吐爾根?依佈拉音%薑文斌
미리만?설합래제%맥열합파?애력%토이근?의포랍음%강문빈
黏着语%词尾%统计机器翻译%层次短语翻译模型%语言模型
黏著語%詞尾%統計機器翻譯%層次短語翻譯模型%語言模型
점착어%사미%통계궤기번역%층차단어번역모형%어언모형
agglutinative language%suffix%statistical machine translation%hierarchical phrase-based translation model%language model
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。
維吾爾語屬于阿爾泰語繫,是典型的黏著語,構形詞尾在維吾爾語中佔很重要的地位,這與漢語差彆很大。針對維吾爾語的形態特點,分析漢維統計機器翻譯中維吾爾語構形詞尾的作用,利用Cherio搭建一箇基于層次短語的漢維統計機器翻譯繫統。使用詞級粒度、詞榦級粒度、詞榦詞尾級粒度的漢維平行語料進行對比實驗,探討不同粒度對漢維統計機器翻譯繫統的影響。實驗結果錶明,該漢維統計機器翻譯繫統可以提高漢維統計翻譯的質量,BLEU值達到0.1972。
유오이어속우아이태어계,시전형적점착어,구형사미재유오이어중점흔중요적지위,저여한어차별흔대。침대유오이어적형태특점,분석한유통계궤기번역중유오이어구형사미적작용,이용Cherio탑건일개기우층차단어적한유통계궤기번역계통。사용사급립도、사간급립도、사간사미급립도적한유평행어료진행대비실험,탐토불동립도대한유통계궤기번역계통적영향。실험결과표명,해한유통계궤기번역계통가이제고한유통계번역적질량,BLEU치체도0.1972。
Uyghur which belongs to altaic language system is a typical agglutinative language and has large number of suffixes, and there is a big contrast with Chinese. According to the morphological characteristics of Uyghur language, this paper analyzes the Uyghur suffix’s role in Chinese-Uyghur statistical machine translation system. With the help of the Cheiro and exsiting technology it builds a hierarchical phrase-based Chinese-Uyghur statistical machine translation system. By comparing the performance of translation system with different granularity parallel corpora, experimental results show that the stem-affix representational units improve the performance of Chinese-Uyghur statistical machine translation system, and the BLEU value achieves to 0.197 2.