西部蒙古论坛
西部矇古論罈
서부몽고론단
JOURNAL OF THE WESTERN MONGOLIAN STUDIES
2014年
2期
62-71
,共10页
伊·达瓦%王羡慧%米尔阿迪力江·麦麦提
伊·達瓦%王羨慧%米爾阿迪力江·麥麥提
이·체와%왕이혜%미이아적력강·맥맥제
蒙文胡都木托忒文本%平行语料%统计机器翻译%Moses%余弦相似度
矇文鬍都木託忒文本%平行語料%統計機器翻譯%Moses%餘絃相似度
몽문호도목탁특문본%평행어료%통계궤기번역%Moses%여현상사도
针对蒙文多文种文本(如传统蒙文TM,新蒙文NM及托忒文Todo)的互换显示需求,本文研究了基于短语的统计机器翻译技术的自动转写方法.首先,人工建立上述三文平行6万条句对语料.其次,利用TM和Todo(NM)双文句对中,词间空格信息对,TM功能词与前词强制连接,生成双文句及词对齐语料,并生成统计翻译模型和语言模型.最后,借助于Moses解码器实现双文的自动转写.实验分别用300开发句和测试句进行TM-Todo句文双向互译时,其BLEU值分别达到了57.82%和58.03%,比先前汉-蒙语机器翻译最好BLEU值:29.86%,近高一倍.
針對矇文多文種文本(如傳統矇文TM,新矇文NM及託忒文Todo)的互換顯示需求,本文研究瞭基于短語的統計機器翻譯技術的自動轉寫方法.首先,人工建立上述三文平行6萬條句對語料.其次,利用TM和Todo(NM)雙文句對中,詞間空格信息對,TM功能詞與前詞彊製連接,生成雙文句及詞對齊語料,併生成統計翻譯模型和語言模型.最後,藉助于Moses解碼器實現雙文的自動轉寫.實驗分彆用300開髮句和測試句進行TM-Todo句文雙嚮互譯時,其BLEU值分彆達到瞭57.82%和58.03%,比先前漢-矇語機器翻譯最好BLEU值:29.86%,近高一倍.
침대몽문다문충문본(여전통몽문TM,신몽문NM급탁특문Todo)적호환현시수구,본문연구료기우단어적통계궤기번역기술적자동전사방법.수선,인공건립상술삼문평행6만조구대어료.기차,이용TM화Todo(NM)쌍문구대중,사간공격신식대,TM공능사여전사강제련접,생성쌍문구급사대제어료,병생성통계번역모형화어언모형.최후,차조우Moses해마기실현쌍문적자동전사.실험분별용300개발구화측시구진행TM-Todo구문쌍향호역시,기BLEU치분별체도료57.82%화58.03%,비선전한-몽어궤기번역최호BLEU치:29.86%,근고일배.