计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2014年
10期
2994-2997
,共4页
李响%南江%杨雅婷%周喜%米成刚
李響%南江%楊雅婷%週喜%米成剛
리향%남강%양아정%주희%미성강
汉维机器翻译%泛化语言模型%字符串相似度算法%归一化处理%规则%译文评分
漢維機器翻譯%汎化語言模型%字符串相似度算法%歸一化處理%規則%譯文評分
한유궤기번역%범화어언모형%자부천상사도산법%귀일화처리%규칙%역문평분
Chinese-Uyghur machine translation%generalization language model%string similarity algorithms%normalization processing%the rules%score the translation
针对汉维统计机器翻译中维吾尔语具有长距离依赖问题和语言模型具有数据稀疏现象,提出了一种基于泛化的维吾尔语语言模型.该模型借助维吾尔语语言模型的训练过程中生成的文本,结合字符串相似度算法,取相似的维文字符串经过归一化处理抽取规则,计算规则的参数值,利用规则给测试集在解码过程中生成n-best译文重新评分,将评分最高的译文作为最佳译文.实验结果表明,泛化语言模型减少了存储空间,同时,规则的合理使用有效地提高了翻译译文的质量.
針對漢維統計機器翻譯中維吾爾語具有長距離依賴問題和語言模型具有數據稀疏現象,提齣瞭一種基于汎化的維吾爾語語言模型.該模型藉助維吾爾語語言模型的訓練過程中生成的文本,結閤字符串相似度算法,取相似的維文字符串經過歸一化處理抽取規則,計算規則的參數值,利用規則給測試集在解碼過程中生成n-best譯文重新評分,將評分最高的譯文作為最佳譯文.實驗結果錶明,汎化語言模型減少瞭存儲空間,同時,規則的閤理使用有效地提高瞭翻譯譯文的質量.
침대한유통계궤기번역중유오이어구유장거리의뢰문제화어언모형구유수거희소현상,제출료일충기우범화적유오이어어언모형.해모형차조유오이어어언모형적훈련과정중생성적문본,결합자부천상사도산법,취상사적유문자부천경과귀일화처리추취규칙,계산규칙적삼수치,이용규칙급측시집재해마과정중생성n-best역문중신평분,장평분최고적역문작위최가역문.실험결과표명,범화어언모형감소료존저공간,동시,규칙적합리사용유효지제고료번역역문적질량.