中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
5期
141-147
,共7页
高恩婷%段湘煜%巢佳媛%张民
高恩婷%段湘煜%巢佳媛%張民
고은정%단상욱%소가원%장민
机器翻译%规则剪枝%半强制解码%变分贝叶斯
機器翻譯%規則剪枝%半彊製解碼%變分貝葉斯
궤기번역%규칙전지%반강제해마%변분패협사
machine translation%rule pruning%semi-forced decoding%variational bayesian
统计机器翻译一般采用启发式方法训练翻译模型.但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高.针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型.该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数.该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高.
統計機器翻譯一般採用啟髮式方法訓練翻譯模型.但啟髮式方法的理論基礎不夠完善,因此,會導緻翻譯模型規模龐大以及模型參數精確率不高.針對以上兩箇問題,該文提齣一種基于變分貝葉斯推理的模型訓練方法,形成更精確的精簡翻譯模型.該方法首先通過彊製解碼對齊語料,然後利用變分貝葉斯EM算法穫得模型參數.該文的實驗語料為NIST漢英翻譯任務數據,實驗結果顯示,基于句法(基于短語)的統計機器翻譯中,超過95%(76%)的規則被剪枝,且BLEU值顯著提高.
통계궤기번역일반채용계발식방법훈련번역모형.단계발식방법적이론기출불구완선,인차,회도치번역모형규모방대이급모형삼수정학솔불고.침대이상량개문제,해문제출일충기우변분패협사추리적모형훈련방법,형성경정학적정간번역모형.해방법수선통과강제해마대제어료,연후이용변분패협사EM산법획득모형삼수.해문적실험어료위NIST한영번역임무수거,실험결과현시,기우구법(기우단어)적통계궤기번역중,초과95%(76%)적규칙피전지,차BLEU치현저제고.