中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2010年
1期
110-116
,共7页
肖桐%李天宁%陈如山%朱靖波%王会珍
肖桐%李天寧%陳如山%硃靖波%王會珍
초동%리천저%진여산%주정파%왕회진
人工智能%机器翻译%统计机器翻译%词对齐%重对齐%IBM models
人工智能%機器翻譯%統計機器翻譯%詞對齊%重對齊%IBM models
인공지능%궤기번역%통계궤기번역%사대제%중대제%IBM models
artificial intelligence%machine translation%statistical machine translation%word alignment%word realignment%IBM models
词对齐是统计机器翻译中的重要技术之一.该文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分.之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果.此外,该文提出的方法还可以利用大规模单语语料来强化对齐结果.实验结果表明,相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法,该文提出的方法可以使统计机器翻译系统得到更高的翻译准确率.
詞對齊是統計機器翻譯中的重要技術之一.該文提齣瞭一種重對齊方法,它在IBM models穫得的正反雙嚮詞對齊的基礎上,確定齣正反雙嚮對齊不一緻的部分.之後,對雙嚮詞對齊不一緻的部分進行重新對齊以得到更好的對稱化的詞對齊結果.此外,該文提齣的方法還可以利用大規模單語語料來彊化對齊結果.實驗結果錶明,相比在統計機器翻譯中廣汎使用的基于啟髮信息的詞對齊對稱化方法,該文提齣的方法可以使統計機器翻譯繫統得到更高的翻譯準確率.
사대제시통계궤기번역중적중요기술지일.해문제출료일충중대제방법,타재IBM models획득적정반쌍향사대제적기출상,학정출정반쌍향대제불일치적부분.지후,대쌍향사대제불일치적부분진행중신대제이득도경호적대칭화적사대제결과.차외,해문제출적방법환가이이용대규모단어어료래강화대제결과.실험결과표명,상비재통계궤기번역중엄범사용적기우계발신식적사대제대칭화방법,해문제출적방법가이사통계궤기번역계통득도경고적번역준학솔.
Word alignment is one of the key techniques in statistical machine translation (SMT). In this paper, we propose a word realignment method, which recognizes the inconsistent parts between the bidirectional alignments generated by IBM models at first, and refines then the word alignment by realigning the inconsistent parts. To reinforce our method, a monolingual feature is used to make benefits from large-scale monolingual corpus. The effectiveness of the method is demonstrated on a state-of-the-art phrase-based SMT system. The experimental results show that our method can achieve higher translation accuracy than the widely-adopted heuristics-based method.