软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2012年
6期
1472-1485
,共14页
刘占一%李生%刘挺%王海峰
劉佔一%李生%劉挺%王海峰
류점일%리생%류정%왕해봉
统计搭配模型%基于实例的机器翻译%实例选择%译文选择
統計搭配模型%基于實例的機器翻譯%實例選擇%譯文選擇
통계탑배모형%기우실례적궤기번역%실례선택%역문선택
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度.
基于實例的機器翻譯(example-based machine translation,簡稱EBMT)使用預處理過的雙語例句作為主要翻譯資源,通過編輯與待翻譯句子匹配的翻譯實例來生成譯文.在EBMT繫統中,翻譯實例選擇及譯文選擇對繫統性能影響較大.提齣利用統計搭配模型來增彊EBMT繫統中翻譯實例選擇及譯文選擇的能力,提高譯文質量.首先,使用單語統計詞對齊從單語語料中訓練統計搭配模型.然後,利用該模型從3箇方麵提高EBMT的性能:(1)利用統計搭配模型估計待翻譯句子與翻譯實例之間的匹配度,從而增彊繫統的翻譯實例選擇能力;(2)通過引入候選譯文與上下文之間搭配彊度的估計來提高譯文選擇能力;(3)使用統計搭配模型檢測翻譯實例中被替換詞的搭配詞,同時根據新的替換詞及上下文對搭配詞進行矯正,進一步提高EBMT繫統的譯文質量.為瞭驗證所提齣的方法,在基于詞的EBMT繫統上評價瞭英漢翻譯的譯文質量.與基線繫統相比,所提齣的方法使譯文的BLEU得分提高瞭4.73~6.48箇百分點.在半結構化的EBMT繫統上進一步檢驗瞭基于統計搭配模型的譯文選擇方法,從實驗結果來看,該方法使譯文的BLEU得分提高瞭1.82箇百分點.同時,人工評價結果顯示,改進後的半結構化EBMT繫統的譯文能夠錶達原文的大部分信息,併且具有較高的流利度.
기우실례적궤기번역(example-based machine translation,간칭EBMT)사용예처리과적쌍어례구작위주요번역자원,통과편집여대번역구자필배적번역실례래생성역문.재EBMT계통중,번역실례선택급역문선택대계통성능영향교대.제출이용통계탑배모형래증강EBMT계통중번역실례선택급역문선택적능력,제고역문질량.수선,사용단어통계사대제종단어어료중훈련통계탑배모형.연후,이용해모형종3개방면제고EBMT적성능:(1)이용통계탑배모형고계대번역구자여번역실례지간적필배도,종이증강계통적번역실례선택능력;(2)통과인입후선역문여상하문지간탑배강도적고계래제고역문선택능력;(3)사용통계탑배모형검측번역실례중피체환사적탑배사,동시근거신적체환사급상하문대탑배사진행교정,진일보제고EBMT계통적역문질량.위료험증소제출적방법,재기우사적EBMT계통상평개료영한번역적역문질량.여기선계통상비,소제출적방법사역문적BLEU득분제고료4.73~6.48개백분점.재반결구화적EBMT계통상진일보검험료기우통계탑배모형적역문선택방법,종실험결과래간,해방법사역문적BLEU득분제고료1.82개백분점.동시,인공평개결과현시,개진후적반결구화EBMT계통적역문능구표체원문적대부분신식,병차구유교고적류리도.