中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
6期
139-143
,共5页
基于短语的统计机器翻译%短语表过滤%虚拟上下文
基于短語的統計機器翻譯%短語錶過濾%虛擬上下文
기우단어적통계궤기번역%단어표과려%허의상하문
phrase-based statistical machine translation%filter phrase table%virtual context
在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量.为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法.该方法引入虚拟上下文计算短语对的得分增量;并通过计算最大和最小的短语对的得分增量,设计了一种对短语对重排序的过滤策略.我们在NTCIR-9的中英数据上进行了验证实验,结果显示,当短语表的规模下降到原来的47%时,翻译质量的BLEU值提高了0.000 5;当短语表的规模下降到原来的30%时,BLEU值仅下降0.000 6.实验结果表明,在大规模短语表的过滤中,该文的方法是有效可行的.
在基于短語的統計機器翻譯繫統中,自動抽取的短語錶中不可避免的包含大量的冗餘和錯誤的短語對,這浪費瞭解碼資源又影響翻譯質量.為瞭緩解這箇問題,該文提齣一種基于虛擬上下文的過濾短語錶的方法.該方法引入虛擬上下文計算短語對的得分增量;併通過計算最大和最小的短語對的得分增量,設計瞭一種對短語對重排序的過濾策略.我們在NTCIR-9的中英數據上進行瞭驗證實驗,結果顯示,噹短語錶的規模下降到原來的47%時,翻譯質量的BLEU值提高瞭0.000 5;噹短語錶的規模下降到原來的30%時,BLEU值僅下降0.000 6.實驗結果錶明,在大規模短語錶的過濾中,該文的方法是有效可行的.
재기우단어적통계궤기번역계통중,자동추취적단어표중불가피면적포함대량적용여화착오적단어대,저낭비료해마자원우영향번역질량.위료완해저개문제,해문제출일충기우허의상하문적과려단어표적방법.해방법인입허의상하문계산단어대적득분증량;병통과계산최대화최소적단어대적득분증량,설계료일충대단어대중배서적과려책략.아문재NTCIR-9적중영수거상진행료험증실험,결과현시,당단어표적규모하강도원래적47%시,번역질량적BLEU치제고료0.000 5;당단어표적규모하강도원래적30%시,BLEU치부하강0.000 6.실험결과표명,재대규모단어표적과려중,해문적방법시유효가행적.