广东外语外贸大学学报
廣東外語外貿大學學報
엄동외어외무대학학보
JOURNAL OF FOREIGN STUDIES
2014年
2期
81-86
,共6页
“的”%机器翻译%二义性%消除
“的”%機器翻譯%二義性%消除
“적”%궤기번역%이의성%소제
“De”%machine translation%ambiguity%removal
汉语连接结构中的“的(DE)”无处不在,并且可以以多种不同的方式翻译成英语。即使使用语法敏感的翻译模型,其仍然是机器翻译产生偏差的一个主要原因。如何根据语篇语境中的“的(DE)”获得句法、语义的更多信息,从而催生出适当的英语翻译策略?实验描述了汉语NPs中“的(DE)”的分类,构造带注释的实例语料库,然后将其训练成包含语言启发功能的分类器。通过显式标签“的(DE)”结构,使用DE分类器对机器翻译数据进行预处理及重排短语,结果表明此方法为措辞系统提供了显著的MT02(使用 BLEU及其翻译软件系统)收益(+1.31),MT03(+0.92)和 MT05(+1.57),当翻译模型的应用层次经过如此重新排序后其准确性得到持续提升。
漢語連接結構中的“的(DE)”無處不在,併且可以以多種不同的方式翻譯成英語。即使使用語法敏感的翻譯模型,其仍然是機器翻譯產生偏差的一箇主要原因。如何根據語篇語境中的“的(DE)”穫得句法、語義的更多信息,從而催生齣適噹的英語翻譯策略?實驗描述瞭漢語NPs中“的(DE)”的分類,構造帶註釋的實例語料庫,然後將其訓練成包含語言啟髮功能的分類器。通過顯式標籤“的(DE)”結構,使用DE分類器對機器翻譯數據進行預處理及重排短語,結果錶明此方法為措辭繫統提供瞭顯著的MT02(使用 BLEU及其翻譯軟件繫統)收益(+1.31),MT03(+0.92)和 MT05(+1.57),噹翻譯模型的應用層次經過如此重新排序後其準確性得到持續提升。
한어련접결구중적“적(DE)”무처불재,병차가이이다충불동적방식번역성영어。즉사사용어법민감적번역모형,기잉연시궤기번역산생편차적일개주요원인。여하근거어편어경중적“적(DE)”획득구법、어의적경다신식,종이최생출괄당적영어번역책략?실험묘술료한어NPs중“적(DE)”적분류,구조대주석적실례어료고,연후장기훈련성포함어언계발공능적분류기。통과현식표첨“적(DE)”결구,사용DE분류기대궤기번역수거진행예처리급중배단어,결과표명차방법위조사계통제공료현저적MT02(사용 BLEU급기번역연건계통)수익(+1.31),MT03(+0.92)화 MT05(+1.57),당번역모형적응용층차경과여차중신배서후기준학성득도지속제승。
Chinese“De”could be used widely in linking structures and be translated into different expressions. This causes the key problem in machine translation systems whatever sensitive translation software used. The essay discusses how to get more information of semantics and grammar. We analyze a finer grained classification of Chinese NPs and setup an annotated corpus database and use this classification to process and reconstruct the words. The result shows that this method provides positive benefits by using BLEU for 1.31, 0.92 and 1.57 up respectively. The accuracy and fluency has been greatly enhanced by reconstructing the sequence of Chinese“De”.