中国科技信息
中國科技信息
중국과기신식
CHINA SCIENCE AND TECHNOLOGY INFORMATION
2013年
11期
99-100
,共2页
统计机器翻译%主题模型%LDA
統計機器翻譯%主題模型%LDA
통계궤기번역%주제모형%LDA
在基于短语的统计机器翻译中,短语表是解码器工作的核心部分,它主要包含了源端和目标端短语的翻译概率和词汇互译概率;但传统的短语表数量庞大,并且领域自适应能力差.为了在解码过程中挑选出更高质量的短语对,适当减少内存消耗和缩小解码空间,本文介绍了一个简单易行的基于主题模型的统计机器翻译系统的实现:首先使用LDA工具建立主题模型,然后把主题模型信息嵌入到短语表中,最后为解码器设计一个预处理模块可以使解码器不需要改变就可以在翻译过程中根据主题选择合适的短语对,从而提高了翻译的效率和质量.
在基于短語的統計機器翻譯中,短語錶是解碼器工作的覈心部分,它主要包含瞭源耑和目標耑短語的翻譯概率和詞彙互譯概率;但傳統的短語錶數量龐大,併且領域自適應能力差.為瞭在解碼過程中挑選齣更高質量的短語對,適噹減少內存消耗和縮小解碼空間,本文介紹瞭一箇簡單易行的基于主題模型的統計機器翻譯繫統的實現:首先使用LDA工具建立主題模型,然後把主題模型信息嵌入到短語錶中,最後為解碼器設計一箇預處理模塊可以使解碼器不需要改變就可以在翻譯過程中根據主題選擇閤適的短語對,從而提高瞭翻譯的效率和質量.
재기우단어적통계궤기번역중,단어표시해마기공작적핵심부분,타주요포함료원단화목표단단어적번역개솔화사회호역개솔;단전통적단어표수량방대,병차영역자괄응능력차.위료재해마과정중도선출경고질량적단어대,괄당감소내존소모화축소해마공간,본문개소료일개간단역행적기우주제모형적통계궤기번역계통적실현:수선사용LDA공구건립주제모형,연후파주제모형신식감입도단어표중,최후위해마기설계일개예처리모괴가이사해마기불수요개변취가이재번역과정중근거주제선택합괄적단어대,종이제고료번역적효솔화질량.