计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
31期
130-134,187
,共6页
肖健%徐建%徐晓兰%袁琦
肖健%徐建%徐曉蘭%袁琦
초건%서건%서효란%원기
三元组可比语料库%多词表达(MWE)%语义模板
三元組可比語料庫%多詞錶達(MWE)%語義模闆
삼원조가비어료고%다사표체(MWE)%어의모판
多词表达(MWE)不仅用来提高当前机器翻译系统质量,而且也用于跨语言检索和数据挖掘等其他自然语言处理领域.为此,提出了基于语义模板与基于统计工具相结合的方法从三元组可比语料库中自动提取本族英语MWE.采用基于词表和分布方法计算词语间的相似度,扩大MWE覆盖范围.利用GIZA++对齐算法提取时译的中文MWE,依据统计方法计算互译概率信息,根据概率大小,选择最佳英汉MWE互译对.实验结果表明上述方法可以有效提高MWE提取和对齐的准确率.
多詞錶達(MWE)不僅用來提高噹前機器翻譯繫統質量,而且也用于跨語言檢索和數據挖掘等其他自然語言處理領域.為此,提齣瞭基于語義模闆與基于統計工具相結閤的方法從三元組可比語料庫中自動提取本族英語MWE.採用基于詞錶和分佈方法計算詞語間的相似度,擴大MWE覆蓋範圍.利用GIZA++對齊算法提取時譯的中文MWE,依據統計方法計算互譯概率信息,根據概率大小,選擇最佳英漢MWE互譯對.實驗結果錶明上述方法可以有效提高MWE提取和對齊的準確率.
다사표체(MWE)불부용래제고당전궤기번역계통질량,이차야용우과어언검색화수거알굴등기타자연어언처리영역.위차,제출료기우어의모판여기우통계공구상결합적방법종삼원조가비어료고중자동제취본족영어MWE.채용기우사표화분포방법계산사어간적상사도,확대MWE복개범위.이용GIZA++대제산법제취시역적중문MWE,의거통계방법계산호역개솔신식,근거개솔대소,선택최가영한MWE호역대.실험결과표명상술방법가이유효제고MWE제취화대제적준학솔.