计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
34期
143-145,170
,共4页
田生伟%吐尔根·依布拉音%禹龙
田生偉%吐爾根·依佈拉音%禹龍
전생위%토이근·의포랍음%우룡
双语语料%句子对齐%混合策略
雙語語料%句子對齊%混閤策略
쌍어어료%구자대제%혼합책략
提出了一种混合算法对齐汉维句子,不需要汉语分词、词性标注预处理,利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,作为基于词汇对齐的词典,并结合基于长度的方法进行句子对齐,实验结果验证了该混合算法的有效性,汉维语句子对齐的正确率和召回率,达到了97.5%和97.1%.
提齣瞭一種混閤算法對齊漢維句子,不需要漢語分詞、詞性標註預處理,利用雙語語料的詞彙共現信息,自動抽取漢維語詞彙搭配,作為基于詞彙對齊的詞典,併結閤基于長度的方法進行句子對齊,實驗結果驗證瞭該混閤算法的有效性,漢維語句子對齊的正確率和召迴率,達到瞭97.5%和97.1%.
제출료일충혼합산법대제한유구자,불수요한어분사、사성표주예처리,이용쌍어어료적사회공현신식,자동추취한유어사회탑배,작위기우사회대제적사전,병결합기우장도적방법진행구자대제,실험결과험증료해혼합산법적유효성,한유어구자대제적정학솔화소회솔,체도료97.5%화97.1%.