中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
1期
38-43
,共6页
王辰%宋国龙%吴宏林%张俐%刘绍明
王辰%宋國龍%吳宏林%張俐%劉紹明
왕신%송국룡%오굉림%장리%류소명
计算机应用%中文信息处理%EBMT%短语译文获取%序列相交
計算機應用%中文信息處理%EBMT%短語譯文穫取%序列相交
계산궤응용%중문신식처리%EBMT%단어역문획취%서렬상교
短语译文获取技术是基于实例的机器翻译(EBMT)中的核心技术之一,其准确率直接影响到EBMT系统的性能.该文提出了一种基于序列相交的短语译文获取方法,该方法将句子视为词的序列,利用对中日句对齐语料库中包含待译短语的所有源语句子对应的目标语句子进行序列相交的方式,在不需要词对齐、句法分析及词典等资源的情况下,通过充分挖掘句对齐双语语料库的信息,获得高质量的短语译文.实验表明,该方法获得的短语译文准确率超过80%.
短語譯文穫取技術是基于實例的機器翻譯(EBMT)中的覈心技術之一,其準確率直接影響到EBMT繫統的性能.該文提齣瞭一種基于序列相交的短語譯文穫取方法,該方法將句子視為詞的序列,利用對中日句對齊語料庫中包含待譯短語的所有源語句子對應的目標語句子進行序列相交的方式,在不需要詞對齊、句法分析及詞典等資源的情況下,通過充分挖掘句對齊雙語語料庫的信息,穫得高質量的短語譯文.實驗錶明,該方法穫得的短語譯文準確率超過80%.
단어역문획취기술시기우실례적궤기번역(EBMT)중적핵심기술지일,기준학솔직접영향도EBMT계통적성능.해문제출료일충기우서렬상교적단어역문획취방법,해방법장구자시위사적서렬,이용대중일구대제어료고중포함대역단어적소유원어구자대응적목표어구자진행서렬상교적방식,재불수요사대제、구법분석급사전등자원적정황하,통과충분알굴구대제쌍어어료고적신식,획득고질량적단어역문.실험표명,해방법획득적단어역문준학솔초과80%.