西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2011年
10期
48-53
,共6页
张涛%余正涛%郭剑毅%曹先彬
張濤%餘正濤%郭劍毅%曹先彬
장도%여정도%곽검의%조선빈
词语对齐%纳西%汉语%特征约束模型
詞語對齊%納西%漢語%特徵約束模型
사어대제%납서%한어%특정약속모형
针对纳西语、汉语因句法结构差异较大而导致双语词语自动对齐较为困难的问题,提出一种融合特征约束模型的纳西-汉语双语词语对齐算法.首先在语料中统计纳西-汉语词语区间扭曲和位置转换特性,并由此建立2个双语词语对齐的特征约束模型;然后将提出的特征约束模型融入词语对齐的对数线性模型框架,并结合最小错误率算法训练模型参数;最终搜索出最佳的词语对齐结果.实验以IBM Model3为词语对齐比较模型,结果表明,该双语词语对齐算法可以使纳西-汉语词语的对齐准确率提升21.9%.
針對納西語、漢語因句法結構差異較大而導緻雙語詞語自動對齊較為睏難的問題,提齣一種融閤特徵約束模型的納西-漢語雙語詞語對齊算法.首先在語料中統計納西-漢語詞語區間扭麯和位置轉換特性,併由此建立2箇雙語詞語對齊的特徵約束模型;然後將提齣的特徵約束模型融入詞語對齊的對數線性模型框架,併結閤最小錯誤率算法訓練模型參數;最終搜索齣最佳的詞語對齊結果.實驗以IBM Model3為詞語對齊比較模型,結果錶明,該雙語詞語對齊算法可以使納西-漢語詞語的對齊準確率提升21.9%.
침대납서어、한어인구법결구차이교대이도치쌍어사어자동대제교위곤난적문제,제출일충융합특정약속모형적납서-한어쌍어사어대제산법.수선재어료중통계납서-한어사어구간뉴곡화위치전환특성,병유차건립2개쌍어사어대제적특정약속모형;연후장제출적특정약속모형융입사어대제적대수선성모형광가,병결합최소착오솔산법훈련모형삼수;최종수색출최가적사어대제결과.실험이IBM Model3위사어대제비교모형,결과표명,해쌍어사어대제산법가이사납서-한어사어적대제준학솔제승21.9%.