中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
1期
87-93
,共7页
何钟豪%苏劲松%史晓东%陈毅东%黄研洲
何鐘豪%囌勁鬆%史曉東%陳毅東%黃研洲
하종호%소경송%사효동%진의동%황연주
最大熵%短语调序%不平衡分类%集成学习
最大熵%短語調序%不平衡分類%集成學習
최대적%단어조서%불평형분류%집성학습
maximum entropy%phrase reordering%imbalanced classifier%ensemble learning
基于最大熵的括号转录语法模型具有翻译能力强、模型训练简单的优点,成为近些年统计机器翻译研究的热点.然而,该模型存在短语调序实例样本分布不平衡的缺点.针对该问题,该文提出了一种引入集成学习的短语调序模型训练方法.在大规模数据集上的实验结果表明,我们的方法能有效改善调序模型的训练效果,显著提高翻译系统性能.
基于最大熵的括號轉錄語法模型具有翻譯能力彊、模型訓練簡單的優點,成為近些年統計機器翻譯研究的熱點.然而,該模型存在短語調序實例樣本分佈不平衡的缺點.針對該問題,該文提齣瞭一種引入集成學習的短語調序模型訓練方法.在大規模數據集上的實驗結果錶明,我們的方法能有效改善調序模型的訓練效果,顯著提高翻譯繫統性能.
기우최대적적괄호전록어법모형구유번역능력강、모형훈련간단적우점,성위근사년통계궤기번역연구적열점.연이,해모형존재단어조서실례양본분포불평형적결점.침대해문제,해문제출료일충인입집성학습적단어조서모형훈련방법.재대규모수거집상적실험결과표명,아문적방법능유효개선조서모형적훈련효과,현저제고번역계통성능.