智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2014年
6期
31-34
,共4页
统计机器翻译%领域自适应
統計機器翻譯%領域自適應
통계궤기번역%영역자괄응
统计机器翻译的准确性在很大程度上取决于翻译建模的质量,而翻译建模往往依赖于数据的分布.通常,大多数机器学习任务会假设训练数据和测试数据是独立同分布的,然而在实际的系统中,这种假设未必成立.因此,为了达到性能的最优,需要根据数据分布的情况对模型进行适当的迁移.近年来,领域自适应技术成为统计机器翻译研究中的一个热点话题,目的在于解决训练数据和测试数据的领域分布不一致问题.本文介绍了几类流行的统计机器翻译领域自适应方法,并对未来的研究提出一些展望.
統計機器翻譯的準確性在很大程度上取決于翻譯建模的質量,而翻譯建模往往依賴于數據的分佈.通常,大多數機器學習任務會假設訓練數據和測試數據是獨立同分佈的,然而在實際的繫統中,這種假設未必成立.因此,為瞭達到性能的最優,需要根據數據分佈的情況對模型進行適噹的遷移.近年來,領域自適應技術成為統計機器翻譯研究中的一箇熱點話題,目的在于解決訓練數據和測試數據的領域分佈不一緻問題.本文介紹瞭幾類流行的統計機器翻譯領域自適應方法,併對未來的研究提齣一些展望.
통계궤기번역적준학성재흔대정도상취결우번역건모적질량,이번역건모왕왕의뢰우수거적분포.통상,대다수궤기학습임무회가설훈련수거화측시수거시독립동분포적,연이재실제적계통중,저충가설미필성립.인차,위료체도성능적최우,수요근거수거분포적정황대모형진행괄당적천이.근년래,영역자괄응기술성위통계궤기번역연구중적일개열점화제,목적재우해결훈련수거화측시수거적영역분포불일치문제.본문개소료궤류류행적통계궤기번역영역자괄응방법,병대미래적연구제출일사전망.