智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2014年
4期
21-24
,共4页
词性标注%依存句法分析%联合模型%过训练
詞性標註%依存句法分析%聯閤模型%過訓練
사성표주%의존구법분석%연합모형%과훈련
POS -Tagging%Dependency Parsing%Joint Models%Uptraining
词性标注和依存句法分析是自然语言处理领域中句子级别基本分析技术的两个重要任务,一般来说词性标注是依存句法分析的一个前提条件。基于联合分析的方法将这两个任务在一个统一的统计模型中联合处理能避免错误传播这类问题的发生,因此这种联合模型能取得比较好的性能。但是这种联合模型会带来算法上的时间复杂度的额外开销,因此导致联合分析的方法,速度非常慢。本文提出一种基于过训练的方法,通过极少量的性能损失,使得联合模型的解码速度提升了6倍。
詞性標註和依存句法分析是自然語言處理領域中句子級彆基本分析技術的兩箇重要任務,一般來說詞性標註是依存句法分析的一箇前提條件。基于聯閤分析的方法將這兩箇任務在一箇統一的統計模型中聯閤處理能避免錯誤傳播這類問題的髮生,因此這種聯閤模型能取得比較好的性能。但是這種聯閤模型會帶來算法上的時間複雜度的額外開銷,因此導緻聯閤分析的方法,速度非常慢。本文提齣一種基于過訓練的方法,通過極少量的性能損失,使得聯閤模型的解碼速度提升瞭6倍。
사성표주화의존구법분석시자연어언처리영역중구자급별기본분석기술적량개중요임무,일반래설사성표주시의존구법분석적일개전제조건。기우연합분석적방법장저량개임무재일개통일적통계모형중연합처리능피면착오전파저류문제적발생,인차저충연합모형능취득비교호적성능。단시저충연합모형회대래산법상적시간복잡도적액외개소,인차도치연합분석적방법,속도비상만。본문제출일충기우과훈련적방법,통과겁소량적성능손실,사득연합모형적해마속도제승료6배。
POS tagging and dependency parsing are basic tasks of sentence -level natural language processing.Generally POS -tagging is a necessary prerequisite for dependency parsing.The joint models which link the two tasks together and process them by a unified model have achieved improved performances,because joint modeling can avoid the error -propa-gation problem.However,the time complexity of joint models can be always so large,thus yields much slower speed.This paper proposes a method based on uptraining technique to improve the speed of joint models,with only very little loss in performances.