当代语言学
噹代語言學
당대어언학
Contemporary Linguistics
2012年
4期
407~417
,共null页
多词单位 描写分类 识别算法 词典编纂
多詞單位 描寫分類 識彆算法 詞典編纂
다사단위 묘사분류 식별산법 사전편찬
多词单位负载的意义稳定,在信息检索、机器翻译、自动问答等语言应用系统和语言研究中日益受到重视,但由于其类型多样、构成复杂、变化灵活,较难给出形式化表达,进而造成其在语言研究和实际应用中面临诸多困难。当前,多词单位的研究集中在描写分类、识别算法、词典建设等方面,并逐渐从研究领域走向实用领域。本文重点讨论与词典编纂相关的多词单位描写与识别问题,为构建以多词单位为主体的词典资源提供参考。
多詞單位負載的意義穩定,在信息檢索、機器翻譯、自動問答等語言應用繫統和語言研究中日益受到重視,但由于其類型多樣、構成複雜、變化靈活,較難給齣形式化錶達,進而造成其在語言研究和實際應用中麵臨諸多睏難。噹前,多詞單位的研究集中在描寫分類、識彆算法、詞典建設等方麵,併逐漸從研究領域走嚮實用領域。本文重點討論與詞典編纂相關的多詞單位描寫與識彆問題,為構建以多詞單位為主體的詞典資源提供參攷。
다사단위부재적의의은정,재신식검색、궤기번역、자동문답등어언응용계통화어언연구중일익수도중시,단유우기류형다양、구성복잡、변화령활,교난급출형식화표체,진이조성기재어언연구화실제응용중면림제다곤난。당전,다사단위적연구집중재묘사분류、식별산법、사전건설등방면,병축점종연구영역주향실용영역。본문중점토론여사전편찬상관적다사단위묘사여식별문제,위구건이다사단위위주체적사전자원제공삼고。