计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2001年
19期
87-89,106
,共4页
自然语言处理%中文计算%汉语自动分词%组合型歧义切分字段
自然語言處理%中文計算%漢語自動分詞%組閤型歧義切分字段
자연어언처리%중문계산%한어자동분사%조합형기의절분자단
组合型歧义切分字段一直是汉语自动分词研究中的一个难点.该文将之视为与Word Sense Disambiguation(WSD)相等价的问题.文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论.提出了根据它们的分布"分而治之”的策略,继而根据实验确定了与特征矩阵相关联的上下文窗口大小、窗口位置区分、权值估计等要素,并且针对数据稀疏问题,利用词的语义代码信息对特征矩阵进行了降维处理,取得了较好的效果.笔者相信,这个模型对组合型歧义切分字段的排歧具有一般性.
組閤型歧義切分字段一直是漢語自動分詞研究中的一箇難點.該文將之視為與Word Sense Disambiguation(WSD)相等價的問題.文章藉鑒瞭WSD研究中廣汎使用的嚮量空間法,選取瞭20箇典型的組閤型歧義進行瞭詳儘討論.提齣瞭根據它們的分佈"分而治之”的策略,繼而根據實驗確定瞭與特徵矩陣相關聯的上下文窗口大小、窗口位置區分、權值估計等要素,併且針對數據稀疏問題,利用詞的語義代碼信息對特徵矩陣進行瞭降維處理,取得瞭較好的效果.筆者相信,這箇模型對組閤型歧義切分字段的排歧具有一般性.
조합형기의절분자단일직시한어자동분사연구중적일개난점.해문장지시위여Word Sense Disambiguation(WSD)상등개적문제.문장차감료WSD연구중엄범사용적향량공간법,선취료20개전형적조합형기의진행료상진토론.제출료근거타문적분포"분이치지”적책략,계이근거실험학정료여특정구진상관련적상하문창구대소、창구위치구분、권치고계등요소,병차침대수거희소문제,이용사적어의대마신식대특정구진진행료강유처리,취득료교호적효과.필자상신,저개모형대조합형기의절분자단적배기구유일반성.