中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
5期
19-24
,共6页
计算机应用%中文信息处理%介词结构识别%支持向量机%语义类
計算機應用%中文信息處理%介詞結構識彆%支持嚮量機%語義類
계산궤응용%중문신식처리%개사결구식별%지지향량궤%어의류
介词结构在汉语文本中出现频率很高,正确识别介词结构边界对句法分析、语音合成中的韵律短语划分有着重要意义.该文较为系统地探讨了汉语中常用介词的边界识别问题.利用支持向量机SVM模型,基于输出概率而不是简单的二分法来选择正确的后边界.探讨了不同的特征选择,并尝试加入语义信息等不同特征组合以提高识别准确率.对常用的68个介词进行边界识别实验,5折交叉验证的准确率达到90.95%,优于前人的识别结果.
介詞結構在漢語文本中齣現頻率很高,正確識彆介詞結構邊界對句法分析、語音閤成中的韻律短語劃分有著重要意義.該文較為繫統地探討瞭漢語中常用介詞的邊界識彆問題.利用支持嚮量機SVM模型,基于輸齣概率而不是簡單的二分法來選擇正確的後邊界.探討瞭不同的特徵選擇,併嘗試加入語義信息等不同特徵組閤以提高識彆準確率.對常用的68箇介詞進行邊界識彆實驗,5摺交扠驗證的準確率達到90.95%,優于前人的識彆結果.
개사결구재한어문본중출현빈솔흔고,정학식별개사결구변계대구법분석、어음합성중적운률단어화분유착중요의의.해문교위계통지탐토료한어중상용개사적변계식별문제.이용지지향량궤SVM모형,기우수출개솔이불시간단적이분법래선택정학적후변계.탐토료불동적특정선택,병상시가입어의신식등불동특정조합이제고식별준학솔.대상용적68개개사진행변계식별실험,5절교차험증적준학솔체도90.95%,우우전인적식별결과.