情报学报
情報學報
정보학보
2012年
12期
1265-1270
,共6页
词语相关度计算%维基百科%分类图%语义向量
詞語相關度計算%維基百科%分類圖%語義嚮量
사어상관도계산%유기백과%분류도%어의향량
词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用.国内现有大部分词语相关度计算方法是基于知网(HowNet)的.本文将中文维基百科作为语义资源,利用其分类层次、概念文档之间的链接来计算汉语词语之间的相关度.在借鉴向量空间模型和谷歌相似度(Google Similarity Distance)计算方法基础上,通过构建分类图和相关语义向量来实现汉语词语相关度的计算.在测试集WordSimilarity-353上进行了实验,实验结果的斯皮尔曼等级相关系数显示,本文的方法是可行和有效的.
詞語相關度的計算是自然語言處理關鍵技術之一,在信息檢索、機器翻譯、詞義消歧、句法分析等領域有廣汎應用.國內現有大部分詞語相關度計算方法是基于知網(HowNet)的.本文將中文維基百科作為語義資源,利用其分類層次、概唸文檔之間的鏈接來計算漢語詞語之間的相關度.在藉鑒嚮量空間模型和穀歌相似度(Google Similarity Distance)計算方法基礎上,通過構建分類圖和相關語義嚮量來實現漢語詞語相關度的計算.在測試集WordSimilarity-353上進行瞭實驗,實驗結果的斯皮爾曼等級相關繫數顯示,本文的方法是可行和有效的.
사어상관도적계산시자연어언처리관건기술지일,재신식검색、궤기번역、사의소기、구법분석등영역유엄범응용.국내현유대부분사어상관도계산방법시기우지망(HowNet)적.본문장중문유기백과작위어의자원,이용기분류층차、개념문당지간적련접래계산한어사어지간적상관도.재차감향량공간모형화곡가상사도(Google Similarity Distance)계산방법기출상,통과구건분류도화상관어의향량래실현한어사어상관도적계산.재측시집WordSimilarity-353상진행료실험,실험결과적사피이만등급상관계수현시,본문적방법시가행화유효적.