小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2011年
11期
2237-2242
,共6页
汪祥%贾焰%周斌%丁兆云%梁政
汪祥%賈燄%週斌%丁兆雲%樑政
왕상%가염%주빈%정조운%량정
语义相关度%语义相关性%语义相似性%维基百科
語義相關度%語義相關性%語義相似性%維基百科
어의상관도%어의상관성%어의상사성%유기백과
自然语言词汇的语义相关度的计算需要获取大量的背景知识,而维基百科是当前规模最大的百科全书,其不仅是一个规模巨大的语料库,而且还是一个包含了大量人类背景知识和语义关系的知识库,研究表明,其是进行语义计算的理想资源,本文提出了一种将维基百科的链接结构和分类体系相结合计算中文词汇语义相关度的算法,算法只利用了维基百科的链接结构和分类体系,无需进行复杂的文本处理,计算所需的开销较小.在多个人工评测的数据集上的实验结果显示,获得了比单独使用链接结构或分类体系的算法更好的效果,在最好的情况下,Spearman相关系数提高了30.96%.
自然語言詞彙的語義相關度的計算需要穫取大量的揹景知識,而維基百科是噹前規模最大的百科全書,其不僅是一箇規模巨大的語料庫,而且還是一箇包含瞭大量人類揹景知識和語義關繫的知識庫,研究錶明,其是進行語義計算的理想資源,本文提齣瞭一種將維基百科的鏈接結構和分類體繫相結閤計算中文詞彙語義相關度的算法,算法隻利用瞭維基百科的鏈接結構和分類體繫,無需進行複雜的文本處理,計算所需的開銷較小.在多箇人工評測的數據集上的實驗結果顯示,穫得瞭比單獨使用鏈接結構或分類體繫的算法更好的效果,在最好的情況下,Spearman相關繫數提高瞭30.96%.
자연어언사회적어의상관도적계산수요획취대량적배경지식,이유기백과시당전규모최대적백과전서,기불부시일개규모거대적어료고,이차환시일개포함료대량인류배경지식화어의관계적지식고,연구표명,기시진행어의계산적이상자원,본문제출료일충장유기백과적련접결구화분류체계상결합계산중문사회어의상관도적산법,산법지이용료유기백과적련접결구화분류체계,무수진행복잡적문본처리,계산소수적개소교소.재다개인공평측적수거집상적실험결과현시,획득료비단독사용련접결구혹분류체계적산법경호적효과,재최호적정황하,Spearman상관계수제고료30.96%.