计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2015年
1期
82-85,92
,共5页
王荣波%谌志群%周建政%李治%高飞
王榮波%諶誌群%週建政%李治%高飛
왕영파%심지군%주건정%리치%고비
短文本%Wikipedia%相关度计算%自然语言处理
短文本%Wikipedia%相關度計算%自然語言處理
단문본%Wikipedia%상관도계산%자연어언처리
Short texts%Wikipedia%Relevance computation%Natural language processing
语义相关度计算是自然语言处理领域的研究热点.现有的以文本相似度计算代替文本相关度计算的方法存在不足之处.提出从语形相似性和组元相关性两个方面来综合度量短文本之间的语义相关性,并提出2个以Wikipedia作为外部知识库的短文本相关度计算算法:最大词语关联法和动态组块法.在一个网络短文本测试集上对算法进行测评.实验结果表明,该算法与典型相似度计算算法比较,在正确率方面提高了20%以上.
語義相關度計算是自然語言處理領域的研究熱點.現有的以文本相似度計算代替文本相關度計算的方法存在不足之處.提齣從語形相似性和組元相關性兩箇方麵來綜閤度量短文本之間的語義相關性,併提齣2箇以Wikipedia作為外部知識庫的短文本相關度計算算法:最大詞語關聯法和動態組塊法.在一箇網絡短文本測試集上對算法進行測評.實驗結果錶明,該算法與典型相似度計算算法比較,在正確率方麵提高瞭20%以上.
어의상관도계산시자연어언처리영역적연구열점.현유적이문본상사도계산대체문본상관도계산적방법존재불족지처.제출종어형상사성화조원상관성량개방면래종합도량단문본지간적어의상관성,병제출2개이Wikipedia작위외부지식고적단문본상관도계산산법:최대사어관련법화동태조괴법.재일개망락단문본측시집상대산법진행측평.실험결과표명,해산법여전형상사도계산산법비교,재정학솔방면제고료20%이상.