计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
9期
161-163,248
,共4页
问句相似度%语义相似度%常见问题集%向量空间模型
問句相似度%語義相似度%常見問題集%嚮量空間模型
문구상사도%어의상사도%상견문제집%향량공간모형
常见问题(FAQ)问答系统是一种在已有的"问题-答案"对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统.其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案.通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于<HIT-IRLab同义词词林(扩展版)>的语义相似度,通过线性加权就可以得出两个问句的语义相似度.试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度.
常見問題(FAQ)問答繫統是一種在已有的"問題-答案"對集閤中找到與用戶提問相匹配的問句,併將其對應的答案返迴給用戶的問答式檢索繫統.其關鍵問題是用戶提齣問句與FAQ庫中問句進行相似度計算,找齣FAQ庫中最相近的問句,併返迴事先存儲好的問題答案.通過對常見問句特點的研究,給齣一種基于分解的嚮量空間模型和語義概唸的問句相似度計算方法,其主要思想是對一箇問句嚮量進行分解,提取其三箇關鍵部分:問點、主題詞和疑問詞,錶示成三箇分嚮量,然後對每箇分嚮量計算基于<HIT-IRLab同義詞詞林(擴展版)>的語義相似度,通過線性加權就可以得齣兩箇問句的語義相似度.試驗錶明,與傳統的基于嚮量空間模型的TF-DF問句相似度計算方法相比,可以提高問句匹配的精度.
상견문제(FAQ)문답계통시일충재이유적"문제-답안"대집합중조도여용호제문상필배적문구,병장기대응적답안반회급용호적문답식검색계통.기관건문제시용호제출문구여FAQ고중문구진행상사도계산,조출FAQ고중최상근적문구,병반회사선존저호적문제답안.통과대상견문구특점적연구,급출일충기우분해적향량공간모형화어의개념적문구상사도계산방법,기주요사상시대일개문구향량진행분해,제취기삼개관건부분:문점、주제사화의문사,표시성삼개분향량,연후대매개분향량계산기우<HIT-IRLab동의사사림(확전판)>적어의상사도,통과선성가권취가이득출량개문구적어의상사도.시험표명,여전통적기우향량공간모형적TF-DF문구상사도계산방법상비,가이제고문구필배적정도.