计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2006年
10期
1889-1893
,共5页
余正涛%樊孝忠%郭剑毅%耿增民
餘正濤%樊孝忠%郭劍毅%耿增民
여정도%번효충%곽검의%경증민
问答系统%答案提取%相似度%向量空间模型%潜在语义分析
問答繫統%答案提取%相似度%嚮量空間模型%潛在語義分析
문답계통%답안제취%상사도%향량공간모형%잠재어의분석
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的"漏提"或"错提"等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
為瞭解決在漢語問答繫統答案提取時,由于詞的同義或多義現象而導緻的"漏提"或"錯提"等問題,提齣瞭一種基于潛在語義分析(LSA)的問題和答案句子相似度計算方法.它利用空間嚮量模型作為問題和句子的錶示方法,藉助于潛在語義分析理論,對大量問答作句子語料統計分析,構建瞭一箇潛在的詞-句子語義空間,從而消除瞭詞之間的相關性,併在語義空間上實現瞭問題與答案句子相似度計算,有效地解決瞭詞的同義和多義問題.最後結閤問題類型和相似度計算結果,對漢語基于事實的簡單陳述問題進行瞭答案句子提取實驗.答案提取的MRR值達到瞭0.47,明顯優于空間嚮量模型.結果說明該方法具有很好的效果.
위료해결재한어문답계통답안제취시,유우사적동의혹다의현상이도치적"루제"혹"착제"등문제,제출료일충기우잠재어의분석(LSA)적문제화답안구자상사도계산방법.타이용공간향량모형작위문제화구자적표시방법,차조우잠재어의분석이론,대대량문답작구자어료통계분석,구건료일개잠재적사-구자어의공간,종이소제료사지간적상관성,병재어의공간상실현료문제여답안구자상사도계산,유효지해결료사적동의화다의문제.최후결합문제류형화상사도계산결과,대한어기우사실적간단진술문제진행료답안구자제취실험.답안제취적MRR치체도료0.47,명현우우공간향량모형.결과설명해방법구유흔호적효과.