计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2008年
4期
662-676
,共15页
胡宝顺%王大玲%于戈%马婷
鬍寶順%王大玲%于戈%馬婷
호보순%왕대령%우과%마정
句法依存分析%分类%答案提取%中文问答系统%事实性问题
句法依存分析%分類%答案提取%中文問答繫統%事實性問題
구법의존분석%분류%답안제취%중문문답계통%사실성문제
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.
由于中文自然語言處理的特點和睏難以及相應的語言處理基礎資源的相對缺乏,使得國外一些成熟技術和研究成果不能直接應用到中文問答繫統中.為此,針對中文事實型問答繫統,提齣一種新的基于句法結構特徵分析及分類技術的答案提取算法,該方法將答案提取問題看成是候選答案的分類問題,即將候選答案分類為正確和錯誤兩類.首先,該方法根據與問題類型所對應的候選答案的類型信息,從文本片斷中提取齣候選答案及其在句子中的簡單特徵和句法結構特徵;然後利用這些特徵訓練分類器;最後用訓練得到的分類器判彆候選答案是否為正確答案.針對中文事實性問題,該方法與目前典型的基于模式匹配的中文答案提取算法相比,準確率提升6.2%,MRR提升9.7%.
유우중문자연어언처리적특점화곤난이급상응적어언처리기출자원적상대결핍,사득국외일사성숙기술화연구성과불능직접응용도중문문답계통중.위차,침대중문사실형문답계통,제출일충신적기우구법결구특정분석급분류기술적답안제취산법,해방법장답안제취문제간성시후선답안적분류문제,즉장후선답안분류위정학화착오량류.수선,해방법근거여문제류형소대응적후선답안적류형신식,종문본편단중제취출후선답안급기재구자중적간단특정화구법결구특정;연후이용저사특정훈련분류기;최후용훈련득도적분류기판별후선답안시부위정학답안.침대중문사실성문제,해방법여목전전형적기우모식필배적중문답안제취산법상비,준학솔제승6.2%,MRR제승9.7%.