吉林大学学报(工学版)
吉林大學學報(工學版)
길림대학학보(공학판)
JOURNAL OF JILIN UNIVERSITY(ENGINEERING AND TECHNOLOGY EDITION)
2008年
1期
142-147
,共6页
余正涛%毛存礼%邓锦辉%章程%郭剑毅
餘正濤%毛存禮%鄧錦輝%章程%郭劍毅
여정도%모존례%산금휘%장정%곽검의
计算机软件%问答系统%答案抽取%模式学习%模式匹配
計算機軟件%問答繫統%答案抽取%模式學習%模式匹配
계산궤연건%문답계통%답안추취%모식학습%모식필배
答案抽取是中文问答系统的关键,而通常答案是借助于问题的答案句子模式抽取得到,由于答案句子模式是语言专家根据语言规则提炼获得,因此非常依赖于专家经验.针对这一局限性,提出了一种利用模式学习来获得中文答案句子模式的方法,该方法利用搜索引擎从互连网上检索相关问题文本,人工提取包含答案的句子段,并标注问题类型及答案,形成各种问题类型的问答训练语料.通过统计学习,提取候选答案句子模式,计算候选句子模式权重,并根据权重获得相应问题类型的答案句子模式.基于事实的问题答案抽取结果表明,提出的基于模式学习的方法有很好的效果,实验答案提取准确率值达到了0.28,学习方法获得的模式基本上覆盖了常规答案句子模式.
答案抽取是中文問答繫統的關鍵,而通常答案是藉助于問題的答案句子模式抽取得到,由于答案句子模式是語言專傢根據語言規則提煉穫得,因此非常依賴于專傢經驗.針對這一跼限性,提齣瞭一種利用模式學習來穫得中文答案句子模式的方法,該方法利用搜索引擎從互連網上檢索相關問題文本,人工提取包含答案的句子段,併標註問題類型及答案,形成各種問題類型的問答訓練語料.通過統計學習,提取候選答案句子模式,計算候選句子模式權重,併根據權重穫得相應問題類型的答案句子模式.基于事實的問題答案抽取結果錶明,提齣的基于模式學習的方法有很好的效果,實驗答案提取準確率值達到瞭0.28,學習方法穫得的模式基本上覆蓋瞭常規答案句子模式.
답안추취시중문문답계통적관건,이통상답안시차조우문제적답안구자모식추취득도,유우답안구자모식시어언전가근거어언규칙제련획득,인차비상의뢰우전가경험.침대저일국한성,제출료일충이용모식학습래획득중문답안구자모식적방법,해방법이용수색인경종호련망상검색상관문제문본,인공제취포함답안적구자단,병표주문제류형급답안,형성각충문제류형적문답훈련어료.통과통계학습,제취후선답안구자모식,계산후선구자모식권중,병근거권중획득상응문제류형적답안구자모식.기우사실적문제답안추취결과표명,제출적기우모식학습적방법유흔호적효과,실험답안제취준학솔치체도료0.28,학습방법획득적모식기본상복개료상규답안구자모식.