中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2008年
1期
93-98
,共6页
李方涛%张显%孙建树%朱小燕
李方濤%張顯%孫建樹%硃小燕
리방도%장현%손건수%주소연
计算机应用%中文信息处理%问题分类%自动问答系统%问题词%中心词
計算機應用%中文信息處理%問題分類%自動問答繫統%問題詞%中心詞
계산궤응용%중문신식처리%문제분류%자동문답계통%문제사%중심사
问题分类是自动问答系统中关键技术之一,而问题中的关键词语是问题分类的重要依据.本文主要探讨问题词和中心词在问题分类中所起的作用,提出一种基于问题词和中心词的层次化结构问题分类器.分类器首先利用问题词将句子集分为三类,然后对于每个类别分别建立相应的分类器,对于what型问题,本文构造了基于关联规则的中心词分类器.本文实现的层次化结构分类器在TREC 2007 QA问题集和UIUC数据集上精度分别达到了90.6%和84.0%,充分显示了问题词和中心词在问题分类中至关重要的作用.
問題分類是自動問答繫統中關鍵技術之一,而問題中的關鍵詞語是問題分類的重要依據.本文主要探討問題詞和中心詞在問題分類中所起的作用,提齣一種基于問題詞和中心詞的層次化結構問題分類器.分類器首先利用問題詞將句子集分為三類,然後對于每箇類彆分彆建立相應的分類器,對于what型問題,本文構造瞭基于關聯規則的中心詞分類器.本文實現的層次化結構分類器在TREC 2007 QA問題集和UIUC數據集上精度分彆達到瞭90.6%和84.0%,充分顯示瞭問題詞和中心詞在問題分類中至關重要的作用.
문제분류시자동문답계통중관건기술지일,이문제중적관건사어시문제분류적중요의거.본문주요탐토문제사화중심사재문제분류중소기적작용,제출일충기우문제사화중심사적층차화결구문제분류기.분류기수선이용문제사장구자집분위삼류,연후대우매개유별분별건립상응적분류기,대우what형문제,본문구조료기우관련규칙적중심사분류기.본문실현적층차화결구분류기재TREC 2007 QA문제집화UIUC수거집상정도분별체도료90.6%화84.0%,충분현시료문제사화중심사재문제분류중지관중요적작용.