中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2007年
1期
90-95
,共6页
孙景广%蔡东风%吕德新%董燕举
孫景廣%蔡東風%呂德新%董燕舉
손경엄%채동풍%려덕신%동연거
计算机应用%中文信息处理%问答系统%问题分类%知网%最大熵模型%分类特征
計算機應用%中文信息處理%問答繫統%問題分類%知網%最大熵模型%分類特徵
계산궤응용%중문신식처리%문답계통%문제분류%지망%최대적모형%분류특정
问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题.问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行.本文提出了一种使用知网作为语义资源选取分类特征,并使用最大熵模型进行分类的新方法.该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征.实验结果表明,在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征.该方法能显著地提高问题分类的精度,大类和小类的分类精度分别达到了92.18%和83.86%.
問答繫統應能用準確、簡潔的答案迴答用戶用自然語言提齣的問題.問題分類是問答繫統所要處理的第一步,分類結果的正確率直接影響後續工作的進行.本文提齣瞭一種使用知網作為語義資源選取分類特徵,併使用最大熵模型進行分類的新方法.該方法以問題的疑問詞、句法結構、疑問意嚮詞、疑問意嚮詞在知網中的首義原作為分類特徵.實驗結果錶明,在知網中選取的首義原能很好的錶達問題焦點詞的語義信息,可作為問題分類的一箇主要特徵.該方法能顯著地提高問題分類的精度,大類和小類的分類精度分彆達到瞭92.18%和83.86%.
문답계통응능용준학、간길적답안회답용호용자연어언제출적문제.문제분류시문답계통소요처리적제일보,분류결과적정학솔직접영향후속공작적진행.본문제출료일충사용지망작위어의자원선취분류특정,병사용최대적모형진행분류적신방법.해방법이문제적의문사、구법결구、의문의향사、의문의향사재지망중적수의원작위분류특정.실험결과표명,재지망중선취적수의원능흔호적표체문제초점사적어의신식,가작위문제분류적일개주요특정.해방법능현저지제고문제분류적정도,대류화소류적분류정도분별체도료92.18%화83.86%.