计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
12期
2612-2620
,共9页
侯永帅%张耀允%王晓龙%陈清财%王宇亮%户保田
侯永帥%張耀允%王曉龍%陳清財%王宇亮%戶保田
후영수%장요윤%왕효룡%진청재%왕우량%호보전
时间敏感问句%时间解析%问句分类%问句检索%问答系统
時間敏感問句%時間解析%問句分類%問句檢索%問答繫統
시간민감문구%시간해석%문구분류%문구검색%문답계통
time-sensitive question%time resolving%question classification%question retrieval%question answering system
当前问答系统如“百度知道”、“SoSo问问”等在问句检索时没有考虑时效性要求,对时间敏感问句不能返回满足时效要求的结果.针对该问题,设计了时间敏感问句的识别和检索方法:首先依据时效要求对问句进行分类,识别出时间敏感问句,然后解析时间敏感问句的时效区间,最后根据解析结果对问句检索结果进行过滤,得到满足时效要求的结果.问句分类采用词法、句法和语义等特征,使用决策树、朴素贝叶斯、SVM等机器学习方法进行测试.问句的时效区间使用构造的时间域表达式计算获得.实验表明,使用C5.0决策树进行时间敏感问句的识别准确率达到0.901;与未考虑时间敏感问题的系统相比,时间敏感问句检索结果平均精度得到较大改善.
噹前問答繫統如“百度知道”、“SoSo問問”等在問句檢索時沒有攷慮時效性要求,對時間敏感問句不能返迴滿足時效要求的結果.針對該問題,設計瞭時間敏感問句的識彆和檢索方法:首先依據時效要求對問句進行分類,識彆齣時間敏感問句,然後解析時間敏感問句的時效區間,最後根據解析結果對問句檢索結果進行過濾,得到滿足時效要求的結果.問句分類採用詞法、句法和語義等特徵,使用決策樹、樸素貝葉斯、SVM等機器學習方法進行測試.問句的時效區間使用構造的時間域錶達式計算穫得.實驗錶明,使用C5.0決策樹進行時間敏感問句的識彆準確率達到0.901;與未攷慮時間敏感問題的繫統相比,時間敏感問句檢索結果平均精度得到較大改善.
당전문답계통여“백도지도”、“SoSo문문”등재문구검색시몰유고필시효성요구,대시간민감문구불능반회만족시효요구적결과.침대해문제,설계료시간민감문구적식별화검색방법:수선의거시효요구대문구진행분류,식별출시간민감문구,연후해석시간민감문구적시효구간,최후근거해석결과대문구검색결과진행과려,득도만족시효요구적결과.문구분류채용사법、구법화어의등특정,사용결책수、박소패협사、SVM등궤기학습방법진행측시.문구적시효구간사용구조적시간역표체식계산획득.실험표명,사용C5.0결책수진행시간민감문구적식별준학솔체도0.901;여미고필시간민감문제적계통상비,시간민감문구검색결과평균정도득도교대개선.