北京理工大学学报
北京理工大學學報
북경리공대학학보
JOURNAL OF BEIJING INSTITUTE OF TECHNOLOGY
2012年
6期
590-595
,共6页
杨思春%高超%戴新宇%陈家骏%杨思国
楊思春%高超%戴新宇%陳傢駿%楊思國
양사춘%고초%대신우%진가준%양사국
问答系统%问句分类%特征提取%词袋绑定
問答繫統%問句分類%特徵提取%詞袋綁定
문답계통%문구분류%특정제취%사대방정
针对中文问句分类缺乏丰富的句法语义特征,提出一种基于词袋绑定的问句新特征自动生成方法.在词袋(BOW)、词性(POS)和词义(WS)等基本特征的基础上,通过将词性、词义等与词袋分别进行绑定,自动获取一类新的问句特征即词袋绑定特征.采用SVM分类器在哈工大中文问句集上实验,结果表明与原来单个的POS、WS等基本特征相比,对应的W/POS、W/WS等词袋绑定特征在分类精度上均获得了显著的提升;而且对这些词袋绑定特征进行启发式组合以后,在77个小类问题类别的总体分类精度达到82.333%,取得了较好的分类效果.说明在基本特征基础上借助词袋绑定操作进一步构造问句新特征的方法简单而有效.
針對中文問句分類缺乏豐富的句法語義特徵,提齣一種基于詞袋綁定的問句新特徵自動生成方法.在詞袋(BOW)、詞性(POS)和詞義(WS)等基本特徵的基礎上,通過將詞性、詞義等與詞袋分彆進行綁定,自動穫取一類新的問句特徵即詞袋綁定特徵.採用SVM分類器在哈工大中文問句集上實驗,結果錶明與原來單箇的POS、WS等基本特徵相比,對應的W/POS、W/WS等詞袋綁定特徵在分類精度上均穫得瞭顯著的提升;而且對這些詞袋綁定特徵進行啟髮式組閤以後,在77箇小類問題類彆的總體分類精度達到82.333%,取得瞭較好的分類效果.說明在基本特徵基礎上藉助詞袋綁定操作進一步構造問句新特徵的方法簡單而有效.
침대중문문구분류결핍봉부적구법어의특정,제출일충기우사대방정적문구신특정자동생성방법.재사대(BOW)、사성(POS)화사의(WS)등기본특정적기출상,통과장사성、사의등여사대분별진행방정,자동획취일류신적문구특정즉사대방정특정.채용SVM분류기재합공대중문문구집상실험,결과표명여원래단개적POS、WS등기본특정상비,대응적W/POS、W/WS등사대방정특정재분류정도상균획득료현저적제승;이차대저사사대방정특정진행계발식조합이후,재77개소류문제유별적총체분류정도체도82.333%,취득료교호적분류효과.설명재기본특정기출상차조사대방정조작진일보구조문구신특정적방법간단이유효.