信息工程大学学报
信息工程大學學報
신식공정대학학보
JOURNAL OF INFORMATION ENGINEERING UNIVERSITY
2012年
5期
593-600
,共8页
韩永峰%郭志刚%陈翰%许旭阳
韓永峰%郭誌剛%陳翰%許旭暘
한영봉%곽지강%진한%허욱양
突发事件%领域特征词%层次文本分类%SVM
突髮事件%領域特徵詞%層次文本分類%SVM
돌발사건%영역특정사%층차문본분류%SVM
突发事件类别众多,若采用传统的平面文本分类方法对突发事件分类,模型训练所需计算量剧增,并且对测试文本分类时要和全部分类器进行比较,导致极大的时间开销.根据突发事件类别体系结构层次性特点,提出了一种基于领域特征词的突发事件层次分类方法,将领域特征词自动提取算法用于特征选择,并在每个分类平面上采用改进的基于二叉树的SVM多类分类算法构建分类器.实验证明,基于领域特征词提取算法的特征选择方法优于传统方法,采用层次分类方法对突发事件分类,降低了时间复杂度,同时改善了分类效果,有效降低了错误分类的风险.
突髮事件類彆衆多,若採用傳統的平麵文本分類方法對突髮事件分類,模型訓練所需計算量劇增,併且對測試文本分類時要和全部分類器進行比較,導緻極大的時間開銷.根據突髮事件類彆體繫結構層次性特點,提齣瞭一種基于領域特徵詞的突髮事件層次分類方法,將領域特徵詞自動提取算法用于特徵選擇,併在每箇分類平麵上採用改進的基于二扠樹的SVM多類分類算法構建分類器.實驗證明,基于領域特徵詞提取算法的特徵選擇方法優于傳統方法,採用層次分類方法對突髮事件分類,降低瞭時間複雜度,同時改善瞭分類效果,有效降低瞭錯誤分類的風險.
돌발사건유별음다,약채용전통적평면문본분류방법대돌발사건분류,모형훈련소수계산량극증,병차대측시문본분류시요화전부분류기진행비교,도치겁대적시간개소.근거돌발사건유별체계결구층차성특점,제출료일충기우영역특정사적돌발사건층차분류방법,장영역특정사자동제취산법용우특정선택,병재매개분류평면상채용개진적기우이차수적SVM다류분류산법구건분류기.실험증명,기우영역특정사제취산법적특정선택방법우우전통방법,채용층차분류방법대돌발사건분류,강저료시간복잡도,동시개선료분류효과,유효강저료착오분류적풍험.