中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2005年
1期
36-41
,共6页
陈治纲%何丕廉%孙越恒%郑小慎
陳治綱%何丕廉%孫越恆%鄭小慎
진치강%하비렴%손월항%정소신
计算机应用%中文信息处理%文本分类%测试指标%特征抽取%二级分类模式
計算機應用%中文信息處理%文本分類%測試指標%特徵抽取%二級分類模式
계산궤응용%중문신식처리%문본분류%측시지표%특정추취%이급분류모식
文本分类是信息处理的一个重要的研究课题,它可以有效的解决信息杂乱的现象并有助于定位所需的信息.本文综合考虑了频度、分散度和集中度等几项测试指标,提出了一种新的特征抽取算法,克服了传统的从单一或片面的测试指标进行特征抽取所造成的特征"过度拟合"问题,并基于此实现了二级分类模式的文本分类系统.和类中心分类法相比,实验结果表明二级分类模式具有较高的精度和召回率.
文本分類是信息處理的一箇重要的研究課題,它可以有效的解決信息雜亂的現象併有助于定位所需的信息.本文綜閤攷慮瞭頻度、分散度和集中度等幾項測試指標,提齣瞭一種新的特徵抽取算法,剋服瞭傳統的從單一或片麵的測試指標進行特徵抽取所造成的特徵"過度擬閤"問題,併基于此實現瞭二級分類模式的文本分類繫統.和類中心分類法相比,實驗結果錶明二級分類模式具有較高的精度和召迴率.
문본분류시신식처리적일개중요적연구과제,타가이유효적해결신식잡란적현상병유조우정위소수적신식.본문종합고필료빈도、분산도화집중도등궤항측시지표,제출료일충신적특정추취산법,극복료전통적종단일혹편면적측시지표진행특정추취소조성적특정"과도의합"문제,병기우차실현료이급분류모식적문본분류계통.화류중심분류법상비,실험결과표명이급분류모식구유교고적정도화소회솔.