计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2004年
z1期
277-279
,共3页
陈治纲%何丕廉%孙越恒%郑小慎
陳治綱%何丕廉%孫越恆%鄭小慎
진치강%하비렴%손월항%정소신
文本分类%特征抽取%测试指标%向量空间模型
文本分類%特徵抽取%測試指標%嚮量空間模型
문본분류%특정추취%측시지표%향량공간모형
文本分类可以有效地解决信息杂乱的现象并有助于定位所需的信息.传统的文本分类方法一般从单一或片面的测试指标出发进行特征抽取,造成单个特征的"过度拟合"问题.文中综合考虑了频度、分散度和集中度等几项测试指标,提出了一种新的特征抽取算法,使得选出的特征能够在上述测试指标中达到整体最优.将这一方法应用于改进的向量空间模型,实验结果表明该方法具有较高的精度和召回率.
文本分類可以有效地解決信息雜亂的現象併有助于定位所需的信息.傳統的文本分類方法一般從單一或片麵的測試指標齣髮進行特徵抽取,造成單箇特徵的"過度擬閤"問題.文中綜閤攷慮瞭頻度、分散度和集中度等幾項測試指標,提齣瞭一種新的特徵抽取算法,使得選齣的特徵能夠在上述測試指標中達到整體最優.將這一方法應用于改進的嚮量空間模型,實驗結果錶明該方法具有較高的精度和召迴率.
문본분류가이유효지해결신식잡란적현상병유조우정위소수적신식.전통적문본분류방법일반종단일혹편면적측시지표출발진행특정추취,조성단개특정적"과도의합"문제.문중종합고필료빈도、분산도화집중도등궤항측시지표,제출료일충신적특정추취산법,사득선출적특정능구재상술측시지표중체도정체최우.장저일방법응용우개진적향량공간모형,실험결과표명해방법구유교고적정도화소회솔.