微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2011年
6期
211-213
,共3页
中文文本%特征项%x2统计量
中文文本%特徵項%x2統計量
중문문본%특정항%x2통계량
文本分类领域中,TF-IDF特征权重是一种常用的分类算法.本文介绍了TF-IDF特征权重算法,对于能够表征文本特征的文本特征词,常常按某一方法赋予相应的权重,表示它们对于区分文本类别的重要程度.但是在该算法中将训练集的文档看成一个整体来考虑,不能表示特征项与类别之间的关联特性.针对该弊端本文引进了x<'2>统计量函数计算权重.实验结果表明改进的TF-IDF权重算法是可行的,同时也比较好地提高了分类器的性能.
文本分類領域中,TF-IDF特徵權重是一種常用的分類算法.本文介紹瞭TF-IDF特徵權重算法,對于能夠錶徵文本特徵的文本特徵詞,常常按某一方法賦予相應的權重,錶示它們對于區分文本類彆的重要程度.但是在該算法中將訓練集的文檔看成一箇整體來攷慮,不能錶示特徵項與類彆之間的關聯特性.針對該弊耑本文引進瞭x<'2>統計量函數計算權重.實驗結果錶明改進的TF-IDF權重算法是可行的,同時也比較好地提高瞭分類器的性能.
문본분류영역중,TF-IDF특정권중시일충상용적분류산법.본문개소료TF-IDF특정권중산법,대우능구표정문본특정적문본특정사,상상안모일방법부여상응적권중,표시타문대우구분문본유별적중요정도.단시재해산법중장훈련집적문당간성일개정체래고필,불능표시특정항여유별지간적관련특성.침대해폐단본문인진료x<'2>통계량함수계산권중.실험결과표명개진적TF-IDF권중산법시가행적,동시야비교호지제고료분류기적성능.