绵阳师范学院学报
綿暘師範學院學報
면양사범학원학보
JOURNAL OF MIANYANG NORMAL UNIVERSITY
2010年
8期
106-109
,共4页
网页分类%tf-idf%特征权重
網頁分類%tf-idf%特徵權重
망혈분류%tf-idf%특정권중
TF-IDF是文档特征权重表示常用方法,但不能真正地反映特征词对区分每个类的贡献.故针对网页分类中特征选择方法存在的问题,加入网页标签特征权重改进TF-IDF公式,提出了一种比较有效的网页分类算法,实验结果表明该方法具有较好的特征选择效果,能够有效地提高分类精度.
TF-IDF是文檔特徵權重錶示常用方法,但不能真正地反映特徵詞對區分每箇類的貢獻.故針對網頁分類中特徵選擇方法存在的問題,加入網頁標籤特徵權重改進TF-IDF公式,提齣瞭一種比較有效的網頁分類算法,實驗結果錶明該方法具有較好的特徵選擇效果,能夠有效地提高分類精度.
TF-IDF시문당특정권중표시상용방법,단불능진정지반영특정사대구분매개류적공헌.고침대망혈분류중특정선택방법존재적문제,가입망혈표첨특정권중개진TF-IDF공식,제출료일충비교유효적망혈분류산법,실험결과표명해방법구유교호적특정선택효과,능구유효지제고분류정도.