计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
10期
164-166,178
,共4页
苏丹%周明全%王学松%任玉芝
囌丹%週明全%王學鬆%任玉芝
소단%주명전%왕학송%임옥지
特征提取%特征分布%类间集中度%类内离散度%文档-最少出现文档频率(TF-LDF)
特徵提取%特徵分佈%類間集中度%類內離散度%文檔-最少齣現文檔頻率(TF-LDF)
특정제취%특정분포%류간집중도%류내리산도%문당-최소출현문당빈솔(TF-LDF)
传统特征提取改进方法在特征分布信息的量化方面存在不足,很大程度上影响了其分类效能.针对这一问题,提出一种基于最少出现文档频的特征提取改进方法,即TF-LDF算法.该算法用最少出现文档频来量化特征类间集中度与类内离散度,能够更加准确地反映特征分布情况.通过实验结果比较,可以证明TF-LDF算法分类效果更佳.
傳統特徵提取改進方法在特徵分佈信息的量化方麵存在不足,很大程度上影響瞭其分類效能.針對這一問題,提齣一種基于最少齣現文檔頻的特徵提取改進方法,即TF-LDF算法.該算法用最少齣現文檔頻來量化特徵類間集中度與類內離散度,能夠更加準確地反映特徵分佈情況.通過實驗結果比較,可以證明TF-LDF算法分類效果更佳.
전통특정제취개진방법재특정분포신식적양화방면존재불족,흔대정도상영향료기분류효능.침대저일문제,제출일충기우최소출현문당빈적특정제취개진방법,즉TF-LDF산법.해산법용최소출현문당빈래양화특정류간집중도여류내리산도,능구경가준학지반영특정분포정황.통과실험결과비교,가이증명TF-LDF산법분류효과경가.