计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
2期
17-20
,共4页
TFIDF%文本分类%特征加权%向量空间模型
TFIDF%文本分類%特徵加權%嚮量空間模型
TFIDF%문본분류%특정가권%향량공간모형
针对传统TFIDF方法将文档集作为整体来处理,并没有考虑到特征项在类间和类内的分布情况的不足,提出一种结合信息熵的TFIDF改进方法.该方法采用结合特征项在类间和类内信息分布熵来调整TFIDF特征项的权重计算,避免了那些对分类没有贡献的特征项被赋予较大权值的缺陷,能更有效计算文本特征项的权重.实验结果表明该方法提高了文本分类的精确度和召回率,是一种比较有效的文本特征加权方法.
針對傳統TFIDF方法將文檔集作為整體來處理,併沒有攷慮到特徵項在類間和類內的分佈情況的不足,提齣一種結閤信息熵的TFIDF改進方法.該方法採用結閤特徵項在類間和類內信息分佈熵來調整TFIDF特徵項的權重計算,避免瞭那些對分類沒有貢獻的特徵項被賦予較大權值的缺陷,能更有效計算文本特徵項的權重.實驗結果錶明該方法提高瞭文本分類的精確度和召迴率,是一種比較有效的文本特徵加權方法.
침대전통TFIDF방법장문당집작위정체래처리,병몰유고필도특정항재류간화류내적분포정황적불족,제출일충결합신식적적TFIDF개진방법.해방법채용결합특정항재류간화류내신식분포적래조정TFIDF특정항적권중계산,피면료나사대분류몰유공헌적특정항피부여교대권치적결함,능경유효계산문본특정항적권중.실험결과표명해방법제고료문본분류적정학도화소회솔,시일충비교유효적문본특정가권방법.