电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2010年
33期
9327-9329
,共3页
文本分类%向量空间模型%特征权重
文本分類%嚮量空間模型%特徵權重
문본분류%향량공간모형%특정권중
该文首先讨论了向量空间模型在文本分类中的应用,并且对传统特征权重算法TF-IDF进行了分析.在此基础上,针对TF-IDF只考虑词频因素和文档集因素的不足,结合类间分布信息与TF-IDF为特征项赋权.实验结果表明改进的权重算法提高了分类精度.
該文首先討論瞭嚮量空間模型在文本分類中的應用,併且對傳統特徵權重算法TF-IDF進行瞭分析.在此基礎上,針對TF-IDF隻攷慮詞頻因素和文檔集因素的不足,結閤類間分佈信息與TF-IDF為特徵項賦權.實驗結果錶明改進的權重算法提高瞭分類精度.
해문수선토론료향량공간모형재문본분류중적응용,병차대전통특정권중산법TF-IDF진행료분석.재차기출상,침대TF-IDF지고필사빈인소화문당집인소적불족,결합류간분포신식여TF-IDF위특정항부권.실험결과표명개진적권중산법제고료분류정도.