计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2008年
11期
3256-3258
,共3页
文本相似度%特征选择%词频-逆文档频率法%向量空间模型
文本相似度%特徵選擇%詞頻-逆文檔頻率法%嚮量空間模型
문본상사도%특정선택%사빈-역문당빈솔법%향량공간모형
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果.提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加
文本相似度的計算作為其他文本信息處理的基礎和關鍵,其計算準確率和效率直接影響其他文本信息處理的結果.提齣改進的DF算法和TD-IDF算法,一方麵利用瞭DF算法具有線性的時間複雜度,比較適閤大規模文本處理的特點,併通過適噹增加
문본상사도적계산작위기타문본신식처리적기출화관건,기계산준학솔화효솔직접영향기타문본신식처리적결과.제출개진적DF산법화TD-IDF산법,일방면이용료DF산법구유선성적시간복잡도,비교괄합대규모문본처리적특점,병통과괄당증가