南京邮电大学学报(自然科学版)
南京郵電大學學報(自然科學版)
남경유전대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY OF POSTS AND TELECOMMUNICATIONS(NATURAL SCIENCE)
2013年
1期
79-83
,共5页
Web文本分类%句子包%向量空间模型%文本挖掘
Web文本分類%句子包%嚮量空間模型%文本挖掘
Web문본분류%구자포%향량공간모형%문본알굴
提出了改进的文本相似度计算方法,在计算文本的相似度时,赋予不同文本块中的句子不同的权值,同时直接去掉短句子和合并高相似度的句子以精简句子包中句子数量以提高运算速度.改进后的文本相似度计算方法为:先根据句子相似度的计算方法计算句子的相似度,再计算文本块的相似度,最后按照文本块的权值计算整个文本的相似度.经试验证明,改进后的算法在文本召回率、准确率和F1值上都有明显的提高.
提齣瞭改進的文本相似度計算方法,在計算文本的相似度時,賦予不同文本塊中的句子不同的權值,同時直接去掉短句子和閤併高相似度的句子以精簡句子包中句子數量以提高運算速度.改進後的文本相似度計算方法為:先根據句子相似度的計算方法計算句子的相似度,再計算文本塊的相似度,最後按照文本塊的權值計算整箇文本的相似度.經試驗證明,改進後的算法在文本召迴率、準確率和F1值上都有明顯的提高.
제출료개진적문본상사도계산방법,재계산문본적상사도시,부여불동문본괴중적구자불동적권치,동시직접거도단구자화합병고상사도적구자이정간구자포중구자수량이제고운산속도.개진후적문본상사도계산방법위:선근거구자상사도적계산방법계산구자적상사도,재계산문본괴적상사도,최후안조문본괴적권치계산정개문본적상사도.경시험증명,개진후적산법재문본소회솔、준학솔화F1치상도유명현적제고.