江西师范大学学报(自然科学版)
江西師範大學學報(自然科學版)
강서사범대학학보(자연과학판)
JOURNAL OF JIANGXI NORMAL UNIVERSITY(NATURAL SCIENCES EDITION)
2014年
1期
95-101
,共7页
潘敏%王明文%王晓庆%揭安全
潘敏%王明文%王曉慶%揭安全
반민%왕명문%왕효경%게안전
增量聚类%文本聚类%中心矩%簇特征
增量聚類%文本聚類%中心矩%簇特徵
증량취류%문본취류%중심구%족특정
incremental clustering%text clustering%central moment%cluster features
提出了一种基于簇特征的文本增量聚类算法:充分利用简单、有效的k-means算法来进行初始聚类,并保留聚类后每个簇的簇中心、均值、方差、文档数、3阶中心矩和4阶中心矩作为该簇的簇特征,当出现新增数据时,利用初始簇的簇特征对新增数据进行聚类.在20newsgroups数据集上的实验结果表明:相比于对整个数据集进行重新聚类,该算法具有一定的优势.
提齣瞭一種基于簇特徵的文本增量聚類算法:充分利用簡單、有效的k-means算法來進行初始聚類,併保留聚類後每箇簇的簇中心、均值、方差、文檔數、3階中心矩和4階中心矩作為該簇的簇特徵,噹齣現新增數據時,利用初始簇的簇特徵對新增數據進行聚類.在20newsgroups數據集上的實驗結果錶明:相比于對整箇數據集進行重新聚類,該算法具有一定的優勢.
제출료일충기우족특정적문본증량취류산법:충분이용간단、유효적k-means산법래진행초시취류,병보류취류후매개족적족중심、균치、방차、문당수、3계중심구화4계중심구작위해족적족특정,당출현신증수거시,이용초시족적족특정대신증수거진행취류.재20newsgroups수거집상적실험결과표명:상비우대정개수거집진행중신취류,해산법구유일정적우세.