河南师范大学学报(自然科学版)
河南師範大學學報(自然科學版)
하남사범대학학보(자연과학판)
JOURNAL OF HENAN NORMAL UNIVERSITY(NATURAL SCIENCE)
2009年
4期
42-44
,共3页
数据挖掘%聚类%层次距离%网格聚类
數據挖掘%聚類%層次距離%網格聚類
수거알굴%취류%층차거리%망격취류
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.
傳統的凝聚層次聚類算法的時間複雜度為O(n3),由于時間複雜度太高而無法應用到大的數據集.針對這一問題,提齣瞭一種新的基于網格的層次聚類算法,先用基于網格的方法進行一次微聚類,然後再用凝聚的層次聚類算法進行聚類.在進行凝聚的層次聚類時,提齣瞭一種新的簇間距離度量方法,該方法採用簇中權值最高的代錶點的最小距離作為簇間的距離.理論分析和實驗結果錶明,基于網格的層次聚類算法比傳統的凝聚層次算法具有更高的效率和正確性.
전통적응취층차취류산법적시간복잡도위O(n3),유우시간복잡도태고이무법응용도대적수거집.침대저일문제,제출료일충신적기우망격적층차취류산법,선용기우망격적방법진행일차미취류,연후재용응취적층차취류산법진행취류.재진행응취적층차취류시,제출료일충신적족간거리도량방법,해방법채용족중권치최고적대표점적최소거리작위족간적거리.이론분석화실험결과표명,기우망격적층차취류산법비전통적응취층차산법구유경고적효솔화정학성.