辽宁工程技术大学学报(自然科学版)
遼寧工程技術大學學報(自然科學版)
료녕공정기술대학학보(자연과학판)
JOURNAL OF LIAONING TECHNICAL UNIVERSITY(NATURAL SCIENCE)
2005年
z2期
150-152
,共3页
王波%钱晓棠%张斌%张明卫
王波%錢曉棠%張斌%張明衛
왕파%전효당%장빈%장명위
聚类%频繁集%相似度矩阵%邻居%连接
聚類%頻繁集%相似度矩陣%鄰居%連接
취류%빈번집%상사도구진%린거%련접
针对大型事务数据库中频繁集的多属性聚类问题,提出一种高效的频繁集聚类算法.以往聚类算法采用基于距离的计算方法,由于受到属性数据的制约,在频繁集挖掘中具有一定的限制.在属性聚类基础上,基于连接对频繁集进行聚类.在算法中先找出数据点的邻居和计算相似度,构造邻居矩阵;然后计算连接数目,确定邻居数目矩阵;最后通过设置判定函数和阈值确定聚类数.通过实验证明,算法能够不仅能有效地完成频繁集的多属性聚类问题,而且还可以进一步发现频繁集在某一层次的相关性.
針對大型事務數據庫中頻繁集的多屬性聚類問題,提齣一種高效的頻繁集聚類算法.以往聚類算法採用基于距離的計算方法,由于受到屬性數據的製約,在頻繁集挖掘中具有一定的限製.在屬性聚類基礎上,基于連接對頻繁集進行聚類.在算法中先找齣數據點的鄰居和計算相似度,構造鄰居矩陣;然後計算連接數目,確定鄰居數目矩陣;最後通過設置判定函數和閾值確定聚類數.通過實驗證明,算法能夠不僅能有效地完成頻繁集的多屬性聚類問題,而且還可以進一步髮現頻繁集在某一層次的相關性.
침대대형사무수거고중빈번집적다속성취류문제,제출일충고효적빈번집취류산법.이왕취류산법채용기우거리적계산방법,유우수도속성수거적제약,재빈번집알굴중구유일정적한제.재속성취류기출상,기우련접대빈번집진행취류.재산법중선조출수거점적린거화계산상사도,구조린거구진;연후계산련접수목,학정린거수목구진;최후통과설치판정함수화역치학정취류수.통과실험증명,산법능구불부능유효지완성빈번집적다속성취류문제,이차환가이진일보발현빈번집재모일층차적상관성.