软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2009年
9期
2387-2396
,共10页
张明卫%刘莹%张斌%朱志良
張明衛%劉瑩%張斌%硃誌良
장명위%류형%장빈%주지량
数据挖掘%聚类%概念%概念元组%模型
數據挖掘%聚類%概唸%概唸元組%模型
수거알굴%취류%개념%개념원조%모형
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效.
在數據挖掘研究領域,現有的大多數聚類算法都受到數據可伸縮性和結果可解釋性的限製.為瞭解決這一難題,提齣瞭一種基于概唸的數據聚類模型.該模型從描述數據樣本的數據本身齣髮,首先在預處理後的數據集上提取基本概唸,再對這些概唸進行概化,形成錶示聚類結果的高層概唸,最後基于這些高層概唸進行樣本劃分,從而完成整箇聚類過程.該模型能夠在保證聚類準確性的基礎上,很大程度地減少要處理的數據量,提高原算法的可伸縮性.另外,該模型基于概唸進行知識的髮現與分析,能夠提高聚類結果的可解釋性,便于與用戶交互.實驗結果錶明,該模型對于聚類結果較好且複雜度較高的算法尤為有效.
재수거알굴연구영역,현유적대다수취류산법도수도수거가신축성화결과가해석성적한제.위료해결저일난제,제출료일충기우개념적수거취류모형.해모형종묘술수거양본적수거본신출발,수선재예처리후적수거집상제취기본개념,재대저사개념진행개화,형성표시취류결과적고층개념,최후기우저사고층개념진행양본화분,종이완성정개취류과정.해모형능구재보증취류준학성적기출상,흔대정도지감소요처리적수거량,제고원산법적가신축성.령외,해모형기우개념진행지식적발현여분석,능구제고취류결과적가해석성,편우여용호교호.실험결과표명,해모형대우취류결과교호차복잡도교고적산법우위유효.