数学的实践与认识
數學的實踐與認識
수학적실천여인식
MATHEMATICS IN PRACTICE AND THEORY
2007年
8期
104-111
,共8页
刘婷%郭海湘%诸克军%高思维
劉婷%郭海湘%諸剋軍%高思維
류정%곽해상%제극군%고사유
聚类%k-means算法%遗传算法
聚類%k-means算法%遺傳算法
취류%k-means산법%유전산법
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.
在經典的k-means聚類算法中,聚類數k必鬚事先給定,然而在現實中k很難被精確的確定.本文提齣瞭一種改進的遺傳k-means聚類算法,併構造瞭一箇用來評價分類程度好壞的適應度函數,該適應度函數攷慮的是在提高緊湊度(類內距)和分離度(類間距)的同時使得分類箇數儘可能少.最後採用兩箇人工數據集和三箇UCI數據集對k-means聚類算法(KM),遺傳聚類算法(GA),遺傳k-means聚類算法(GKM)和改進的遺傳k-means聚類算法(IGKM)進行比較研究,比較的指標有類間距、類內距和分類正確率.研究證明改進的遺傳k-means算法能夠自動穫取最佳聚類數k併且保持較高的正確率.
재경전적k-means취류산법중,취류수k필수사선급정,연이재현실중k흔난피정학적학정.본문제출료일충개진적유전k-means취류산법,병구조료일개용래평개분류정도호배적괄응도함수,해괄응도함수고필적시재제고긴주도(류내거)화분리도(류간거)적동시사득분류개수진가능소.최후채용량개인공수거집화삼개UCI수거집대k-means취류산법(KM),유전취류산법(GA),유전k-means취류산법(GKM)화개진적유전k-means취류산법(IGKM)진행비교연구,비교적지표유류간거、류내거화분류정학솔.연구증명개진적유전k-means산법능구자동획취최가취류수k병차보지교고적정학솔.