计算机时代
計算機時代
계산궤시대
COMPUTER ERA
2006年
11期
37-38
,共2页
王修竹%刘自伟%齐阳%鲍竞
王脩竹%劉自偉%齊暘%鮑競
왕수죽%류자위%제양%포경
管家基因法%Pearson相关系数%K-均值聚类%芯片数据
管傢基因法%Pearson相關繫數%K-均值聚類%芯片數據
관가기인법%Pearson상관계수%K-균치취류%심편수거
数据预处理可以大大降低数据挖掘算法的成本和提高数据挖掘的效率,尤其对于海量和高维的基因表达数据更为重要.针对K-means算法对数据预处理手段敏感的问题,文章提出了一种以管家基因法初始化数据、Pearson系数度量芯片数据相似性的预处理方法.具体的实验数据证明了该方法能很好地解决上述问题并有效地提高k-means算法的收敛速度.
數據預處理可以大大降低數據挖掘算法的成本和提高數據挖掘的效率,尤其對于海量和高維的基因錶達數據更為重要.針對K-means算法對數據預處理手段敏感的問題,文章提齣瞭一種以管傢基因法初始化數據、Pearson繫數度量芯片數據相似性的預處理方法.具體的實驗數據證明瞭該方法能很好地解決上述問題併有效地提高k-means算法的收斂速度.
수거예처리가이대대강저수거알굴산법적성본화제고수거알굴적효솔,우기대우해량화고유적기인표체수거경위중요.침대K-means산법대수거예처리수단민감적문제,문장제출료일충이관가기인법초시화수거、Pearson계수도량심편수거상사성적예처리방법.구체적실험수거증명료해방법능흔호지해결상술문제병유효지제고k-means산법적수렴속도.