计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2014年
2期
657-660
,共4页
遗传算法%k-means算法%MapReduce模型%Hadoop平台%并行化
遺傳算法%k-means算法%MapReduce模型%Hadoop平檯%併行化
유전산법%k-means산법%MapReduce모형%Hadoop평태%병행화
genetic algorithm%k-means algorithm%MapReduce model%Hadoop platform%parallelization
为了提高遗传k-means算法时间效率和聚类结果的正确率,利用遗传算法的粗粒度并行化设计思想,提出了在Hadoop平台下将遗传k-means算法进行并行化设计.将各个子种群编号作为个体区分,个体所包含的各个聚类中心和其适应度作为值共同作为个体的输入;在并行化过程中,设计了较优的种群迁移策略来避免早熟现象的发生.实验对不同的数据集进行处理,实验结果表明,并行化的遗传k-means算法在处理较大数据集时比传统的串行算法在时间上和最后的结果上都具有明显的优越性.
為瞭提高遺傳k-means算法時間效率和聚類結果的正確率,利用遺傳算法的粗粒度併行化設計思想,提齣瞭在Hadoop平檯下將遺傳k-means算法進行併行化設計.將各箇子種群編號作為箇體區分,箇體所包含的各箇聚類中心和其適應度作為值共同作為箇體的輸入;在併行化過程中,設計瞭較優的種群遷移策略來避免早熟現象的髮生.實驗對不同的數據集進行處理,實驗結果錶明,併行化的遺傳k-means算法在處理較大數據集時比傳統的串行算法在時間上和最後的結果上都具有明顯的優越性.
위료제고유전k-means산법시간효솔화취류결과적정학솔,이용유전산법적조립도병행화설계사상,제출료재Hadoop평태하장유전k-means산법진행병행화설계.장각개자충군편호작위개체구분,개체소포함적각개취류중심화기괄응도작위치공동작위개체적수입;재병행화과정중,설계료교우적충군천이책략래피면조숙현상적발생.실험대불동적수거집진행처리,실험결과표명,병행화적유전k-means산법재처리교대수거집시비전통적천행산법재시간상화최후적결과상도구유명현적우월성.