智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2015年
1期
43-45
,共3页
分类数据%k-modes%并行聚类%MapReduce
分類數據%k-modes%併行聚類%MapReduce
분류수거%k-modes%병행취류%MapReduce
k-modes是一种代表性的分类数据的聚类算法.首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心.为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法.实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比.
k-modes是一種代錶性的分類數據的聚類算法.首先對k-modes聚類算法的實現過程進行瞭改進:通過在分配數據對象到簇時更新這箇簇中各箇屬性項的次數,使得在遍歷一次全部數據對象就能計算齣新的簇中心.為瞭使k-modes能夠處理大規模分類數據,在Hadoop平檯上用MapReduce併行計算模型實現瞭k-modes算法.實驗錶明:在處理大量數據時,併行k-modes比串行k-modes極大地縮短瞭聚類時間,取得瞭較好的加速比.
k-modes시일충대표성적분류수거적취류산법.수선대k-modes취류산법적실현과정진행료개진:통과재분배수거대상도족시경신저개족중각개속성항적차수,사득재편력일차전부수거대상취능계산출신적족중심.위료사k-modes능구처리대규모분류수거,재Hadoop평태상용MapReduce병행계산모형실현료k-modes산법.실험표명:재처리대량수거시,병행k-modes비천행k-modes겁대지축단료취류시간,취득료교호적가속비.