计算机研究与发展
計算機研究與髮展
계산궤연구여발전
Journal of Computer Research and Development
2015年
11期
2555-2567
,共13页
张帅%李涛%焦晓帆%王艺峰%杨愚鲁
張帥%李濤%焦曉帆%王藝峰%楊愚魯
장수%리도%초효범%왕예봉%양우로
谱聚类%T近邻%CPU-GPU异构计算%计算统一设备架构%OpenMP
譜聚類%T近鄰%CPU-GPU異構計算%計算統一設備架構%OpenMP
보취류%T근린%CPU-GPU이구계산%계산통일설비가구%OpenMP
spectral clustering%T-nearest-neighbors (TNN)%CPU-GPU heterogeneous computing%CUDA%OpenMP
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos万法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480 GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能.
譜聚類是數據挖掘領域最常用的聚類算法之一,但對于如何利用多覈CPU與資源有限的衆覈加速器設計併實現一箇在異構單節點上能夠處理大規模數據集的高效譜聚類算法,目前尚無理想的解決方案.PSCH(parallel spectral clustering for hybrids)算法是專為CPU-GPU異構計算環境設計的併行T近鄰(T-nearest-neighbors,TNN)譜聚類算法,通過分塊計算相似性矩陣打破瞭GPU設備內存的限製,所能處理的數據集規模僅受限于CPU主存的容量.PSCH算法中使用CUDA設計實現雙緩遲輪轉4段流水機製,通過重疊計算與傳輸在打破存儲瓶頸的同時保證瞭高計算性能.PSCH算法採用隱式重啟動Lanczos萬法(implicitly restarted Lanczos method,IRIM)在異構硬件上計算稀疏特徵矩陣的特徵分解,減輕瞭特徵分解步驟的計算瓶頸.PSCH算法在配有一塊GTX 480 GPU的單節點上能夠對百萬以上規模的數據集進行聚類,併對實驗中的4箇數據集取得瞭相對于使用16進程的MPI併行譜聚類PSC算法2.0~4.5倍的性能.
보취류시수거알굴영역최상용적취류산법지일,단대우여하이용다핵CPU여자원유한적음핵가속기설계병실현일개재이구단절점상능구처리대규모수거집적고효보취류산법,목전상무이상적해결방안.PSCH(parallel spectral clustering for hybrids)산법시전위CPU-GPU이구계산배경설계적병행T근린(T-nearest-neighbors,TNN)보취류산법,통과분괴계산상사성구진타파료GPU설비내존적한제,소능처리적수거집규모부수한우CPU주존적용량.PSCH산법중사용CUDA설계실현쌍완충륜전4단류수궤제,통과중첩계산여전수재타파존저병경적동시보증료고계산성능.PSCH산법채용은식중계동Lanczos만법(implicitly restarted Lanczos method,IRIM)재이구경건상계산희소특정구진적특정분해,감경료특정분해보취적계산병경.PSCH산법재배유일괴GTX 480 GPU적단절점상능구대백만이상규모적수거집진행취류,병대실험중적4개수거집취득료상대우사용16진정적MPI병행보취류PSC산법2.0~4.5배적성능.