计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
10期
190-193,212
,共5页
陈德华%周蒙%孙延青%郑亮亮
陳德華%週矇%孫延青%鄭亮亮
진덕화%주몽%손연청%정량량
图稀疏化%Minhash%MapReduce框架%MR-GSpar算法
圖稀疏化%Minhash%MapReduce框架%MR-GSpar算法
도희소화%Minhash%MapReduce광가%MR-GSpar산법
Graph sparsification%Minhsh%MapReduce framework%MR-GSpar algorithm
图的稀疏化是图聚类分析中数据预处理的关键操作,已得到广泛的关注.针对图数据日益普及、规模不断增大的现状,提出了一种基于MapReduce的面向大规模图的稀疏化算法,即MR-GSpar算法.该算法在MapReduce并行计算框架的基础上,通过对传统的最小哈希(Minhash)算法的并行化改造,使其可在分布式的集群环境中实现对大规模图数据的高效稀疏化处理.真实数据集上的实验表明了该算法的可行性与有效性.
圖的稀疏化是圖聚類分析中數據預處理的關鍵操作,已得到廣汎的關註.針對圖數據日益普及、規模不斷增大的現狀,提齣瞭一種基于MapReduce的麵嚮大規模圖的稀疏化算法,即MR-GSpar算法.該算法在MapReduce併行計算框架的基礎上,通過對傳統的最小哈希(Minhash)算法的併行化改造,使其可在分佈式的集群環境中實現對大規模圖數據的高效稀疏化處理.真實數據集上的實驗錶明瞭該算法的可行性與有效性.
도적희소화시도취류분석중수거예처리적관건조작,이득도엄범적관주.침대도수거일익보급、규모불단증대적현상,제출료일충기우MapReduce적면향대규모도적희소화산법,즉MR-GSpar산법.해산법재MapReduce병행계산광가적기출상,통과대전통적최소합희(Minhash)산법적병행화개조,사기가재분포식적집군배경중실현대대규모도수거적고효희소화처리.진실수거집상적실험표명료해산법적가행성여유효성.