计算机应用
計算機應用
계산궤응용
Journal of Computer Applications
2015年
10期
2781-2783,2788
,共4页
协同过滤%推荐算法%矩阵分解%迭代最小二乘法%Spark
協同過濾%推薦算法%矩陣分解%迭代最小二乘法%Spark
협동과려%추천산법%구진분해%질대최소이승법%Spark
collaborative filtering%recommendation algorithm%matrix factorization%Alternating Least Square (ALS)%Spark
针对传统矩阵分解算法在处理海量数据信息时所面临的处理速度和计算资源的瓶颈问题,利用Spark在内存计算和迭代计算上的优势,提出了Spark框架下的矩阵分解并行化算法.首先,依据历史数据矩阵初始化用户因子矩阵和项目因子矩阵;其次,迭代更新因子矩阵,将迭代结果置于内存中作为下次迭代的输入;最后,迭代结束时得到矩阵推荐模型.通过在GroupLens网站上提供的MovieLens数据集上的实验结果表明,加速比(Speedup)值达到了线性的结果,该算法可以提高协同过滤推荐算法在大数据规模下的执行效率.
針對傳統矩陣分解算法在處理海量數據信息時所麵臨的處理速度和計算資源的瓶頸問題,利用Spark在內存計算和迭代計算上的優勢,提齣瞭Spark框架下的矩陣分解併行化算法.首先,依據歷史數據矩陣初始化用戶因子矩陣和項目因子矩陣;其次,迭代更新因子矩陣,將迭代結果置于內存中作為下次迭代的輸入;最後,迭代結束時得到矩陣推薦模型.通過在GroupLens網站上提供的MovieLens數據集上的實驗結果錶明,加速比(Speedup)值達到瞭線性的結果,該算法可以提高協同過濾推薦算法在大數據規模下的執行效率.
침대전통구진분해산법재처리해량수거신식시소면림적처리속도화계산자원적병경문제,이용Spark재내존계산화질대계산상적우세,제출료Spark광가하적구진분해병행화산법.수선,의거역사수거구진초시화용호인자구진화항목인자구진;기차,질대경신인자구진,장질대결과치우내존중작위하차질대적수입;최후,질대결속시득도구진추천모형.통과재GroupLens망참상제공적MovieLens수거집상적실험결과표명,가속비(Speedup)치체도료선성적결과,해산법가이제고협동과려추천산법재대수거규모하적집행효솔.