科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2013年
16期
4603-4606
,共4页
EM算法%高斯混合模型%MapReduce%分布式
EM算法%高斯混閤模型%MapReduce%分佈式
EM산법%고사혼합모형%MapReduce%분포식
EM algorithm%Gaussian mixture model%MapReduce%distributed
利用MapReduce编程模型的简化性和期望最大化算法(Expectation maximization,EM)的高精度、恒收敛性,提出了一种对数据集规模无限制的数据处理算法;并通过对高斯混合模型的参数估计进行算法性能的测试.结果表明,算法能改善传统EM算法在处理大规模数据集时效率低的缺点,具有较好的加速比及可扩展性.
利用MapReduce編程模型的簡化性和期望最大化算法(Expectation maximization,EM)的高精度、恆收斂性,提齣瞭一種對數據集規模無限製的數據處理算法;併通過對高斯混閤模型的參數估計進行算法性能的測試.結果錶明,算法能改善傳統EM算法在處理大規模數據集時效率低的缺點,具有較好的加速比及可擴展性.
이용MapReduce편정모형적간화성화기망최대화산법(Expectation maximization,EM)적고정도、항수렴성,제출료일충대수거집규모무한제적수거처리산법;병통과대고사혼합모형적삼수고계진행산법성능적측시.결과표명,산법능개선전통EM산법재처리대규모수거집시효솔저적결점,구유교호적가속비급가확전성.