科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2013年
6期
68-70
,共3页
EM算法%混合模型%MapReduce%云计算%分布式%机器学习
EM算法%混閤模型%MapReduce%雲計算%分佈式%機器學習
EM산법%혼합모형%MapReduce%운계산%분포식%궤기학습
EM algorithm%gaussian mixture model(GMM)%mapreduce%cloud computing%distributed%machine learning
EM(Expectation-Maximization)算法在机器学习和自然语言处理方面应用非常广泛。随着电子信息技术的高速发展,人们更加需要从大量的数据信息中提出更多有价值的知识,用于后续的研究工作。但是,传统的应用到机器学习等领域的EM算法不能有效地处理当今社会海量规模的数据。本文基于现有流行的MapReduce计算框架,提出了求解混合模型的分布式EM算法。该算法能够高效地完成极大似然估计。实验表明,本文提出的算法具有很好的加速比以及可扩展性。
EM(Expectation-Maximization)算法在機器學習和自然語言處理方麵應用非常廣汎。隨著電子信息技術的高速髮展,人們更加需要從大量的數據信息中提齣更多有價值的知識,用于後續的研究工作。但是,傳統的應用到機器學習等領域的EM算法不能有效地處理噹今社會海量規模的數據。本文基于現有流行的MapReduce計算框架,提齣瞭求解混閤模型的分佈式EM算法。該算法能夠高效地完成極大似然估計。實驗錶明,本文提齣的算法具有很好的加速比以及可擴展性。
EM(Expectation-Maximization)산법재궤기학습화자연어언처리방면응용비상엄범。수착전자신식기술적고속발전,인문경가수요종대량적수거신식중제출경다유개치적지식,용우후속적연구공작。단시,전통적응용도궤기학습등영역적EM산법불능유효지처리당금사회해량규모적수거。본문기우현유류행적MapReduce계산광가,제출료구해혼합모형적분포식EM산법。해산법능구고효지완성겁대사연고계。실험표명,본문제출적산법구유흔호적가속비이급가확전성。