中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2015年
2期
79-86
,共8页
李宁%罗文娟%庄福振%何清%史忠植
李寧%囉文娟%莊福振%何清%史忠植
리저%라문연%장복진%하청%사충식
概率主题模型%MapReduce%并行%语义分析
概率主題模型%MapReduce%併行%語義分析
개솔주제모형%MapReduce%병행%어의분석
probabilistic latent semantic analysis%MapReduce%text clustering%semantic analysis
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型.复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中.实验结果表明该算法在处理较大数据量时表现出了很好的性能.
PLSA(Probabilistic Latent Semantic Analysis)是一種典型的主題模型.複雜的建模過程使其難以處理海量數據,針對串行PLSA難以處理海量數據的問題,該文提齣一種基于MapReduce計算框架的併行PLSA算法,能夠以簡潔的形式和分佈式的方案來解決大規模數據的併行處理問題,併把併行PLSA算法運用到文本聚類和語義分析的文本挖掘應用中.實驗結果錶明該算法在處理較大數據量時錶現齣瞭很好的性能.
PLSA(Probabilistic Latent Semantic Analysis)시일충전형적주제모형.복잡적건모과정사기난이처리해량수거,침대천행PLSA난이처리해량수거적문제,해문제출일충기우MapReduce계산광가적병행PLSA산법,능구이간길적형식화분포식적방안래해결대규모수거적병행처리문제,병파병행PLSA산법운용도문본취류화어의분석적문본알굴응용중.실험결과표명해산법재처리교대수거량시표현출료흔호적성능.