电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2014年
8期
1835-1837
,共3页
主成分分析%降维%大数据
主成分分析%降維%大數據
주성분분석%강유%대수거
PCA%dimensionality reduction%large scale data
PCA是一种常用的线性降维方法,但在实际应用中,当数据规模比较大时无法将样本数据全部读入内存进行分析计算。文章提出了一种针对较大规模数据应用PCA进行降维的方法,该方法在不借助Hadoop云计算平台的条件下解决了较大规模数据不能直接降维的问题,实际证明该方法具有很好的应用效果。
PCA是一種常用的線性降維方法,但在實際應用中,噹數據規模比較大時無法將樣本數據全部讀入內存進行分析計算。文章提齣瞭一種針對較大規模數據應用PCA進行降維的方法,該方法在不藉助Hadoop雲計算平檯的條件下解決瞭較大規模數據不能直接降維的問題,實際證明該方法具有很好的應用效果。
PCA시일충상용적선성강유방법,단재실제응용중,당수거규모비교대시무법장양본수거전부독입내존진행분석계산。문장제출료일충침대교대규모수거응용PCA진행강유적방법,해방법재불차조Hadoop운계산평태적조건하해결료교대규모수거불능직접강유적문제,실제증명해방법구유흔호적응용효과。
PCA is a general method of linear dimensionality reduction. It is unable to read all the sample data into the memory to do analysis when the data scale becomes large. A method of dimensionality reduction for large scale data using PCA without Ha-doop is proposed in this paper. This method solves the problem that it can’t do dimensionality reduction directly on large scale data. Practice proves that this method has a good application effect.