CAJ | 학술논문

随着遥感技术的快速发展,遥感数据呈爆炸式增长,给遥感数据计算带来巨大的挑战.采用基于内存计算的Spark分布式计算框架以克服该问题,并选择YARN作为资源调度系统和采用HDFS为分布式存储系统.Spark是一个开源的分布式计算框架,基于弹性分布式数据集(RDD)概念,采用先进的有向无环图执行机制以支持循环数据流操作,通过一次数据导入内存就可以完成多次迭代运算.因而,特别适合基于多次迭代的大数据计算分析方法,相较于每轮迭代需把数据导入内存的MapReduce有更大的优势.将该计算框架应用于海量遥感数据分析,验证需要多次迭代的奇异值分解(SVD)算法在该数据分析中的有效性.实验表明,随着迭代次数增加,基于Spark的SVD运算效率相对于MapReduce有明显提高,通常可提高一个数量级.
수착요감기술적쾌속발전,요감수거정폭작식증장,급요감수거계산대래거대적도전.채용기우내존계산적Spark분포식계산광가이극복해문제,병선택YARN작위자원조도계통화채용HDFS위분포식존저계통.Spark시일개개원적분포식계산광가,기우탄성분포식수거집(RDD)개념,채용선진적유향무배도집행궤제이지지순배수거류조작,통과일차수거도입내존취가이완성다차질대운산.인이,특별괄합기우다차질대적대수거계산분석방법,상교우매륜질대수파수거도입내존적MapReduce유경대적우세.장해계산광가응용우해량요감수거분석,험증수요다차질대적기이치분해(SVD)산법재해수거분석중적유효성.실험표명,수착질대차수증가,기우Spark적SVD운산효솔상대우MapReduce유명현제고,통상가제고일개수량급.