国防科技大学学报
國防科技大學學報
국방과기대학학보
JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY
2013年
6期
152-156
,共5页
栅格图像%超大型地理数据%MPI%并行处理框架
柵格圖像%超大型地理數據%MPI%併行處理框架
책격도상%초대형지리수거%MPI%병행처리광가
raster image%huge geographic data%MPI%parallel processing framework
随着高分辨率数据获取技术的发展,地理栅格数据的数据量不断增大,串行计算方式无法快速处理大型栅格数据,因此需要通过并行技术提高效率。传统开发过程将算法与进程调度、内存管理以及数据I /O 混杂在一起的编程方式,对程序员要求较高,代码质量不易控制。提出了一种面向大型地理栅格数据的并行处理框架,利用核心类的真实和虚拟两种读取方式,实现了大型数据的分步骤、分块的快速加载和写入,并将所有的并行任务调度、进程间的数据传输过程以及特定的栅格算法步骤归结为任务;通过该框架可以将算法本身与并行调度、磁盘 I /O 等底层操作分离,使算法编写者可以专注于算法本身,降低开发难度,提高代码质量,解决了快速编写大型地理栅格数据算法程序的目的。实验表明,本框架可实现较好的并行效果,并显著降低代码量、提高软件质量。
隨著高分辨率數據穫取技術的髮展,地理柵格數據的數據量不斷增大,串行計算方式無法快速處理大型柵格數據,因此需要通過併行技術提高效率。傳統開髮過程將算法與進程調度、內存管理以及數據I /O 混雜在一起的編程方式,對程序員要求較高,代碼質量不易控製。提齣瞭一種麵嚮大型地理柵格數據的併行處理框架,利用覈心類的真實和虛擬兩種讀取方式,實現瞭大型數據的分步驟、分塊的快速加載和寫入,併將所有的併行任務調度、進程間的數據傳輸過程以及特定的柵格算法步驟歸結為任務;通過該框架可以將算法本身與併行調度、磁盤 I /O 等底層操作分離,使算法編寫者可以專註于算法本身,降低開髮難度,提高代碼質量,解決瞭快速編寫大型地理柵格數據算法程序的目的。實驗錶明,本框架可實現較好的併行效果,併顯著降低代碼量、提高軟件質量。
수착고분변솔수거획취기술적발전,지리책격수거적수거량불단증대,천행계산방식무법쾌속처리대형책격수거,인차수요통과병행기술제고효솔。전통개발과정장산법여진정조도、내존관리이급수거I /O 혼잡재일기적편정방식,대정서원요구교고,대마질량불역공제。제출료일충면향대형지리책격수거적병행처리광가,이용핵심류적진실화허의량충독취방식,실현료대형수거적분보취、분괴적쾌속가재화사입,병장소유적병행임무조도、진정간적수거전수과정이급특정적책격산법보취귀결위임무;통과해광가가이장산법본신여병행조도、자반 I /O 등저층조작분리,사산법편사자가이전주우산법본신,강저개발난도,제고대마질량,해결료쾌속편사대형지리책격수거산법정서적목적。실험표명,본광가가실현교호적병행효과,병현저강저대마량、제고연건질량。
With the advance of technology,geographic raster data's amount increases continuouslly.Single process cannot process large raster data efficiency,so it is necessary to adopt parallel processing.Traditional development method mixes algorithm,processes scheduling,memory management and data I /O together,thus it presents higher requirements for programmers and the code quality is difficult to control.This study proposes a Huge Geographic Raster Data Parallel Processing Framework (HGRDPPF).With the use of core class's real read and virtual read method,framework can achieve a large raster data's fast loading and writing by steps or blocks,and can achieve parallel task scheduling,data transfer and specific algorithm stage into tasks;through this framework,the raster file is split into sub-tasks according to the ability of computer in the cluster,and separate the raster processing algorithm from MPI API,disk IO and logic,developers can concentrate onto the algorithm itself,and achieve higher program quality.Experiments show that this framework can significantly reduce the amount of code while improving software quality, and to achieve a better parallel performance.