科研信息化技术与应用
科研信息化技術與應用
과연신식화기술여응용
E-science Technology & Application
2014年
5期
3-9
,共7页
科学数据管理%数据模型%数据格式%I/O性能优化
科學數據管理%數據模型%數據格式%I/O性能優化
과학수거관리%수거모형%수거격식%I/O성능우화
scientiifc data management%data model%data format%I/O performance optimization
许多并行科学计算应用使用HDF5等数据格式管理计算数据与元数据。一般条件下,科学计算数据与元数据有不同的存储特征。数据存储规模较大,可以在并行文件系统中获得较高的I/O效率。元数据存储规模较小,难以发挥并行文件系统带宽。一旦数据与元数据混合存储,元数据I/O将较多的干扰数据I/O,降低总的I/O效率。针对数据与元数据的不同I/O特征,本文设计双路I/O系统,该系统优化元数据的存储位置。将元数据存储于容量较小、但是延迟较低的固态盘文件系统中,在降低元数据I/O延迟的同时提高数据I/O的连续性。实验表明,双路并行I/O可以提高数据读带宽3倍左右。
許多併行科學計算應用使用HDF5等數據格式管理計算數據與元數據。一般條件下,科學計算數據與元數據有不同的存儲特徵。數據存儲規模較大,可以在併行文件繫統中穫得較高的I/O效率。元數據存儲規模較小,難以髮揮併行文件繫統帶寬。一旦數據與元數據混閤存儲,元數據I/O將較多的榦擾數據I/O,降低總的I/O效率。針對數據與元數據的不同I/O特徵,本文設計雙路I/O繫統,該繫統優化元數據的存儲位置。將元數據存儲于容量較小、但是延遲較低的固態盤文件繫統中,在降低元數據I/O延遲的同時提高數據I/O的連續性。實驗錶明,雙路併行I/O可以提高數據讀帶寬3倍左右。
허다병행과학계산응용사용HDF5등수거격식관리계산수거여원수거。일반조건하,과학계산수거여원수거유불동적존저특정。수거존저규모교대,가이재병행문건계통중획득교고적I/O효솔。원수거존저규모교소,난이발휘병행문건계통대관。일단수거여원수거혼합존저,원수거I/O장교다적간우수거I/O,강저총적I/O효솔。침대수거여원수거적불동I/O특정,본문설계쌍로I/O계통,해계통우화원수거적존저위치。장원수거존저우용량교소、단시연지교저적고태반문건계통중,재강저원수거I/O연지적동시제고수거I/O적련속성。실험표명,쌍로병행I/O가이제고수거독대관3배좌우。
Scientific data and metadata are saved in formatted file to apply in different environments and across platforms. However, there are different characters in stored data and metadata. Data are large in size and rarely accessed. Meta data are small in size but frequently accessed. Existed ifle formats aligned data and metadata in order. This is inefifcient in the cache management of ifle system while writing data and there will be long latency in dis-contiguous metadata readings. In this paper, we present a dual channel I/O format and library, which saves scientiifc data and metadata in different storage respectively. Data are saved in the traditional hard disk and metadata are saved in the low latency solid-state disk or memory. Evaluation shows dual channel I/O library is faster 3 times in reading than traditional I/O library.