计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
2期
39-43,47
,共6页
林蕾%孙涌%李卫东%邓子艳%张晓梅%Nicholson Caitriana
林蕾%孫湧%李衛東%鄧子豔%張曉梅%Nicholson Caitriana
림뢰%손용%리위동%산자염%장효매%Nicholson Caitriana
元数据%元数据模型%分布式计算%元数据管理%目录服务%高能物理
元數據%元數據模型%分佈式計算%元數據管理%目錄服務%高能物理
원수거%원수거모형%분포식계산%원수거관리%목록복무%고능물리
metadata%metadata model%distributed computing%metadata management%catalog service%high energy physics
北京谱仪 III(BESIII)高能物理实验产生 PB 量级的实验数据,海量数据的处理和分析对计算资源提出较大挑战。分布式计算是整合异构计算资源和解决计算资源短缺的可行方案。根据 BESIII 实验需求对分布式计算所需的元数据管理进行研究,提出数据文件的元数据模型,利用中间件软件 DIRAC 的目录服务设计并实现元数据管理系统。该系统利用树型目录结构、物理文件名动态构建和虚拟数据集等技术,组织和存储各种类型的元数据,实现查询请求、逻辑文件以及物理文件之间的映射,使用数字证书和开放安全套接层协议保证系统安全。将该系统应用于实验数据分析和处理中,测试结果表明,当并发用户访问量为300时,查询时间仅为0.3 s,证明该系统性能较好,可以满足 BESIII 实验的应用需要。
北京譜儀 III(BESIII)高能物理實驗產生 PB 量級的實驗數據,海量數據的處理和分析對計算資源提齣較大挑戰。分佈式計算是整閤異構計算資源和解決計算資源短缺的可行方案。根據 BESIII 實驗需求對分佈式計算所需的元數據管理進行研究,提齣數據文件的元數據模型,利用中間件軟件 DIRAC 的目錄服務設計併實現元數據管理繫統。該繫統利用樹型目錄結構、物理文件名動態構建和虛擬數據集等技術,組織和存儲各種類型的元數據,實現查詢請求、邏輯文件以及物理文件之間的映射,使用數字證書和開放安全套接層協議保證繫統安全。將該繫統應用于實驗數據分析和處理中,測試結果錶明,噹併髮用戶訪問量為300時,查詢時間僅為0.3 s,證明該繫統性能較好,可以滿足 BESIII 實驗的應用需要。
북경보의 III(BESIII)고능물리실험산생 PB 량급적실험수거,해량수거적처리화분석대계산자원제출교대도전。분포식계산시정합이구계산자원화해결계산자원단결적가행방안。근거 BESIII 실험수구대분포식계산소수적원수거관리진행연구,제출수거문건적원수거모형,이용중간건연건 DIRAC 적목록복무설계병실현원수거관리계통。해계통이용수형목록결구、물리문건명동태구건화허의수거집등기술,조직화존저각충류형적원수거,실현사순청구、라집문건이급물리문건지간적영사,사용수자증서화개방안전투접층협의보증계통안전。장해계통응용우실험수거분석화처리중,측시결과표명,당병발용호방문량위300시,사순시간부위0.3 s,증명해계통성능교호,가이만족 BESIII 실험적응용수요。
The high energy physics experiment of Beijing Electron Spectrum III(BESIII) produces experimental data of the magnitude of PB, which becomes an immense challenge for the existing computing resources. In order to solve the bottleneck problem, the distributed computing is considered as one of the most realistic solutions. According to the need, the metadata management is studied as an important component of BESIII distributed computing. The metadata model is designed and then metadata management system is implemented by using the catalog service of the DIRAC middleware. It adopts new techniques such as tree-like directory structure, dynamic construction of data file names and virtual datasets etc to effectively organize and store all kinds of metadata, and provides the mapping among inquiry requests, logical files and physical files. It uses the digital certificate and OpenSSL protocol to guarantee the system security. The system is set up and applied to the data processing and analysis. Test results show that its query time is just 0.3 s when it is accessed by 300 clients at the same time, so its performance meets the requirements of the BESIII experiment.