吉林大学学报(信息科学版)
吉林大學學報(信息科學版)
길림대학학보(신식과학판)
JOURNAL OF JILIN UNIVERSITY(INFORMATION SCIENCE EDITION)
2013年
3期
324-327
,共4页
刘威%路来君%王洪肖%曹延波
劉威%路來君%王洪肖%曹延波
류위%로래군%왕홍초%조연파
地学G4ICCS系统%数据挖掘%决策树算法%并行
地學G4ICCS繫統%數據挖掘%決策樹算法%併行
지학G4ICCS계통%수거알굴%결책수산법%병행
geology geography geochemistry geophysics information cloud computing system(G4ICCS)%data mining%decision tree algorithm%parallel
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题,设计实现了基于G4 ICCS (Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT.该算法使用哈希表存储连续属性分割点两侧的数据记录,为并行节点的分割提供依据,在MapReduce架构下解决了海量地学数据挖掘问题.实验结果表明,在模拟的云计算环境下,决策树并行算法可以处理海量地学数据分类问题,并获得较好的稳定性和较高的处理速度.
針對傳統決策樹SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能處理海量地學數據挖掘的問題,設計實現瞭基于G4 ICCS (Geology Geography Geochemistry Geophysics Information Cloud Computing System)的決策樹併行分類算法PSPRINT.該算法使用哈希錶存儲連續屬性分割點兩側的數據記錄,為併行節點的分割提供依據,在MapReduce架構下解決瞭海量地學數據挖掘問題.實驗結果錶明,在模擬的雲計算環境下,決策樹併行算法可以處理海量地學數據分類問題,併穫得較好的穩定性和較高的處理速度.
침대전통결책수SPRINT(Scalable Parallelizable Induction of Decision Trees)산법불능처리해량지학수거알굴적문제,설계실현료기우G4 ICCS (Geology Geography Geochemistry Geophysics Information Cloud Computing System)적결책수병행분류산법PSPRINT.해산법사용합희표존저련속속성분할점량측적수거기록,위병행절점적분할제공의거,재MapReduce가구하해결료해량지학수거알굴문제.실험결과표명,재모의적운계산배경하,결책수병행산법가이처리해량지학수거분류문제,병획득교호적은정성화교고적처리속도.