计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2011年
10期
1785-1796
,共12页
丁琳琳%信俊昌%王国仁%黄山
丁琳琳%信俊昌%王國仁%黃山
정림림%신준창%왕국인%황산
云计算%Skyline查询%Map-Reduce%海量数据%Hadoop
雲計算%Skyline查詢%Map-Reduce%海量數據%Hadoop
운계산%Skyline사순%Map-Reduce%해량수거%Hadoop
Skyline查询已成为现今数据库和信息检索领域的研究热点之一,伴随着人类可以采集和利用的数据信息的急剧增长,使得如何处理海量数据的Skyline查询成为急需解决的问题.近年来兴起的Map-Reduce编程框架能够有效地处理基于海量数据的应用,该文是研究如何运用Map-Reduce编程框架解决海量数据的Skyline查询问题.在Map-Reduce框架下处理Skyline查询的直接方法是扫描整个数据集进而得到查询结果,但是在海量数据Skyline查询问题中,查询结果的数量远小于原始数据集的数据量,对此该文提出了一系列的Skyline查询算法及优化,有效地过滤掉部分不能成为Skyline查询结果的数据对象,大幅度提高了在Map-Reduce框架下处理Skyline查询的效率.大量运行在Hadoop平台上的实验验证了该文所提出的Skyline查询处理算法具有良好的有效性、准确性和可用性.
Skyline查詢已成為現今數據庫和信息檢索領域的研究熱點之一,伴隨著人類可以採集和利用的數據信息的急劇增長,使得如何處理海量數據的Skyline查詢成為急需解決的問題.近年來興起的Map-Reduce編程框架能夠有效地處理基于海量數據的應用,該文是研究如何運用Map-Reduce編程框架解決海量數據的Skyline查詢問題.在Map-Reduce框架下處理Skyline查詢的直接方法是掃描整箇數據集進而得到查詢結果,但是在海量數據Skyline查詢問題中,查詢結果的數量遠小于原始數據集的數據量,對此該文提齣瞭一繫列的Skyline查詢算法及優化,有效地過濾掉部分不能成為Skyline查詢結果的數據對象,大幅度提高瞭在Map-Reduce框架下處理Skyline查詢的效率.大量運行在Hadoop平檯上的實驗驗證瞭該文所提齣的Skyline查詢處理算法具有良好的有效性、準確性和可用性.
Skyline사순이성위현금수거고화신식검색영역적연구열점지일,반수착인류가이채집화이용적수거신식적급극증장,사득여하처리해량수거적Skyline사순성위급수해결적문제.근년래흥기적Map-Reduce편정광가능구유효지처리기우해량수거적응용,해문시연구여하운용Map-Reduce편정광가해결해량수거적Skyline사순문제.재Map-Reduce광가하처리Skyline사순적직접방법시소묘정개수거집진이득도사순결과,단시재해량수거Skyline사순문제중,사순결과적수량원소우원시수거집적수거량,대차해문제출료일계렬적Skyline사순산법급우화,유효지과려도부분불능성위Skyline사순결과적수거대상,대폭도제고료재Map-Reduce광가하처리Skyline사순적효솔.대량운행재Hadoop평태상적실험험증료해문소제출적Skyline사순처리산법구유량호적유효성、준학성화가용성.