广东工业大学学报
廣東工業大學學報
엄동공업대학학보
JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY
2014年
3期
119-123
,共5页
k近邻查询%Kd树%空间数据%多边形空间%层次划分
k近鄰查詢%Kd樹%空間數據%多邊形空間%層次劃分
k근린사순%Kd수%공간수거%다변형공간%층차화분
k nearest neighbor query%Kd-Tree%spatial data%polygon space%hierarchical division
k近邻查询算法是查询大规模空间数据的常用算法之一,使用Kd-Tree先构建大规模空间数据的索引,然后对搜索空间进行层次划分,再进行k近邻查询,能保证搜索的效率。但是,传统的Kd-Tree构建有两个缺点:使用测试数据点进行k近邻查询每次都需要回溯到根节点,影响了查询的效率;Kd-Tree使用split域对空间进行层次划分,空间划分为立方体(二维数据表现为矩形),多边形空间在相交判断时会出现没必要进行数据距离比较的多余空间,这样会影响查询的效率。针对这两个缺点,本文提出了相应的改进算法---RB算法。实验结果证明,该算法比传统的KD算法拥有更高的查询效率。本文的主要贡献有两点:(1)构建一种快速创建Kd-Tree索引来支持KNN算法进行大规模数据的分类查询操作。(2)改进传统的Kd-Tree索引构建方法,提出新的改进算法RB算法,提高KNN算法查询的效率。
k近鄰查詢算法是查詢大規模空間數據的常用算法之一,使用Kd-Tree先構建大規模空間數據的索引,然後對搜索空間進行層次劃分,再進行k近鄰查詢,能保證搜索的效率。但是,傳統的Kd-Tree構建有兩箇缺點:使用測試數據點進行k近鄰查詢每次都需要迴溯到根節點,影響瞭查詢的效率;Kd-Tree使用split域對空間進行層次劃分,空間劃分為立方體(二維數據錶現為矩形),多邊形空間在相交判斷時會齣現沒必要進行數據距離比較的多餘空間,這樣會影響查詢的效率。針對這兩箇缺點,本文提齣瞭相應的改進算法---RB算法。實驗結果證明,該算法比傳統的KD算法擁有更高的查詢效率。本文的主要貢獻有兩點:(1)構建一種快速創建Kd-Tree索引來支持KNN算法進行大規模數據的分類查詢操作。(2)改進傳統的Kd-Tree索引構建方法,提齣新的改進算法RB算法,提高KNN算法查詢的效率。
k근린사순산법시사순대규모공간수거적상용산법지일,사용Kd-Tree선구건대규모공간수거적색인,연후대수색공간진행층차화분,재진행k근린사순,능보증수색적효솔。단시,전통적Kd-Tree구건유량개결점:사용측시수거점진행k근린사순매차도수요회소도근절점,영향료사순적효솔;Kd-Tree사용split역대공간진행층차화분,공간화분위립방체(이유수거표현위구형),다변형공간재상교판단시회출현몰필요진행수거거리비교적다여공간,저양회영향사순적효솔。침대저량개결점,본문제출료상응적개진산법---RB산법。실험결과증명,해산법비전통적KD산법옹유경고적사순효솔。본문적주요공헌유량점:(1)구건일충쾌속창건Kd-Tree색인래지지KNN산법진행대규모수거적분류사순조작。(2)개진전통적Kd-Tree색인구건방법,제출신적개진산법RB산법,제고KNN산법사순적효솔。
K nearest neighbor query algorithm is one of the commonly used algorithms in massive spatial data query.First, it construct an index of large-scale spatial data by Kd-Tree, and hierarchical division of the search space .Then, it used the k nearest neighbor query to ensure the efficiency of the search . However , the traditional Kd-Tree construction has two drawbacks:the use of test data points are required for each k nearest neighbor query back to the root , thus affecting the efficiency of the query;Kd-Tree u-ses the split-level domain for the space division of space into cubes ( two-dimensional data are rectangu-lar) , extra space appears in polygonal space at the intersection of judgment , making the comparison of data unnecessary , thus affecting the efficiency of the query .Regarding these two shortcomings , it pro-posed the corresponding improved algorithm-RB algorithm.Experimental results show that the algorithm has a higher query efficiency than the traditional KD algorithm .There are two main contribution from this paper:(1) This paper construct a quickly create Kd-Tree indexes to support queries KNN akgorithm to classify large-scale data .( 2 ) RB algorithm is proposed to improve the traditional Kd-Tree index con-struction method ,and improving query efficiency for KNN algorithm .