河南教育学院学报(自然科学版)
河南教育學院學報(自然科學版)
하남교육학원학보(자연과학판)
JOURNAL OF HENAN EDUCATION INSTITUTE (NATURAL SCIENCE EDITION)
2015年
2期
23-29
,共7页
最小哈希%视觉词袋模型%图像聚类%局部重合图像%数据挖掘
最小哈希%視覺詞袋模型%圖像聚類%跼部重閤圖像%數據挖掘
최소합희%시각사대모형%도상취류%국부중합도상%수거알굴
min-hash%bag of visual word%image clustering%partial duplicate images%data mining
采用视觉词袋模型表示图像,以快速检测空间上部分重合图像对的最小哈希算法为基础,提出一种对局部重合图像聚类即数据挖掘的方法,能够找到类种子的概率随着类别中图像数目的增长显著增加。对聚类的结果进行空间上的验证,并在大小分别为104、105以及5×106的图像数据集上对该算法的效果进行测试。算法的速度依赖于数据集中图像的数目和数据集中类别的数目,类种子生成的时间复杂度线性相关于数据集大小。
採用視覺詞袋模型錶示圖像,以快速檢測空間上部分重閤圖像對的最小哈希算法為基礎,提齣一種對跼部重閤圖像聚類即數據挖掘的方法,能夠找到類種子的概率隨著類彆中圖像數目的增長顯著增加。對聚類的結果進行空間上的驗證,併在大小分彆為104、105以及5×106的圖像數據集上對該算法的效果進行測試。算法的速度依賴于數據集中圖像的數目和數據集中類彆的數目,類種子生成的時間複雜度線性相關于數據集大小。
채용시각사대모형표시도상,이쾌속검측공간상부분중합도상대적최소합희산법위기출,제출일충대국부중합도상취류즉수거알굴적방법,능구조도류충자적개솔수착유별중도상수목적증장현저증가。대취류적결과진행공간상적험증,병재대소분별위104、105이급5×106적도상수거집상대해산법적효과진행측시。산법적속도의뢰우수거집중도상적수목화수거집중유별적수목,류충자생성적시간복잡도선성상관우수거집대소。
A method came up which finds clusters of partial duplicate images .The main idea relies on the Min-Hash algorithm for fast detection of pairs of images with spatial partial overlap .The probability of finding a seed for an image cluster rapidly increases with the size of the cluster .After that a RANSAC spatial consistency test will be passed .The properties and performance of the algorithm are demonstrated on data sets with 10 4 ,10 5 , and 5 ×10 6 images.The speed of the method depends on the size of the database and the number of clusters .