计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
8期
182-185
,共4页
袁鑫攀%龙军%张祖平%罗跃逸%桂卫华
袁鑫攀%龍軍%張祖平%囉躍逸%桂衛華
원흠반%룡군%장조평%라약일%계위화
相似度估值%哈希%最优分数位
相似度估值%哈希%最優分數位
상사도고치%합희%최우분수위
在信息检索中,minwise哈希算法用于估值集合的相似度;b位minwise哈希算法则通过存储哈希值的b位来估算相似度,从而节省了存储空间和计算时间.分数位minwise哈希算法对各种精度和存储空间需求有着更加广泛的可选择性.对于给定的分数位f,构建f的方式有很多.分析了有限的分数位组合方式,给出最优化分数位的理论分析.大量的实验验证了此方法的有效性.
在信息檢索中,minwise哈希算法用于估值集閤的相似度;b位minwise哈希算法則通過存儲哈希值的b位來估算相似度,從而節省瞭存儲空間和計算時間.分數位minwise哈希算法對各種精度和存儲空間需求有著更加廣汎的可選擇性.對于給定的分數位f,構建f的方式有很多.分析瞭有限的分數位組閤方式,給齣最優化分數位的理論分析.大量的實驗驗證瞭此方法的有效性.
재신식검색중,minwise합희산법용우고치집합적상사도;b위minwise합희산법칙통과존저합희치적b위래고산상사도,종이절성료존저공간화계산시간.분수위minwise합희산법대각충정도화존저공간수구유착경가엄범적가선택성.대우급정적분수위f,구건f적방식유흔다.분석료유한적분수위조합방식,급출최우화분수위적이론분석.대량적실험험증료차방법적유효성.