计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
5期
1754-1756,1759
,共4页
大小估计%深网%网络数据库
大小估計%深網%網絡數據庫
대소고계%심망%망락수거고
为了估计网络数据库的大小,提出了基于Capture-Recapture过滤二字亲密、二字排斥的方法.通过在接口文本框提交属性高频字,利用返回的结果集,在两两之间作交集,根据交集中的两字分布分析采样的独立性,过滤掉其中不独立的情况,再利用Capture-Recapture方法估计网络数据库的大小.在模拟和真实的环境下进行了实验,该方法偏差度和波动度均较小.
為瞭估計網絡數據庫的大小,提齣瞭基于Capture-Recapture過濾二字親密、二字排斥的方法.通過在接口文本框提交屬性高頻字,利用返迴的結果集,在兩兩之間作交集,根據交集中的兩字分佈分析採樣的獨立性,過濾掉其中不獨立的情況,再利用Capture-Recapture方法估計網絡數據庫的大小.在模擬和真實的環境下進行瞭實驗,該方法偏差度和波動度均較小.
위료고계망락수거고적대소,제출료기우Capture-Recapture과려이자친밀、이자배척적방법.통과재접구문본광제교속성고빈자,이용반회적결과집,재량량지간작교집,근거교집중적량자분포분석채양적독립성,과려도기중불독립적정황,재이용Capture-Recapture방법고계망락수거고적대소.재모의화진실적배경하진행료실험,해방법편차도화파동도균교소.