计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2009年
13期
28-30
,共3页
苗忠义%赵朋朋%胡鹏旻%崔志明
苗忠義%趙朋朋%鬍鵬旻%崔誌明
묘충의%조붕붕%호붕민%최지명
重叠率%深网%数据库%估计
重疊率%深網%數據庫%估計
중첩솔%심망%수거고%고계
在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法.以中文高频字作为起点,迭代诱导属性高频字.通过属性高频字的查询结果计算重叠部分出现的条件概率,进而估计重叠率.实验证明,该方法的偏差度和波动度都小于5.
在同一領域中,不同Web數據庫之間有重疊部分,為估計重疊部分在Web數據庫中所佔比例,提齣一種基于屬性高頻字的重疊率估計方法.以中文高頻字作為起點,迭代誘導屬性高頻字.通過屬性高頻字的查詢結果計算重疊部分齣現的條件概率,進而估計重疊率.實驗證明,該方法的偏差度和波動度都小于5.
재동일영역중,불동Web수거고지간유중첩부분,위고계중첩부분재Web수거고중소점비례,제출일충기우속성고빈자적중첩솔고계방법.이중문고빈자작위기점,질대유도속성고빈자.통과속성고빈자적사순결과계산중첩부분출현적조건개솔,진이고계중첩솔.실험증명,해방법적편차도화파동도도소우5.