软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2008年
2期
224-236
,共13页
词频%Web数据库大小估计%属性相关度
詞頻%Web數據庫大小估計%屬性相關度
사빈%Web수거고대소고계%속성상관도
提出了一种基于词频统计的方法以估算Web数据库的规模.通过分析Web数据库查询接口中属性之间的相关度来获取某个属性上的一组随机样本;并对该属性分别提交由前k位高频词形成的试探查询以估算Web数据库中记录的总数.通过在几个真实的Web数据库上进行实验验证,说明该方法可以准确地估算出Web数据库的大小.
提齣瞭一種基于詞頻統計的方法以估算Web數據庫的規模.通過分析Web數據庫查詢接口中屬性之間的相關度來穫取某箇屬性上的一組隨機樣本;併對該屬性分彆提交由前k位高頻詞形成的試探查詢以估算Web數據庫中記錄的總數.通過在幾箇真實的Web數據庫上進行實驗驗證,說明該方法可以準確地估算齣Web數據庫的大小.
제출료일충기우사빈통계적방법이고산Web수거고적규모.통과분석Web수거고사순접구중속성지간적상관도래획취모개속성상적일조수궤양본;병대해속성분별제교유전k위고빈사형성적시탐사순이고산Web수거고중기록적총수.통과재궤개진실적Web수거고상진행실험험증,설명해방법가이준학지고산출Web수거고적대소.