信息技术与信息化
信息技術與信息化
신식기술여신식화
INFORMATION TECHNOLOGY & INFORMATIZATION
2010年
2期
63-66
,共4页
Deep%Web%属性相关度%Web数据库大小估算
Deep%Web%屬性相關度%Web數據庫大小估算
Deep%Web%속성상관도%Web수거고대소고산
为估算Web数据库大小,提出了一种基于属性相关度和样本独立特性的Web数据库大小估算方法.首先通过中科院分词系统ICTCLAS对通过提交查询获得文本属性值进行分词以便计算属性相关度,再通过属性的相关性获得属性近似独立样本,进而依据样本的独立性来估算Web数据库的大小.并通过实验验证,本方法能获得较高的准确性.
為估算Web數據庫大小,提齣瞭一種基于屬性相關度和樣本獨立特性的Web數據庫大小估算方法.首先通過中科院分詞繫統ICTCLAS對通過提交查詢穫得文本屬性值進行分詞以便計算屬性相關度,再通過屬性的相關性穫得屬性近似獨立樣本,進而依據樣本的獨立性來估算Web數據庫的大小.併通過實驗驗證,本方法能穫得較高的準確性.
위고산Web수거고대소,제출료일충기우속성상관도화양본독립특성적Web수거고대소고산방법.수선통과중과원분사계통ICTCLAS대통과제교사순획득문본속성치진행분사이편계산속성상관도,재통과속성적상관성획득속성근사독립양본,진이의거양본적독립성래고산Web수거고적대소.병통과실험험증,본방법능획득교고적준학성.