计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2011年
10期
1797-1804
,共8页
深度万维网%万维网数据库%关键词查询%领域选择%数据库选择
深度萬維網%萬維網數據庫%關鍵詞查詢%領域選擇%數據庫選擇
심도만유망%만유망수거고%관건사사순%영역선택%수거고선택
该文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库.这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库上的关键词查询,从而能够与现有的搜索引擎实现无缝集成.文中侧重于讨论基于关键词的数据库选择,从以下两个方面解决这一问题所涉及的挑战:(1)提出了一种度量关键词—领域属性关联的相关性模型,并设计了基于随机游动的算法从查询日志中发现潜在的关键词—属性关联;(2)给出了一种新的数据采样方法,并用于基于采样的数据库—查询的相关性模型中,最终解决深度万维网的数据库选择问题.在中文深度万维网真实数据集上的实验表明:提出的方法能够有效地选择与关键词查询相关的数据库,提供高质量的结果.
該文提齣一種基于關鍵詞的深度萬維網查詢方法:用戶用關鍵詞的方式提交查詢,該方法在線地選擇能夠反映查詢意圖併且提供高質量結果的萬維網數據庫.這種方法既避免瞭深度萬維網數據抓取這一代價高、難度大的操作,又可支持多領域的數據庫上的關鍵詞查詢,從而能夠與現有的搜索引擎實現無縫集成.文中側重于討論基于關鍵詞的數據庫選擇,從以下兩箇方麵解決這一問題所涉及的挑戰:(1)提齣瞭一種度量關鍵詞—領域屬性關聯的相關性模型,併設計瞭基于隨機遊動的算法從查詢日誌中髮現潛在的關鍵詞—屬性關聯;(2)給齣瞭一種新的數據採樣方法,併用于基于採樣的數據庫—查詢的相關性模型中,最終解決深度萬維網的數據庫選擇問題.在中文深度萬維網真實數據集上的實驗錶明:提齣的方法能夠有效地選擇與關鍵詞查詢相關的數據庫,提供高質量的結果.
해문제출일충기우관건사적심도만유망사순방법:용호용관건사적방식제교사순,해방법재선지선택능구반영사순의도병차제공고질량결과적만유망수거고.저충방법기피면료심도만유망수거조취저일대개고、난도대적조작,우가지지다영역적수거고상적관건사사순,종이능구여현유적수색인경실현무봉집성.문중측중우토론기우관건사적수거고선택,종이하량개방면해결저일문제소섭급적도전:(1)제출료일충도량관건사—영역속성관련적상관성모형,병설계료기우수궤유동적산법종사순일지중발현잠재적관건사—속성관련;(2)급출료일충신적수거채양방법,병용우기우채양적수거고—사순적상관성모형중,최종해결심도만유망적수거고선택문제.재중문심도만유망진실수거집상적실험표명:제출적방법능구유효지선택여관건사사순상관적수거고,제공고질량적결과.