计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2002年
23期
9-12,24
,共5页
宋晖%张岭%叶允明%马范援
宋暉%張嶺%葉允明%馬範援
송휘%장령%협윤명%마범원
Hidden Web 信息检索 对象抽取 结构化查询 标记树
Hidden Web 信息檢索 對象抽取 結構化查詢 標記樹
Hidden Web 신식검색 대상추취 결구화사순 표기수
目前标准的搜索引擎能够检索的仅仅是World Wide Web提供的小部分称为可索引的Web信息.大量的Hidden Web信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的.这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中.该文提出了一套检索Hidden Web信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术.系统采用新的基于标记树的对象抽取(Tag-Tree-based Object Extraction)方法自动地从Web页面中抽取Hidden Web信息,然后在此基础上给出了结构化的Hidden Web信息查询算法.文章最后对实验结果进行了讨论.
目前標準的搜索引擎能夠檢索的僅僅是World Wide Web提供的小部分稱為可索引的Web信息.大量的Hidden Web信息(估計容量是可索引Web的500倍)對這些搜索引擎是不可見的.這些信息隱藏在Web頁麵的搜索錶單後麵,保存在大型的動態數據庫中.該文提齣瞭一套檢索Hidden Web信息的方法,給齣瞭繫統的框架結構,併詳細討論瞭實現的關鍵技術.繫統採用新的基于標記樹的對象抽取(Tag-Tree-based Object Extraction)方法自動地從Web頁麵中抽取Hidden Web信息,然後在此基礎上給齣瞭結構化的Hidden Web信息查詢算法.文章最後對實驗結果進行瞭討論.
목전표준적수색인경능구검색적부부시World Wide Web제공적소부분칭위가색인적Web신식.대량적Hidden Web신식(고계용량시가색인Web적500배)대저사수색인경시불가견적.저사신식은장재Web혈면적수색표단후면,보존재대형적동태수거고중.해문제출료일투검색Hidden Web신식적방법,급출료계통적광가결구,병상세토론료실현적관건기술.계통채용신적기우표기수적대상추취(Tag-Tree-based Object Extraction)방법자동지종Web혈면중추취Hidden Web신식,연후재차기출상급출료결구화적Hidden Web신식사순산법.문장최후대실험결과진행료토론.