西昌学院学报(自然科学版)
西昌學院學報(自然科學版)
서창학원학보(자연과학판)
JOURNAL OF XICHANG COLLEGE(NATURAL SCIENCE EDITION)
2009年
4期
57-61
,共5页
网页分割%语义%信息检索%HTML标记%相似性
網頁分割%語義%信息檢索%HTML標記%相似性
망혈분할%어의%신식검색%HTML표기%상사성
如何准确表达用户意图,判断网页与用户需求的相关性是信息检索技术研究的重要方向.本文提出了一种基于网页内容分割的语义信息检索算法.该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割.在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合.根据用户的查询,充分利用区域信息来对相关的检索结果进行排序.实验表明,本文提出的方法可以显著地提高搜索引擎的查询效果.
如何準確錶達用戶意圖,判斷網頁與用戶需求的相關性是信息檢索技術研究的重要方嚮.本文提齣瞭一種基于網頁內容分割的語義信息檢索算法.該算法根據網頁半結構化的特點,按照HTML標記和網頁的內容將網頁進行區域分割.在建立HTML標記樹的基礎上,利用內容相似性和視覺相似性進行節點的整閤.根據用戶的查詢,充分利用區域信息來對相關的檢索結果進行排序.實驗錶明,本文提齣的方法可以顯著地提高搜索引擎的查詢效果.
여하준학표체용호의도,판단망혈여용호수구적상관성시신식검색기술연구적중요방향.본문제출료일충기우망혈내용분할적어의신식검색산법.해산법근거망혈반결구화적특점,안조HTML표기화망혈적내용장망혈진행구역분할.재건립HTML표기수적기출상,이용내용상사성화시각상사성진행절점적정합.근거용호적사순,충분이용구역신식래대상관적검색결과진행배서.실험표명,본문제출적방법가이현저지제고수색인경적사순효과.