情报学报
情報學報
정보학보
2004年
5期
553-560
,共8页
Web%网页%搜索引擎%数据挖掘
Web%網頁%搜索引擎%數據挖掘
Web%망혈%수색인경%수거알굴
Web上的网页正以惊人的速度增长和变化,给传统搜索引擎的效率和质量带来了许多新的问题和挑战.我们迫切需要一种研究方法,能够对搜索引擎收集来的海量网页进行有效的分析,以便对Web保持完整清晰的认识来指导搜索引擎进行更有效的服务.本文提出一种基于时间、空间和内容的三维Web分析模型,通过它可以对海量的网页数据进行多维度、多层次的分析工作,为我们认识Web提供一种全新的视角.在实验中我们简单地实现了该模型,并通过对3批网页数据进行分析,得到网页变化率、网页空间分布、复制强度大的网页特点等数据,以及Internet作为"第四媒体"在信息传播上的一些特点.
Web上的網頁正以驚人的速度增長和變化,給傳統搜索引擎的效率和質量帶來瞭許多新的問題和挑戰.我們迫切需要一種研究方法,能夠對搜索引擎收集來的海量網頁進行有效的分析,以便對Web保持完整清晰的認識來指導搜索引擎進行更有效的服務.本文提齣一種基于時間、空間和內容的三維Web分析模型,通過它可以對海量的網頁數據進行多維度、多層次的分析工作,為我們認識Web提供一種全新的視角.在實驗中我們簡單地實現瞭該模型,併通過對3批網頁數據進行分析,得到網頁變化率、網頁空間分佈、複製彊度大的網頁特點等數據,以及Internet作為"第四媒體"在信息傳播上的一些特點.
Web상적망혈정이량인적속도증장화변화,급전통수색인경적효솔화질량대래료허다신적문제화도전.아문박절수요일충연구방법,능구대수색인경수집래적해량망혈진행유효적분석,이편대Web보지완정청석적인식래지도수색인경진행경유효적복무.본문제출일충기우시간、공간화내용적삼유Web분석모형,통과타가이대해량적망혈수거진행다유도、다층차적분석공작,위아문인식Web제공일충전신적시각.재실험중아문간단지실현료해모형,병통과대3비망혈수거진행분석,득도망혈변화솔、망혈공간분포、복제강도대적망혈특점등수거,이급Internet작위"제사매체"재신식전파상적일사특점.