情报学报
情報學報
정보학보
2012年
8期
837-845
,共9页
用户关注度%百度指数%网页特征项%回归分析
用戶關註度%百度指數%網頁特徵項%迴歸分析
용호관주도%백도지수%망혈특정항%회귀분석
针对海量的互联网信息,提出一种计算网页理论用户关注度的方法,以期提高网络信息搜索的效率,改进搜索排名的准确性.本文以中文论坛的新闻网页为研究对象,利用百度指数提供的用户搜索信息,通过正文抽取、特征项提取、关注度计算等步骤,实现面向内容分析的网页理论用户关注度的计算,最后对150条网页进行实验和回归分析.结果表明,特征词提取的最佳个数为3,理论用户关注度与实际用户关注度(点击量)的相关系数达0.8以上,说明该方法具有一定的准确性.
針對海量的互聯網信息,提齣一種計算網頁理論用戶關註度的方法,以期提高網絡信息搜索的效率,改進搜索排名的準確性.本文以中文論罈的新聞網頁為研究對象,利用百度指數提供的用戶搜索信息,通過正文抽取、特徵項提取、關註度計算等步驟,實現麵嚮內容分析的網頁理論用戶關註度的計算,最後對150條網頁進行實驗和迴歸分析.結果錶明,特徵詞提取的最佳箇數為3,理論用戶關註度與實際用戶關註度(點擊量)的相關繫數達0.8以上,說明該方法具有一定的準確性.
침대해량적호련망신식,제출일충계산망혈이론용호관주도적방법,이기제고망락신식수색적효솔,개진수색배명적준학성.본문이중문론단적신문망혈위연구대상,이용백도지수제공적용호수색신식,통과정문추취、특정항제취、관주도계산등보취,실현면향내용분석적망혈이론용호관주도적계산,최후대150조망혈진행실험화회귀분석.결과표명,특정사제취적최가개수위3,이론용호관주도여실제용호관주도(점격량)적상관계수체0.8이상,설명해방법구유일정적준학성.