山东大学学报(理学版)
山東大學學報(理學版)
산동대학학보(이학판)
JOURNAL OF SHANDONG UNIVERSITY(NATURAL SCIENCE)
2006年
3期
76-80
,共5页
胡俊刚%董守斌%陈晓志%张元丰
鬍俊剛%董守斌%陳曉誌%張元豐
호준강%동수빈%진효지%장원봉
入口页面检索%URL类型优先级%信息检索
入口頁麵檢索%URL類型優先級%信息檢索
입구혈면검색%URL류형우선급%신식검색
入口页面(主页)查询结果只有一个,并且用户的查询词常常是简短的页面名称,由于它要求更高的精准度,一般认为是较为困难的.依据语言模型分析,挖掘出对中文入口页面(entry page)检索有意义的查询域作为基准检索的内容域,同时考虑到非内容网页优先级(URL-type等)特征的重要性,建立综合内容域和非内容网页特征的检索模型.通过URL类型优先级(URL-type prior)的概率统计,发现入口页面和其相关的子页面之间存在比较大的联系.据此提出基于相关子页面的入口页面提取算法PERS(page extracted from relevant sub-page).对比实验数据表明,PERS算法对检索的性能有较大提高.
入口頁麵(主頁)查詢結果隻有一箇,併且用戶的查詢詞常常是簡短的頁麵名稱,由于它要求更高的精準度,一般認為是較為睏難的.依據語言模型分析,挖掘齣對中文入口頁麵(entry page)檢索有意義的查詢域作為基準檢索的內容域,同時攷慮到非內容網頁優先級(URL-type等)特徵的重要性,建立綜閤內容域和非內容網頁特徵的檢索模型.通過URL類型優先級(URL-type prior)的概率統計,髮現入口頁麵和其相關的子頁麵之間存在比較大的聯繫.據此提齣基于相關子頁麵的入口頁麵提取算法PERS(page extracted from relevant sub-page).對比實驗數據錶明,PERS算法對檢索的性能有較大提高.
입구혈면(주혈)사순결과지유일개,병차용호적사순사상상시간단적혈면명칭,유우타요구경고적정준도,일반인위시교위곤난적.의거어언모형분석,알굴출대중문입구혈면(entry page)검색유의의적사순역작위기준검색적내용역,동시고필도비내용망혈우선급(URL-type등)특정적중요성,건립종합내용역화비내용망혈특정적검색모형.통과URL류형우선급(URL-type prior)적개솔통계,발현입구혈면화기상관적자혈면지간존재비교대적련계.거차제출기우상관자혈면적입구혈면제취산법PERS(page extracted from relevant sub-page).대비실험수거표명,PERS산법대검색적성능유교대제고.