哈尔滨工业大学学报
哈爾濱工業大學學報
합이빈공업대학학보
JOURNAL OF HARBIN INSTITUTE OF TECHNOLOGY
2008年
7期
1094-1098
,共5页
岳峰%孙亮%王宽全%王永吉%左旺孟
嶽峰%孫亮%王寬全%王永吉%左旺孟
악봉%손량%왕관전%왕영길%좌왕맹
搜索引擎%查询分类%语义词典%基于主题的Web信息采集
搜索引擎%查詢分類%語義詞典%基于主題的Web信息採集
수색인경%사순분류%어의사전%기우주제적Web신식채집
为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrap-ping,由某个主题的少量关键词逐步扩充,最终得到该主题的语义词典及词典中每个单词的相对词频.Web中信息的冗余和各主题语义上的差别使各主题的语义词典中单词的种类和数量存在很大差异,这种差异可以用来对用户的搜索查询进行分类.实验结果表明,利用语义词典可以较准确地将用户的查询分类,同时该分类方法基本上不需要人工介入,且可适应搜索查询覆盖面广和实时性强的特点,较好地解决了搜索查询分类的问题.
為解決傳統的文檔分類方法和手工分類方法都不適宜于處理查詢分類的問題,提齣瞭一種基于Web的自動構建特定主題的語義詞典的方法來分類搜索查詢,通過基于主題的Web信息採集和bootstrap-ping,由某箇主題的少量關鍵詞逐步擴充,最終得到該主題的語義詞典及詞典中每箇單詞的相對詞頻.Web中信息的冗餘和各主題語義上的差彆使各主題的語義詞典中單詞的種類和數量存在很大差異,這種差異可以用來對用戶的搜索查詢進行分類.實驗結果錶明,利用語義詞典可以較準確地將用戶的查詢分類,同時該分類方法基本上不需要人工介入,且可適應搜索查詢覆蓋麵廣和實時性彊的特點,較好地解決瞭搜索查詢分類的問題.
위해결전통적문당분류방법화수공분류방법도불괄의우처리사순분류적문제,제출료일충기우Web적자동구건특정주제적어의사전적방법래분류수색사순,통과기우주제적Web신식채집화bootstrap-ping,유모개주제적소량관건사축보확충,최종득도해주제적어의사전급사전중매개단사적상대사빈.Web중신식적용여화각주제어의상적차별사각주제적어의사전중단사적충류화수량존재흔대차이,저충차이가이용래대용호적수색사순진행분류.실험결과표명,이용어의사전가이교준학지장용호적사순분류,동시해분류방법기본상불수요인공개입,차가괄응수색사순복개면엄화실시성강적특점,교호지해결료수색사순분류적문제.