计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2014年
5期
1766-1771
,共6页
唐静笑%吕学强%柳成洋%李涵
唐靜笑%呂學彊%柳成洋%李涵
당정소%려학강%류성양%리함
查询串%双层模型%贝叶斯%领域词典%域名可信度
查詢串%雙層模型%貝葉斯%領域詞典%域名可信度
사순천%쌍층모형%패협사%영역사전%역명가신도
query string%bi-level model%Bayes theorem%domain dictionary%domain name credibility
利用搜索日志中查询串自身信息和用户点击信息,提出了双层模型识别领域查询串的方法.第一层模型采用贝叶斯法则和词典相结合的方法对查询串进行识别;针对搜索日志查询串内容简短、信息量少的特点,提出基于域名可信度的第二层识别模型.在搜狗2012版用户查询日志上对双层模型进行了开放测试,召回率和准确率分别达到了85.2%和94.6%,实验结果表明了该方法的有效性.
利用搜索日誌中查詢串自身信息和用戶點擊信息,提齣瞭雙層模型識彆領域查詢串的方法.第一層模型採用貝葉斯法則和詞典相結閤的方法對查詢串進行識彆;針對搜索日誌查詢串內容簡短、信息量少的特點,提齣基于域名可信度的第二層識彆模型.在搜狗2012版用戶查詢日誌上對雙層模型進行瞭開放測試,召迴率和準確率分彆達到瞭85.2%和94.6%,實驗結果錶明瞭該方法的有效性.
이용수색일지중사순천자신신식화용호점격신식,제출료쌍층모형식별영역사순천적방법.제일층모형채용패협사법칙화사전상결합적방법대사순천진행식별;침대수색일지사순천내용간단、신식량소적특점,제출기우역명가신도적제이층식별모형.재수구2012판용호사순일지상대쌍층모형진행료개방측시,소회솔화준학솔분별체도료85.2%화94.6%,실험결과표명료해방법적유효성.