四川大学学报(自然科学版)
四川大學學報(自然科學版)
사천대학학보(자연과학판)
Journal of Sichuan University(Natural Science Edition)
2015年
4期
755-763
,共9页
王桂华%陈黎%于中华%丁革建%罗谦
王桂華%陳黎%于中華%丁革建%囉謙
왕계화%진려%우중화%정혁건%라겸
查询推荐%个性化%LDA模型%浏览历史
查詢推薦%箇性化%LDA模型%瀏覽歷史
사순추천%개성화%LDA모형%류람역사
Query recommendation%Personalization%LDA%Browsing history
现代搜索引擎普遍采用简单的关键词形式来表达查询,这为用户带来便利的同时也增加了准确获取信息的难度.搜索引擎很难基于少量的几个关键词准确捕捉用户的信息需求.查询推荐作为缓解上述问题的关键技术,已经开始应用于目前主流的搜索引擎.然而,绝大多数现有的查询推荐技术基于群体智慧,以搜索引擎日志为数据源,从中挖掘用户群体在构造查询方面的习性及查询之间的语义关联性,未考虑不同用户个性化的信息喜好,而且在搜索引擎服务器端进行查询推荐计算也会影响搜索引擎的响应效率和查询吞吐率.为此,本文提出一种运行于客户端的个性化查询推荐策略,该策略以用户浏览历史为数据源,采用LDA模型,并从中学习用户的信息喜好,在此基础上利用原始查询被主题模型生成的概率确定用户的查询意图,以词条与查询意图之间的关联来度量词条作为扩展查询被推荐的强度,最后选择Top N强度最强的词条作为查询推荐的结果.以人工标注的测试数据对本文所提出的算法进行了实验验证,结果表明,该算法在推荐扩展查询的准确率方面明显优于单纯基于词条与原始查询语义相关的方法.
現代搜索引擎普遍採用簡單的關鍵詞形式來錶達查詢,這為用戶帶來便利的同時也增加瞭準確穫取信息的難度.搜索引擎很難基于少量的幾箇關鍵詞準確捕捉用戶的信息需求.查詢推薦作為緩解上述問題的關鍵技術,已經開始應用于目前主流的搜索引擎.然而,絕大多數現有的查詢推薦技術基于群體智慧,以搜索引擎日誌為數據源,從中挖掘用戶群體在構造查詢方麵的習性及查詢之間的語義關聯性,未攷慮不同用戶箇性化的信息喜好,而且在搜索引擎服務器耑進行查詢推薦計算也會影響搜索引擎的響應效率和查詢吞吐率.為此,本文提齣一種運行于客戶耑的箇性化查詢推薦策略,該策略以用戶瀏覽歷史為數據源,採用LDA模型,併從中學習用戶的信息喜好,在此基礎上利用原始查詢被主題模型生成的概率確定用戶的查詢意圖,以詞條與查詢意圖之間的關聯來度量詞條作為擴展查詢被推薦的彊度,最後選擇Top N彊度最彊的詞條作為查詢推薦的結果.以人工標註的測試數據對本文所提齣的算法進行瞭實驗驗證,結果錶明,該算法在推薦擴展查詢的準確率方麵明顯優于單純基于詞條與原始查詢語義相關的方法.
현대수색인경보편채용간단적관건사형식래표체사순,저위용호대래편리적동시야증가료준학획취신식적난도.수색인경흔난기우소량적궤개관건사준학포착용호적신식수구.사순추천작위완해상술문제적관건기술,이경개시응용우목전주류적수색인경.연이,절대다수현유적사순추천기술기우군체지혜,이수색인경일지위수거원,종중알굴용호군체재구조사순방면적습성급사순지간적어의관련성,미고필불동용호개성화적신식희호,이차재수색인경복무기단진행사순추천계산야회영향수색인경적향응효솔화사순탄토솔.위차,본문제출일충운행우객호단적개성화사순추천책략,해책략이용호류람역사위수거원,채용LDA모형,병종중학습용호적신식희호,재차기출상이용원시사순피주제모형생성적개솔학정용호적사순의도,이사조여사순의도지간적관련래도량사조작위확전사순피추천적강도,최후선택Top N강도최강적사조작위사순추천적결과.이인공표주적측시수거대본문소제출적산법진행료실험험증,결과표명,해산법재추천확전사순적준학솔방면명현우우단순기우사조여원시사순어의상관적방법.