中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
3期
79-85
,共7页
同义词识别%用户行为%SimRank%Gradient Boost Decision Tree
同義詞識彆%用戶行為%SimRank%Gradient Boost Decision Tree
동의사식별%용호행위%SimRank%Gradient Boost Decision Tree
该文研究了电子商务领域同义词的自动识别问题.电子商务领域的同义词是指对同一事物或概念的不同表达,即在商品描述和检索中可以相互替换的词,针对该领域新词多、错别字多、近义词多的特点,提出基于用户行为的同义词识别方法.首先通过并列关系符号切分商品标题和基于SimRank思想聚集查询两种方法获取候选集合,进而荻取两词的字面特征以及标题、查询、点击等用户行为特征,然后借助Gradient Boost Decision Tree模型判断是否同义.实验表明同义词识别准确率达到56.52%.
該文研究瞭電子商務領域同義詞的自動識彆問題.電子商務領域的同義詞是指對同一事物或概唸的不同錶達,即在商品描述和檢索中可以相互替換的詞,針對該領域新詞多、錯彆字多、近義詞多的特點,提齣基于用戶行為的同義詞識彆方法.首先通過併列關繫符號切分商品標題和基于SimRank思想聚集查詢兩種方法穫取候選集閤,進而荻取兩詞的字麵特徵以及標題、查詢、點擊等用戶行為特徵,然後藉助Gradient Boost Decision Tree模型判斷是否同義.實驗錶明同義詞識彆準確率達到56.52%.
해문연구료전자상무영역동의사적자동식별문제.전자상무영역적동의사시지대동일사물혹개념적불동표체,즉재상품묘술화검색중가이상호체환적사,침대해영역신사다、착별자다、근의사다적특점,제출기우용호행위적동의사식별방법.수선통과병렬관계부호절분상품표제화기우SimRank사상취집사순량충방법획취후선집합,진이적취량사적자면특정이급표제、사순、점격등용호행위특정,연후차조Gradient Boost Decision Tree모형판단시부동의.실험표명동의사식별준학솔체도56.52%.