计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2008年
2期
199-201
,共3页
概率潜在语义分析%中文信息检索%索引技术%关键词抽取
概率潛在語義分析%中文信息檢索%索引技術%關鍵詞抽取
개솔잠재어의분석%중문신식검색%색인기술%관건사추취
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响.概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索.该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度.
傳統的信息檢索模型把詞看作孤立的單元,沒有攷慮自然語言中存在大量的同義詞、多義詞現象,對召迴率和準確率有不利的影響.概率潛在語義模型使用統計的方法建立"文檔-潛在語義-詞"之間概率分佈關繫併利用這種關繫進行檢索.該文將概率潛在語義模型用于中文信息檢索,實驗結果錶明,概率潛在語義模型相對于傳統的嚮量空間模型能夠顯著地提高檢索的平均精度.
전통적신식검색모형파사간작고립적단원,몰유고필자연어언중존재대량적동의사、다의사현상,대소회솔화준학솔유불리적영향.개솔잠재어의모형사용통계적방법건립"문당-잠재어의-사"지간개솔분포관계병이용저충관계진행검색.해문장개솔잠재어의모형용우중문신식검색,실험결과표명,개솔잠재어의모형상대우전통적향량공간모형능구현저지제고검색적평균정도.