信息网络安全
信息網絡安全
신식망락안전
NETINFO SECURITY
2014年
5期
82-86
,共5页
信息检索%位置信息%DOM%LVSM
信息檢索%位置信息%DOM%LVSM
신식검색%위치신식%DOM%LVSM
information retrieval%location information%DOM%LVSM
向量空间模型是信息检索中的重要模型,传统的向量空间模型考虑了特征项在目标文档中的出现频率和文档频率,但并未考虑特征项出现在文本中的位置这一重要信息。针对这一问题,文章在将文档以文档对象模型表示的基础上,根据特征项出现的位置不同,对特征项的权重额外附加一个不同的系数,以反映不同位置上的特征项在表达文档主旨上的能力差异,以期改善返回文档的排序质量,改进用户的检索工作。通过模拟实验,验证了该方法相比于传统VSM在改进检索效果上的优势。
嚮量空間模型是信息檢索中的重要模型,傳統的嚮量空間模型攷慮瞭特徵項在目標文檔中的齣現頻率和文檔頻率,但併未攷慮特徵項齣現在文本中的位置這一重要信息。針對這一問題,文章在將文檔以文檔對象模型錶示的基礎上,根據特徵項齣現的位置不同,對特徵項的權重額外附加一箇不同的繫數,以反映不同位置上的特徵項在錶達文檔主旨上的能力差異,以期改善返迴文檔的排序質量,改進用戶的檢索工作。通過模擬實驗,驗證瞭該方法相比于傳統VSM在改進檢索效果上的優勢。
향량공간모형시신식검색중적중요모형,전통적향량공간모형고필료특정항재목표문당중적출현빈솔화문당빈솔,단병미고필특정항출현재문본중적위치저일중요신식。침대저일문제,문장재장문당이문당대상모형표시적기출상,근거특정항출현적위치불동,대특정항적권중액외부가일개불동적계수,이반영불동위치상적특정항재표체문당주지상적능력차이,이기개선반회문당적배서질량,개진용호적검색공작。통과모의실험,험증료해방법상비우전통VSM재개진검색효과상적우세。
Vector Space Model is a important model in information retrieval, traditional Vector Space Model take feature term frequence and document frequence into account, regardless of the location feature term appears, which is a signiifcant information. Considering the problem above, after turn document into Document Object Model, this paper add a ratio to weight of feature term based on different location it appears to inlfect different ability of feature term that appears in different location in expressing main idea of the document, thus improve ranking result of documents returned and users’ retrieving work. Simulation experiment manifests the advantage of the solution above over traditional VSM.