计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2011年
10期
168-172
,共5页
概念检索%模糊粗糙集%互信息%语义相似度
概唸檢索%模糊粗糙集%互信息%語義相似度
개념검색%모호조조집%호신식%어의상사도
关于提高文献的检索效率,在科技文献检索过程中,传统的基于关键词匹配的检索方法缺乏对知识的理解和处理,只能检索出包含关键词的文献,而不能检索出与关键词语义相似的文献,因而检索结果在查全率和查准率都无法满足检索者的要求.将模糊粗糙集理论引入信息检索当中,对信息检索模型的缺陷进行了改进.首先用传统的互信息函数计算标引词之间的语义关联权重,构建出模糊近似空间;然后用TF - IDF方法获得文档的模糊向量表示,在计算标引词重要度权重时,不但考虑了标引词出现的频度,还考虑位置因素,查询的模糊向量表示完全由用户的兴趣确定;最后用模糊近似空间对关键词进行概念扩展,挖掘出相似概念类,计算文档和查询模糊表示的上、下近似集,文档和查询的匹配不再是关键词匹配,而是利用布尔逻辑的合取、析取公式对上、下近似集进行模糊匹配,并返回按相似度值排序的检索结果.仿真测试表明,方法能提高科技文档检索的性能,能对科技文献进行概念意义上的检索.
關于提高文獻的檢索效率,在科技文獻檢索過程中,傳統的基于關鍵詞匹配的檢索方法缺乏對知識的理解和處理,隻能檢索齣包含關鍵詞的文獻,而不能檢索齣與關鍵詞語義相似的文獻,因而檢索結果在查全率和查準率都無法滿足檢索者的要求.將模糊粗糙集理論引入信息檢索噹中,對信息檢索模型的缺陷進行瞭改進.首先用傳統的互信息函數計算標引詞之間的語義關聯權重,構建齣模糊近似空間;然後用TF - IDF方法穫得文檔的模糊嚮量錶示,在計算標引詞重要度權重時,不但攷慮瞭標引詞齣現的頻度,還攷慮位置因素,查詢的模糊嚮量錶示完全由用戶的興趣確定;最後用模糊近似空間對關鍵詞進行概唸擴展,挖掘齣相似概唸類,計算文檔和查詢模糊錶示的上、下近似集,文檔和查詢的匹配不再是關鍵詞匹配,而是利用佈爾邏輯的閤取、析取公式對上、下近似集進行模糊匹配,併返迴按相似度值排序的檢索結果.倣真測試錶明,方法能提高科技文檔檢索的性能,能對科技文獻進行概唸意義上的檢索.
관우제고문헌적검색효솔,재과기문헌검색과정중,전통적기우관건사필배적검색방법결핍대지식적리해화처리,지능검색출포함관건사적문헌,이불능검색출여관건사어의상사적문헌,인이검색결과재사전솔화사준솔도무법만족검색자적요구.장모호조조집이론인입신식검색당중,대신식검색모형적결함진행료개진.수선용전통적호신식함수계산표인사지간적어의관련권중,구건출모호근사공간;연후용TF - IDF방법획득문당적모호향량표시,재계산표인사중요도권중시,불단고필료표인사출현적빈도,환고필위치인소,사순적모호향량표시완전유용호적흥취학정;최후용모호근사공간대관건사진행개념확전,알굴출상사개념류,계산문당화사순모호표시적상、하근사집,문당화사순적필배불재시관건사필배,이시이용포이라집적합취、석취공식대상、하근사집진행모호필배,병반회안상사도치배서적검색결과.방진측시표명,방법능제고과기문당검색적성능,능대과기문헌진행개념의의상적검색.