吉林大学学报(信息科学版)
吉林大學學報(信息科學版)
길림대학학보(신식과학판)
JOURNAL OF JILIN UNIVERSITY(INFORMATION SCIENCE EDITION)
2007年
5期
569-576
,共8页
文本信息检索%相关性%相似度%代数模型%召回率%准确率
文本信息檢索%相關性%相似度%代數模型%召迴率%準確率
문본신식검색%상관성%상사도%대수모형%소회솔%준학솔
为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型--代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念.结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点.为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur.
為瞭比較各類模型的性能,研究進一步改進文本信息檢索各類模型的可能方法,綜閤已有的試驗和研究報告,概述瞭文本信息檢索模型中一類模型--代數模型概唸和研究現狀,併分析瞭目前文本信息檢索的相關性、相似度、召迴率、準確率等概唸.結果錶明,這幾箇模型儘管來源于神經網絡、嚮量空間等不同的思想,廣義嚮量空間模型、潛在語義標引模型的計算複雜度比嚮量空間模型高,但此類模型依據評測在準確率和召迴率上相近,經典嚮量空間模型相對而言,有簡單、複雜度低和可作為檢索框架,而不僅僅是檢索模型的特點.為便于研究者研究、改進、評測信息檢索的代數模型,評價瞭權威的TREC(The Text Retrieval Conference)和兩箇代錶性的研究繫統Smart和Lemur.
위료비교각류모형적성능,연구진일보개진문본신식검색각류모형적가능방법,종합이유적시험화연구보고,개술료문본신식검색모형중일류모형--대수모형개념화연구현상,병분석료목전문본신식검색적상관성、상사도、소회솔、준학솔등개념.결과표명,저궤개모형진관래원우신경망락、향량공간등불동적사상,엄의향량공간모형、잠재어의표인모형적계산복잡도비향량공간모형고,단차류모형의거평측재준학솔화소회솔상상근,경전향량공간모형상대이언,유간단、복잡도저화가작위검색광가,이불부부시검색모형적특점.위편우연구자연구、개진、평측신식검색적대수모형,평개료권위적TREC(The Text Retrieval Conference)화량개대표성적연구계통Smart화Lemur.