计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2009年
5期
1262-1266
,共5页
信息检索%信息过滤%文本特征抽取%TFIDF+%空间向量模型
信息檢索%信息過濾%文本特徵抽取%TFIDF+%空間嚮量模型
신식검색%신식과려%문본특정추취%TFIDF+%공간향량모형
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法.该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户.从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性.实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量.
為瞭提高文本信息檢索的查準率和縮短檢索時間,提齣瞭一種基于多策略的文檔過濾算法.該算法根據潛在詞性特徵初步生成候選詞,採用基于標題的特徵詞髮現擴充候選詞,使用改進的TFIDF對候選詞的特徵進行加權閤成,去除不符閤條件詞,求齣用戶需求嚮量和待過濾文檔嚮量的相似度,將相似度大于一定閾值的文檔提供給用戶.從實驗參數確定、策略對結果的影響兩方麵論證瞭文檔信息過濾算法的可行性.實驗結果錶明,基于多策略的文檔信息過濾算法能夠提高信息檢索的查準率,改善信息檢索的質量.
위료제고문본신식검색적사준솔화축단검색시간,제출료일충기우다책략적문당과려산법.해산법근거잠재사성특정초보생성후선사,채용기우표제적특정사발현확충후선사,사용개진적TFIDF대후선사적특정진행가권합성,거제불부합조건사,구출용호수구향량화대과려문당향량적상사도,장상사도대우일정역치적문당제공급용호.종실험삼수학정、책략대결과적영향량방면론증료문당신식과려산법적가행성.실험결과표명,기우다책략적문당신식과려산법능구제고신식검색적사준솔,개선신식검색적질량.