新疆大学学报(自然科学版)
新疆大學學報(自然科學版)
신강대학학보(자연과학판)
XINJIANG UNIVERSITY JOURNAL(NATURAL SCIENCE EDITION)
2015年
2期
221-226
,共6页
亚力青·阿里玛斯%哈力旦·阿布都热依木%陈洋
亞力青·阿裏瑪斯%哈力旦·阿佈都熱依木%陳洋
아력청·아리마사%합력단·아포도열의목%진양
文本过滤%维吾尔文本%向量空间模型%相似度%用户模板
文本過濾%維吾爾文本%嚮量空間模型%相似度%用戶模闆
문본과려%유오이문본%향량공간모형%상사도%용호모판
text filtering%Uyghur text%vector space model%similarity%user templates
在大规模的文本信息检索技术背景下,提出了维吾尔文本过滤模型及实现方法。文本表示模型在向量空间模型(VSM)的基础上,采用三种相似度度量方法计算输入文本与用户模板相似度作为决策手段,对维吾尔文本进行了过滤实验。对于维吾尔文特征空间的高维性问题,通过词干提取,停用词过滤,特征选择等方法降低了特征空间维数。最后利用准确率(Precision)和召回率(Recall)综合函数F1值作为评价指标分析了维吾尔文文本过滤实验结果。
在大規模的文本信息檢索技術揹景下,提齣瞭維吾爾文本過濾模型及實現方法。文本錶示模型在嚮量空間模型(VSM)的基礎上,採用三種相似度度量方法計算輸入文本與用戶模闆相似度作為決策手段,對維吾爾文本進行瞭過濾實驗。對于維吾爾文特徵空間的高維性問題,通過詞榦提取,停用詞過濾,特徵選擇等方法降低瞭特徵空間維數。最後利用準確率(Precision)和召迴率(Recall)綜閤函數F1值作為評價指標分析瞭維吾爾文文本過濾實驗結果。
재대규모적문본신식검색기술배경하,제출료유오이문본과려모형급실현방법。문본표시모형재향량공간모형(VSM)적기출상,채용삼충상사도도량방법계산수입문본여용호모판상사도작위결책수단,대유오이문본진행료과려실험。대우유오이문특정공간적고유성문제,통과사간제취,정용사과려,특정선택등방법강저료특정공간유수。최후이용준학솔(Precision)화소회솔(Recall)종합함수F1치작위평개지표분석료유오이문문본과려실험결과。
Under the background of large-scale text information retrieval technology, presented Uyghur text filtering model and implementation method. On the basis of vector space model (VSM), using three methods of similarity measure to calculate the similarity of input text with user templates as decision-making tools for Uyghur text filtering experiments. As to the problem of high dimensionality feature space of Uyghur texts, by stemming, stop words filtering, feature selection methods to reduce the dimension of feature space. Finally, analysis the text filtering results by value of F1 presented by Precision and Recall.