新疆大学学报(自然科学版)
新疆大學學報(自然科學版)
신강대학학보(자연과학판)
XINJIANG UNIVERSITY JOURNAL(NATURAL SCIENCE EDITION)
2012年
2期
218-222
,共5页
李永可%吴悠%张太红%冯向萍%吴向前
李永可%吳悠%張太紅%馮嚮萍%吳嚮前
리영가%오유%장태홍%풍향평%오향전
维吾尔文文本分类%多元回归分析%特征提取
維吾爾文文本分類%多元迴歸分析%特徵提取
유오이문문본분류%다원회귀분석%특정제취
本文在对维文垃圾网页特征分析基础上,利用卡方检验方法提取网页特征,并采用最小二乘估计方法,设计了维吾尔文垃圾网页识别模型.为检测不同特征对模型性能的影响,本文分别对网页维文字符个数及关键词进行对比实验.结果表明,在特征包含网页维文字符长度,特征词个数在5~20个之间时,模型识别精确度达90%左右,网页维文字符个数在维吾尔文垃圾网页模型构建中具有重要作用.
本文在對維文垃圾網頁特徵分析基礎上,利用卡方檢驗方法提取網頁特徵,併採用最小二乘估計方法,設計瞭維吾爾文垃圾網頁識彆模型.為檢測不同特徵對模型性能的影響,本文分彆對網頁維文字符箇數及關鍵詞進行對比實驗.結果錶明,在特徵包含網頁維文字符長度,特徵詞箇數在5~20箇之間時,模型識彆精確度達90%左右,網頁維文字符箇數在維吾爾文垃圾網頁模型構建中具有重要作用.
본문재대유문랄급망혈특정분석기출상,이용잡방검험방법제취망혈특정,병채용최소이승고계방법,설계료유오이문랄급망혈식별모형.위검측불동특정대모형성능적영향,본문분별대망혈유문자부개수급관건사진행대비실험.결과표명,재특정포함망혈유문자부장도,특정사개수재5~20개지간시,모형식별정학도체90%좌우,망혈유문자부개수재유오이문랄급망혈모형구건중구유중요작용.