山东工业技术
山東工業技術
산동공업기술
Shandong Industrial Technology
2015年
8期
132-133
,共2页
垃圾标签%Folksonomylssvm%剪切法
垃圾標籤%Folksonomylssvm%剪切法
랄급표첨%Folksonomylssvm%전절법
为了解决 Folksonomy 存在垃圾标签的问题,提出垃圾标签检测模型.利用向量空间模型表征用户特征,再用支持向量机将 Folksonomy 用户二分类.通过检测出隐藏在正常用户群体中的垃圾投放人,以此减少垃圾标签数量.垃圾标签数据集具有数量大,纬度高的特点.面对传统svm算法处理高维大规模数据集上过于复杂,存在速度和精度的瓶颈的问题,笔者曾经提出用lssvm算法进行垃圾标签检测处理,取得一定的效果.但是,lssvm算法本身也存在稀疏性以及处理重要数据点不敏感的问题,所以针对这点,提出了用剪切法进行解决,通过实验表明,改进的LSSVM提高了建模的精度,而稀疏化的处理虽然对精度有一定影响,但大大减少了训练数据量,从而有效减轻了计算负担,使快速性得到了保障.
為瞭解決 Folksonomy 存在垃圾標籤的問題,提齣垃圾標籤檢測模型.利用嚮量空間模型錶徵用戶特徵,再用支持嚮量機將 Folksonomy 用戶二分類.通過檢測齣隱藏在正常用戶群體中的垃圾投放人,以此減少垃圾標籤數量.垃圾標籤數據集具有數量大,緯度高的特點.麵對傳統svm算法處理高維大規模數據集上過于複雜,存在速度和精度的瓶頸的問題,筆者曾經提齣用lssvm算法進行垃圾標籤檢測處理,取得一定的效果.但是,lssvm算法本身也存在稀疏性以及處理重要數據點不敏感的問題,所以針對這點,提齣瞭用剪切法進行解決,通過實驗錶明,改進的LSSVM提高瞭建模的精度,而稀疏化的處理雖然對精度有一定影響,但大大減少瞭訓練數據量,從而有效減輕瞭計算負擔,使快速性得到瞭保障.
위료해결 Folksonomy 존재랄급표첨적문제,제출랄급표첨검측모형.이용향량공간모형표정용호특정,재용지지향량궤장 Folksonomy 용호이분류.통과검측출은장재정상용호군체중적랄급투방인,이차감소랄급표첨수량.랄급표첨수거집구유수량대,위도고적특점.면대전통svm산법처리고유대규모수거집상과우복잡,존재속도화정도적병경적문제,필자증경제출용lssvm산법진행랄급표첨검측처리,취득일정적효과.단시,lssvm산법본신야존재희소성이급처리중요수거점불민감적문제,소이침대저점,제출료용전절법진행해결,통과실험표명,개진적LSSVM제고료건모적정도,이희소화적처리수연대정도유일정영향,단대대감소료훈련수거량,종이유효감경료계산부담,사쾌속성득도료보장.