工业控制计算机
工業控製計算機
공업공제계산궤
INDUSTRY CONTROL COMPUTER
2014年
6期
116-117,120
,共3页
标签%聚类%社交网络%权重%共现
標籤%聚類%社交網絡%權重%共現
표첨%취류%사교망락%권중%공현
tag%cIustering%SNS%weight%co-occurrence
在社交网络中,标签对资源的描述在一定程度上存在着准确性不高和结构紊乱等现象。为了改善这些问题,提出了一种新的基于权重与共现的标签凝聚型层次聚类算法:首先在社交网络中收集网页标签的相关数据,然后计算标签与网页的权重,再计算标签共现的相似度,并以此为初始数据进行凝聚型层次聚类,最后把聚类结果与人工分类结果比较,计算出精确度、召回率以及加权调和平均数F1。通过实验结果体现了这种算法的可行性。
在社交網絡中,標籤對資源的描述在一定程度上存在著準確性不高和結構紊亂等現象。為瞭改善這些問題,提齣瞭一種新的基于權重與共現的標籤凝聚型層次聚類算法:首先在社交網絡中收集網頁標籤的相關數據,然後計算標籤與網頁的權重,再計算標籤共現的相似度,併以此為初始數據進行凝聚型層次聚類,最後把聚類結果與人工分類結果比較,計算齣精確度、召迴率以及加權調和平均數F1。通過實驗結果體現瞭這種算法的可行性。
재사교망락중,표첨대자원적묘술재일정정도상존재착준학성불고화결구문란등현상。위료개선저사문제,제출료일충신적기우권중여공현적표첨응취형층차취류산법:수선재사교망락중수집망혈표첨적상관수거,연후계산표첨여망혈적권중,재계산표첨공현적상사도,병이차위초시수거진행응취형층차취류,최후파취류결과여인공분류결과비교,계산출정학도、소회솔이급가권조화평균수F1。통과실험결과체현료저충산법적가행성。
In the SNS (SociaI Networking Service),there are some phenomena,which tag description of resources is not high and the structure is mussy.In order to improve these probIems,a new kind of condensed type hierarchy cIustering aIgorithm of the tag based on weight and co-occurrence is proposed:first,coI ect the tags from the SNS.Then caIcuIate the weight of tags with the page.CaIcuIate the simiIarity of the tags' co-occurrence,and use them as the initiaI data in type hierarchy cIustering.FinaI y,caIcuIate the accuracy,recaI rate and the weighted harmonic mean F1 through comparing the cIustering resuIts with the resuIts of manuaI cIassification.There is a good effect through the experiment of this new aIgorithm.