计算机应用与软件
計算機應用與軟件
계산궤응용여연건
Computer Applications and Software
2015年
7期
56-59,181
,共5页
高永兵%聂知秘%周环宇%钟振华
高永兵%聶知祕%週環宇%鐘振華
고영병%섭지비%주배우%종진화
相似度%特征词%同类词模板%事件归类
相似度%特徵詞%同類詞模闆%事件歸類
상사도%특정사%동류사모판%사건귀류
Similarity%Feature words%Similar word template%Event classification
为了提高个人微博相似度的精确性,实现事件的高效归类,提出一种基于改进的Jaccard相似度和余弦相似度的JS综合相似度算法.该算法采用改进的TF-IDF算法提取特征词及LDA(Latent Dirichlet Allocation)主题模型构造同类词模板,在此基础上计算个人微博相似度,最后利用K-means时序事件归类算法对个人微博进行归类.实验结果表明所提出的JS综合相似度算法比传统的相似度算法具有更高的精确度,在一定程度上提高了个人微博时序事件归类的准确性.
為瞭提高箇人微博相似度的精確性,實現事件的高效歸類,提齣一種基于改進的Jaccard相似度和餘絃相似度的JS綜閤相似度算法.該算法採用改進的TF-IDF算法提取特徵詞及LDA(Latent Dirichlet Allocation)主題模型構造同類詞模闆,在此基礎上計算箇人微博相似度,最後利用K-means時序事件歸類算法對箇人微博進行歸類.實驗結果錶明所提齣的JS綜閤相似度算法比傳統的相似度算法具有更高的精確度,在一定程度上提高瞭箇人微博時序事件歸類的準確性.
위료제고개인미박상사도적정학성,실현사건적고효귀류,제출일충기우개진적Jaccard상사도화여현상사도적JS종합상사도산법.해산법채용개진적TF-IDF산법제취특정사급LDA(Latent Dirichlet Allocation)주제모형구조동류사모판,재차기출상계산개인미박상사도,최후이용K-means시서사건귀류산법대개인미박진행귀류.실험결과표명소제출적JS종합상사도산법비전통적상사도산법구유경고적정학도,재일정정도상제고료개인미박시서사건귀류적준학성.