计算机应用与软件
計算機應用與軟件
계산궤응용여연건
Computer Applications and Software
2015年
7期
39-42,85
,共5页
XML文档%DOM解析%路径特征%结构相似性%评价指标
XML文檔%DOM解析%路徑特徵%結構相似性%評價指標
XML문당%DOM해석%로경특정%결구상사성%평개지표
XML documents%DOM parsing%Path feature%Structural similarity%Evaluating indicator
针对现有XML文档结构相似性度量方法大多不能完全反映XML文档的结构特征,相似度计算结果精确度不高,导致聚类效果不够理想的问题,提出一种改进的相似度计算方法SSPF(Similarity based on Sequence,Position and Frequency).该方法充分利用提取的DOM树路径信息,对树路径间序列和位置的相似度计算进行优化,并考虑了路径频率对相似度的影响,使得文档间的相似性更为合理.实验结果表明,SSPF方法具有更加准确的相似度计算结果,聚类的各项评价指标均有所提高.
針對現有XML文檔結構相似性度量方法大多不能完全反映XML文檔的結構特徵,相似度計算結果精確度不高,導緻聚類效果不夠理想的問題,提齣一種改進的相似度計算方法SSPF(Similarity based on Sequence,Position and Frequency).該方法充分利用提取的DOM樹路徑信息,對樹路徑間序列和位置的相似度計算進行優化,併攷慮瞭路徑頻率對相似度的影響,使得文檔間的相似性更為閤理.實驗結果錶明,SSPF方法具有更加準確的相似度計算結果,聚類的各項評價指標均有所提高.
침대현유XML문당결구상사성도량방법대다불능완전반영XML문당적결구특정,상사도계산결과정학도불고,도치취류효과불구이상적문제,제출일충개진적상사도계산방법SSPF(Similarity based on Sequence,Position and Frequency).해방법충분이용제취적DOM수로경신식,대수로경간서렬화위치적상사도계산진행우화,병고필료로경빈솔대상사도적영향,사득문당간적상사성경위합리.실험결과표명,SSPF방법구유경가준학적상사도계산결과,취류적각항평개지표균유소제고.