计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
1期
144-146,149
,共4页
地理标识语言(GML)结构聚类%最大频繁Induced子树%闭合频繁Induced子树
地理標識語言(GML)結構聚類%最大頻繁Induced子樹%閉閤頻繁Induced子樹
지리표식어언(GML)결구취류%최대빈번Induced자수%폐합빈번Induced자수
提出了一种基于频繁子树模式的GML文档结构聚类算法GCFS(GML Clustering based on Frequent Subtree patterns),与其他相关算法不同,该算法首先挖掘GML文档集合中的最大与闭合频繁Induced子树,并将其作为聚类特征,根据频繁子树的大小赋予不同的权值,采用余弦函数定义相似度,利用K-Means算法对聚类特征进行聚类.实验结果表明算法GCFS是有效的,具有较高的聚类效率,性能优于其他同类算法.
提齣瞭一種基于頻繁子樹模式的GML文檔結構聚類算法GCFS(GML Clustering based on Frequent Subtree patterns),與其他相關算法不同,該算法首先挖掘GML文檔集閤中的最大與閉閤頻繁Induced子樹,併將其作為聚類特徵,根據頻繁子樹的大小賦予不同的權值,採用餘絃函數定義相似度,利用K-Means算法對聚類特徵進行聚類.實驗結果錶明算法GCFS是有效的,具有較高的聚類效率,性能優于其他同類算法.
제출료일충기우빈번자수모식적GML문당결구취류산법GCFS(GML Clustering based on Frequent Subtree patterns),여기타상관산법불동,해산법수선알굴GML문당집합중적최대여폐합빈번Induced자수,병장기작위취류특정,근거빈번자수적대소부여불동적권치,채용여현함수정의상사도,이용K-Means산법대취류특정진행취류.실험결과표명산법GCFS시유효적,구유교고적취류효솔,성능우우기타동류산법.