电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2011年
6期
1347-1352
,共6页
矢量感应%聚类%投影点%稀疏感应对象%均匀感应邻域
矢量感應%聚類%投影點%稀疏感應對象%均勻感應鄰域
시량감응%취류%투영점%희소감응대상%균균감응린역
从万有引力角度考虑,质点之间相互影响包括距离和方向两个方面.本文讨论数据之间的矢量感应,并将其应用于聚类算法ⅥCA.引入对象的标量感应函数和方向感应函数,提出矢量感应函数概念.并给出确定方向感应函数的两个方法:方向相似度法和累加法.将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域均匀感应程度,将与均匀感应核心对象均匀感应密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除了稀疏感应对象这类噪声,并且可以解决高维数据聚类边界区分不明显、密度分布不均、类边界噪声对象多的问题,提高了聚类精度.由于感应函数是一个泛化定义,算法具有通用性和可扩展性.将半结构化数据变换到欧式空间时,容易出现边界稀疏对象,算法可以有效处理噪声.因此,算法适用于大规模的高维数据集合,也可用于半结构化数据聚类.
從萬有引力角度攷慮,質點之間相互影響包括距離和方嚮兩箇方麵.本文討論數據之間的矢量感應,併將其應用于聚類算法ⅥCA.引入對象的標量感應函數和方嚮感應函數,提齣矢量感應函數概唸.併給齣確定方嚮感應函數的兩箇方法:方嚮相似度法和纍加法.將覈心對象鄰域中的對象投影,進行嚮量單位化,攷察覈心對象的鄰域均勻感應程度,將與均勻感應覈心對象均勻感應密度可達的對象聚成一箇簇.理論分析和實驗結果錶明,算法可以處理任意形狀的簇,有效地排除瞭稀疏感應對象這類譟聲,併且可以解決高維數據聚類邊界區分不明顯、密度分佈不均、類邊界譟聲對象多的問題,提高瞭聚類精度.由于感應函數是一箇汎化定義,算法具有通用性和可擴展性.將半結構化數據變換到歐式空間時,容易齣現邊界稀疏對象,算法可以有效處理譟聲.因此,算法適用于大規模的高維數據集閤,也可用于半結構化數據聚類.
종만유인력각도고필,질점지간상호영향포괄거리화방향량개방면.본문토론수거지간적시량감응,병장기응용우취류산법ⅥCA.인입대상적표량감응함수화방향감응함수,제출시량감응함수개념.병급출학정방향감응함수적량개방법:방향상사도법화루가법.장핵심대상린역중적대상투영,진행향량단위화,고찰핵심대상적린역균균감응정도,장여균균감응핵심대상균균감응밀도가체적대상취성일개족.이론분석화실험결과표명,산법가이처리임의형상적족,유효지배제료희소감응대상저류조성,병차가이해결고유수거취류변계구분불명현、밀도분포불균、류변계조성대상다적문제,제고료취류정도.유우감응함수시일개범화정의,산법구유통용성화가확전성.장반결구화수거변환도구식공간시,용역출현변계희소대상,산법가이유효처리조성.인차,산법괄용우대규모적고유수거집합,야가용우반결구화수거취류.