计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
5期
155-156,227
,共3页
高维数据%维度灾难%网格划分%子空间%相似度量
高維數據%維度災難%網格劃分%子空間%相似度量
고유수거%유도재난%망격화분%자공간%상사도량
High dimensional data%Curse of dimensionality%Grid-based dividing%Subspace%Similarity measurement
数据间的相似性度量是进一步分析数据集整体特性的一个重要基础.针对高维数据的相似性度量问题,提出了一种基于子空间的相似性度量方法.该方法先将高维空间进行基于网格的划分,然后在划分后的子空间内计算数据间的相似性.理论分析表明,在合理选定网格划分参数的前提下,该方法可有效减小"维度灾难"对高维数据相似性度量的影响.
數據間的相似性度量是進一步分析數據集整體特性的一箇重要基礎.針對高維數據的相似性度量問題,提齣瞭一種基于子空間的相似性度量方法.該方法先將高維空間進行基于網格的劃分,然後在劃分後的子空間內計算數據間的相似性.理論分析錶明,在閤理選定網格劃分參數的前提下,該方法可有效減小"維度災難"對高維數據相似性度量的影響.
수거간적상사성도량시진일보분석수거집정체특성적일개중요기출.침대고유수거적상사성도량문제,제출료일충기우자공간적상사성도량방법.해방법선장고유공간진행기우망격적화분,연후재화분후적자공간내계산수거간적상사성.이론분석표명,재합리선정망격화분삼수적전제하,해방법가유효감소"유도재난"대고유수거상사성도량적영향.
The similarity measurement among data is important for further analysis of the data set.Aiming at the similarity measurement of high dimensional data,the paper put forward a new method based on subspace.After dividing high dimensional space into grids,and computing the similarity among data in proper subspaees,the disturbance from the curse of dimensionality can he abated efficiently under the proper dividing parameters.