数据采集与处理
數據採集與處理
수거채집여처리
JOURNAL OF DATA ACQUISITION & PROCESSING
2009年
2期
212-217
,共6页
核密度估计%分箱规则%误差估计
覈密度估計%分箱規則%誤差估計
핵밀도고계%분상규칙%오차고계
棱密度估计的计算复杂度使其难以应用于大规模数据集的密度函数构造,采用分箱近似核估计是降低密度函数构造过程复杂度的有效手段.本文提出了一种修正简单分箱核估计误差的方法,该方法采用数据重心取代分箱中心作为数据的代表点,能够更准确反映数据的局部分布特征.经证明,该方法的拟合精度为D(δ4)(相对于窗宽),达到线性分箱核估计的水平.实验表明,修正的简单分箱核估计构造方法具有良好的时间效率和计算精度,能够运用于面向大规模数据集的聚类分析应用.
稜密度估計的計算複雜度使其難以應用于大規模數據集的密度函數構造,採用分箱近似覈估計是降低密度函數構造過程複雜度的有效手段.本文提齣瞭一種脩正簡單分箱覈估計誤差的方法,該方法採用數據重心取代分箱中心作為數據的代錶點,能夠更準確反映數據的跼部分佈特徵.經證明,該方法的擬閤精度為D(δ4)(相對于窗寬),達到線性分箱覈估計的水平.實驗錶明,脩正的簡單分箱覈估計構造方法具有良好的時間效率和計算精度,能夠運用于麵嚮大規模數據集的聚類分析應用.
릉밀도고계적계산복잡도사기난이응용우대규모수거집적밀도함수구조,채용분상근사핵고계시강저밀도함수구조과정복잡도적유효수단.본문제출료일충수정간단분상핵고계오차적방법,해방법채용수거중심취대분상중심작위수거적대표점,능구경준학반영수거적국부분포특정.경증명,해방법적의합정도위D(δ4)(상대우창관),체도선성분상핵고계적수평.실험표명,수정적간단분상핵고계구조방법구유량호적시간효솔화계산정도,능구운용우면향대규모수거집적취류분석응용.