计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2015年
4期
252-255
,共4页
不确定数据流%聚类%概率相似度%密度%离群点
不確定數據流%聚類%概率相似度%密度%離群點
불학정수거류%취류%개솔상사도%밀도%리군점
Uncertain data streams%Clustering%Probability similarity%Density%Outlier
针对不确定数据流聚类算法———EMicro在聚类结果的精确性和聚类中数据的概率相似度方面的不足,提出一种新基于存在级的不确定数据流算法———UDsStream。该算法通过设置概率阈值,将不确定性高的点和不确定性低的点分开处理,提高聚类结果的准确性和聚类中数据概率相似度。同时引入窗口和密度的方法,设置动态密度阈值,能够动态掌握数据流的分布特征,使聚类过程有更好的灵活性。实验结果证明,与EMicro相比,UDsStream算法聚类效果更好。
針對不確定數據流聚類算法———EMicro在聚類結果的精確性和聚類中數據的概率相似度方麵的不足,提齣一種新基于存在級的不確定數據流算法———UDsStream。該算法通過設置概率閾值,將不確定性高的點和不確定性低的點分開處理,提高聚類結果的準確性和聚類中數據概率相似度。同時引入窗口和密度的方法,設置動態密度閾值,能夠動態掌握數據流的分佈特徵,使聚類過程有更好的靈活性。實驗結果證明,與EMicro相比,UDsStream算法聚類效果更好。
침대불학정수거류취류산법———EMicro재취류결과적정학성화취류중수거적개솔상사도방면적불족,제출일충신기우존재급적불학정수거류산법———UDsStream。해산법통과설치개솔역치,장불학정성고적점화불학정성저적점분개처리,제고취류결과적준학성화취류중수거개솔상사도。동시인입창구화밀도적방법,설치동태밀도역치,능구동태장악수거류적분포특정,사취류과정유경호적령활성。실험결과증명,여EMicro상비,UDsStream산법취류효과경호。
For the deficiencies of uncertain data stream clustering algorithm — EMicro in accuracy of clustering results and in probability similarity of data in clustering,we present a new existing level-based uncertain data stream algorithm — UDsStream.By setting the probability threshold,the algorithm separates the processing of the points with high uncertainty and the points with low uncertainty to improve the accuracy of clustering results and the probability similarity of clustering data.At the same time the window and density methods are introduced,by setting the dynamic density threshold the distribution feature of data stream can be dynamically handled,so makes the clustering process have better flexibility.Experimental results show that compared with EMicro,the UDsStream algorithm has better clustering effect.