中国工程科学
中國工程科學
중국공정과학
ENGINEERING SCIENCE
2009年
2期
82-87
,共6页
徐雪松%宋东明%张谞%许满武%刘凤玉
徐雪鬆%宋東明%張谞%許滿武%劉鳳玉
서설송%송동명%장서%허만무%류봉옥
流形学习%离群点检测%高维数据%维数约减%离群数据
流形學習%離群點檢測%高維數據%維數約減%離群數據
류형학습%리군점검측%고유수거%유수약감%리군수거
为了提高高维数据集合离群数据挖掘效率,提出了一种基于流形学习的离群点检测算法.局部线性嵌入(locally linear embedding,LEE)算法是流形学习中有效的非线性降维方法,它的优势在于只定义唯一的参数,即邻域数.根据LLE算法的思想寻找样本数据的内在嵌入分布,并通过邻域数选取和降维后数据点之间的距离调整,提高了数据集中离群点发现效率,同时利用离群点权值判别式进行权值数据判定,根据权值的大小标识出数据集中的离群点,仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点.与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为离群点检测问题的机器学习提供了一条新的途径.
為瞭提高高維數據集閤離群數據挖掘效率,提齣瞭一種基于流形學習的離群點檢測算法.跼部線性嵌入(locally linear embedding,LEE)算法是流形學習中有效的非線性降維方法,它的優勢在于隻定義唯一的參數,即鄰域數.根據LLE算法的思想尋找樣本數據的內在嵌入分佈,併通過鄰域數選取和降維後數據點之間的距離調整,提高瞭數據集中離群點髮現效率,同時利用離群點權值判彆式進行權值數據判定,根據權值的大小標識齣數據集中的離群點,倣真實驗的結果錶明瞭該方法能夠有效地髮現高維數據集中的離群點.與此同時,該算法具有參數估計簡單、參數影響不大等優點,該算法為離群點檢測問題的機器學習提供瞭一條新的途徑.
위료제고고유수거집합리군수거알굴효솔,제출료일충기우류형학습적리군점검측산법.국부선성감입(locally linear embedding,LEE)산법시류형학습중유효적비선성강유방법,타적우세재우지정의유일적삼수,즉린역수.근거LLE산법적사상심조양본수거적내재감입분포,병통과린역수선취화강유후수거점지간적거리조정,제고료수거집중리군점발현효솔,동시이용리군점권치판별식진행권치수거판정,근거권치적대소표식출수거집중적리군점,방진실험적결과표명료해방법능구유효지발현고유수거집중적리군점.여차동시,해산법구유삼수고계간단、삼수영향불대등우점,해산법위리군점검측문제적궤기학습제공료일조신적도경.