统计与决策
統計與決策
통계여결책
2012年
11期
15~18
,共null页
杜子芳 刘亚文 徐一丁
杜子芳 劉亞文 徐一丁
두자방 류아문 서일정
聚类分析 距离 正交化
聚類分析 距離 正交化
취류분석 거리 정교화
聚类分析是三大多元统计分析方法之一,在许多领域都有广泛的应用,特别是在模式识别或无学习分类领域,发挥着不可替代的作用。除谱系聚类的ward方法外,聚类分析的关键依据是样品间距。样品间距完全脱胎于几何中的距离概念,但样品间距在几何距离三角可加性里所隐合的各变量量纲必须一致且必须正交的两个关键特性或许是有意或许是不经意地被模糊了。文章认为各变量量纲一致且正交应是聚类分析的强制要求,而主成分分析是正交化的最佳手段,应该成为聚类分析程序相关模块的缺省设置或唯一选项。
聚類分析是三大多元統計分析方法之一,在許多領域都有廣汎的應用,特彆是在模式識彆或無學習分類領域,髮揮著不可替代的作用。除譜繫聚類的ward方法外,聚類分析的關鍵依據是樣品間距。樣品間距完全脫胎于幾何中的距離概唸,但樣品間距在幾何距離三角可加性裏所隱閤的各變量量綱必鬚一緻且必鬚正交的兩箇關鍵特性或許是有意或許是不經意地被模糊瞭。文章認為各變量量綱一緻且正交應是聚類分析的彊製要求,而主成分分析是正交化的最佳手段,應該成為聚類分析程序相關模塊的缺省設置或唯一選項。
취류분석시삼대다원통계분석방법지일,재허다영역도유엄범적응용,특별시재모식식별혹무학습분류영역,발휘착불가체대적작용。제보계취류적ward방법외,취류분석적관건의거시양품간거。양품간거완전탈태우궤하중적거리개념,단양품간거재궤하거리삼각가가성리소은합적각변량량강필수일치차필수정교적량개관건특성혹허시유의혹허시불경의지피모호료。문장인위각변량량강일치차정교응시취류분석적강제요구,이주성분분석시정교화적최가수단,응해성위취류분석정서상관모괴적결성설치혹유일선항。