计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2015年
z1期
89-93
,共5页
特征选择%降维%多重假设检验
特徵選擇%降維%多重假設檢驗
특정선택%강유%다중가설검험
Feature selection%Dimension reduction%Multiple hypothesis testing
现有的特征降维方法大致可分为特征提取和特征选择.在特征提取过程中,数据中的原始特征通过某些数椐变换被映射到一个低维空间.提取出的特征尽管与原始特征相关,但不再具有原始特征的物理意义,即特征提取改变了原始数据的表达形式.与特征提取不同,特征选择则在原有的特征集中选择一个子集,选择出的特征子集中不再含有与数据分析任务相关性不大或冗余的那部分特征,其结果可能引起信息丢失.因而现有的数据降维方法几乎都不是保真降维,其降维后的数据仅适合特定的后续数据分析任务,因而只能算是特定数据分析任务的前期数据预处理.从多重假设检验方法的角度分析了高维数据保真降维的方法及研究的关键所在.
現有的特徵降維方法大緻可分為特徵提取和特徵選擇.在特徵提取過程中,數據中的原始特徵通過某些數椐變換被映射到一箇低維空間.提取齣的特徵儘管與原始特徵相關,但不再具有原始特徵的物理意義,即特徵提取改變瞭原始數據的錶達形式.與特徵提取不同,特徵選擇則在原有的特徵集中選擇一箇子集,選擇齣的特徵子集中不再含有與數據分析任務相關性不大或冗餘的那部分特徵,其結果可能引起信息丟失.因而現有的數據降維方法幾乎都不是保真降維,其降維後的數據僅適閤特定的後續數據分析任務,因而隻能算是特定數據分析任務的前期數據預處理.從多重假設檢驗方法的角度分析瞭高維數據保真降維的方法及研究的關鍵所在.
현유적특정강유방법대치가분위특정제취화특정선택.재특정제취과정중,수거중적원시특정통과모사수거변환피영사도일개저유공간.제취출적특정진관여원시특정상관,단불재구유원시특정적물리의의,즉특정제취개변료원시수거적표체형식.여특정제취불동,특정선택칙재원유적특정집중선택일개자집,선택출적특정자집중불재함유여수거분석임무상관성불대혹용여적나부분특정,기결과가능인기신식주실.인이현유적수거강유방법궤호도불시보진강유,기강유후적수거부괄합특정적후속수거분석임무,인이지능산시특정수거분석임무적전기수거예처리.종다중가설검험방법적각도분석료고유수거보진강유적방법급연구적관건소재.