计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2012年
12期
1467-1470
,共4页
特征选择%质谱%F-score%偏最小二乘判别分析
特徵選擇%質譜%F-score%偏最小二乘判彆分析
특정선택%질보%F-score%편최소이승판별분석
feature selection%mass spectra%F-score%partial least square-discriminant analysis
提出了一种基于偏最小二乘判别分析和F-score的特征筛选方法,并将其用于蛋白质组学质谱数据分析.该方法主要包含3个步骤:(1)用LIMPIC算法对原始数据进行预处理;(2)计算每个变量的F-score值并将所有变量按F-score值降底的顺序排列;(3)采用偏最小二乘判别分析交互检验按前向选择法选择最佳变量子集.用本方法对一组结肠癌数据进行分析,最终从原始的16331个质荷比变量中选择了8个特征质荷比作为潜在的生物标记物.用所选择的特征对独立测试集的样本进行判别,其灵敏度和特异性分别达到了95.24%和100%.结果表明,所提出的方法可用于蛋白质组学质谱数据的特征筛选及样本分类.
提齣瞭一種基于偏最小二乘判彆分析和F-score的特徵篩選方法,併將其用于蛋白質組學質譜數據分析.該方法主要包含3箇步驟:(1)用LIMPIC算法對原始數據進行預處理;(2)計算每箇變量的F-score值併將所有變量按F-score值降底的順序排列;(3)採用偏最小二乘判彆分析交互檢驗按前嚮選擇法選擇最佳變量子集.用本方法對一組結腸癌數據進行分析,最終從原始的16331箇質荷比變量中選擇瞭8箇特徵質荷比作為潛在的生物標記物.用所選擇的特徵對獨立測試集的樣本進行判彆,其靈敏度和特異性分彆達到瞭95.24%和100%.結果錶明,所提齣的方法可用于蛋白質組學質譜數據的特徵篩選及樣本分類.
제출료일충기우편최소이승판별분석화F-score적특정사선방법,병장기용우단백질조학질보수거분석.해방법주요포함3개보취:(1)용LIMPIC산법대원시수거진행예처리;(2)계산매개변량적F-score치병장소유변량안F-score치강저적순서배렬;(3)채용편최소이승판별분석교호검험안전향선택법선택최가변양자집.용본방법대일조결장암수거진행분석,최종종원시적16331개질하비변량중선택료8개특정질하비작위잠재적생물표기물.용소선택적특정대독립측시집적양본진행판별,기령민도화특이성분별체도료95.24%화100%.결과표명,소제출적방법가용우단백질조학질보수거적특정사선급양본분류.