华东理工大学学报(自然科学版)
華東理工大學學報(自然科學版)
화동리공대학학보(자연과학판)
JOURNAL OF EAST CHINA UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE)
2007年
2期
233-237
,共5页
QIAN Xi-yuan%钱夕元%倪中新%邵志清
QIAN Xi-yuan%錢夕元%倪中新%邵誌清
QIAN Xi-yuan%전석원%예중신%소지청
最优正交质心%特征选取%特征萃取%DNA微阵列%支持向量机
最優正交質心%特徵選取%特徵萃取%DNA微陣列%支持嚮量機
최우정교질심%특정선취%특정췌취%DNA미진렬%지지향량궤
微阵列数据具有样本小、维度高的特点,给数据分析带来了困难.因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的.本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比.利用挑选出的主基因,采用支持向量机(SVM)对数据样本进行了分类研究.通过实验,在经典的白血病数据集上,对于34个样本的测试集,达到了33/34的分类准确率,表明了本方法的适用性.
微陣列數據具有樣本小、維度高的特點,給數據分析帶來瞭睏難.因此,在生物信息學的研究和應用中,從微陣列數據裏挑選主基因(特徵選取)是十分重要和有意義的.本文採用基于最優正交質心特徵選取算法(OCFS)來挑選主基因,併與基于信譟比的主基因挑選法和基于遺傳算法的主基因挑選法進行瞭對比.利用挑選齣的主基因,採用支持嚮量機(SVM)對數據樣本進行瞭分類研究.通過實驗,在經典的白血病數據集上,對于34箇樣本的測試集,達到瞭33/34的分類準確率,錶明瞭本方法的適用性.
미진렬수거구유양본소、유도고적특점,급수거분석대래료곤난.인차,재생물신식학적연구화응용중,종미진렬수거리도선주기인(특정선취)시십분중요화유의의적.본문채용기우최우정교질심특정선취산법(OCFS)래도선주기인,병여기우신조비적주기인도선법화기우유전산법적주기인도선법진행료대비.이용도선출적주기인,채용지지향량궤(SVM)대수거양본진행료분류연구.통과실험,재경전적백혈병수거집상,대우34개양본적측시집,체도료33/34적분류준학솔,표명료본방법적괄용성.