计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
9期
243-247
,共5页
魏莎莎%陆慧娟%安春霖%郑恩辉%金伟
魏莎莎%陸慧娟%安春霖%鄭恩輝%金偉
위사사%륙혜연%안춘림%정은휘%금위
互信息最大化%模型无关%遗传算法%基因选择
互信息最大化%模型無關%遺傳算法%基因選擇
호신식최대화%모형무관%유전산법%기인선택
Maximum mutual information%Model-free%Genetic algorithm%Gene selection
针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高.为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率.MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高.
針對大規模基因芯片高維度的基因錶達數據存在大量無關和冗餘特徵可能降低分類器性能的問題,提齣瞭一種基于互信息最大化方法(MMI)和與遺傳算法的模型無關的基因選擇方法來將特徵選擇轉化為全跼優化問題,其中的適應度函數定義為類間距離與類內距離之比,適應程度高.為瞭評價算法的性能,採用3箇數據集進行瞭實驗,結果錶明MMIGA-Selection取得瞭較好的效果,在每箇數據集上穫得瞭較高的5摺交扠驗證正確率.MMIGA-Selection主要有兩箇優點:一是可以有效減少冗餘基因;二是模型無關性,選擇得齣的特徵子集可直接用于其他類型的分類器,分類精度較高.
침대대규모기인심편고유도적기인표체수거존재대량무관화용여특정가능강저분류기성능적문제,제출료일충기우호신식최대화방법(MMI)화여유전산법적모형무관적기인선택방법래장특정선택전화위전국우화문제,기중적괄응도함수정의위류간거리여류내거리지비,괄응정도고.위료평개산법적성능,채용3개수거집진행료실험,결과표명MMIGA-Selection취득료교호적효과,재매개수거집상획득료교고적5절교차험증정학솔.MMIGA-Selection주요유량개우점:일시가이유효감소용여기인;이시모형무관성,선택득출적특정자집가직접용우기타류형적분류기,분류정도교고.