计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2006年
9期
155-156,224
,共3页
任江涛%黄焕宇%孙婧昊%印鉴
任江濤%黃煥宇%孫婧昊%印鑒
임강도%황환우%손청호%인감
特征选择%遗传算法%聚类%基因表达数据
特徵選擇%遺傳算法%聚類%基因錶達數據
특정선택%유전산법%취류%기인표체수거
特征选择是模式识别及数据挖掘等领域的重要问题之一.针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因.针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标.实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度.
特徵選擇是模式識彆及數據挖掘等領域的重要問題之一.針對高維數據對象(如基因錶達數據)的特徵選擇,一方麵可以提高分類及聚類的精度和效率,另一方麵可以找齣富含信息的特徵子集,如髮現與疾病密切相關的重要基因.針對此問題,本文提齣瞭一種新的麵嚮基因錶達數據的特徵選擇方法,在特徵子集搜索上採用遺傳算法進行隨機搜索,在特徵子集評價上採用聚類算法及聚類錯誤率作為學習算法及評價指標.實驗結果錶明,該算法可有效地找齣具有較好可分離性的特徵子集,從而實現降維併提高聚類及分類精度.
특정선택시모식식별급수거알굴등영역적중요문제지일.침대고유수거대상(여기인표체수거)적특정선택,일방면가이제고분류급취류적정도화효솔,령일방면가이조출부함신식적특정자집,여발현여질병밀절상관적중요기인.침대차문제,본문제출료일충신적면향기인표체수거적특정선택방법,재특정자집수색상채용유전산법진행수궤수색,재특정자집평개상채용취류산법급취류착오솔작위학습산법급평개지표.실험결과표명,해산법가유효지조출구유교호가분리성적특정자집,종이실현강유병제고취류급분류정도.