北京生物医学工程
北京生物醫學工程
북경생물의학공정
BEIJING BIOMEDICAL ENGINEERING
2014年
1期
47-51
,共5页
李志文%蔡先发%韦佳%周怡
李誌文%蔡先髮%韋佳%週怡
리지문%채선발%위가%주이
主成分分析%线性判别分析%基因表达数据分类%维数约减
主成分分析%線性判彆分析%基因錶達數據分類%維數約減
주성분분석%선성판별분석%기인표체수거분류%유수약감
principal component analysis%linear discriminant analysis%gene expression data classification%feature reduction
目的 基因芯片技术对医学临床诊断、治疗、药物开发和筛选等技术的发展具有革命性的影响.针对高维医学数据降维困难及基因表达谱样本数据少、维度高、噪声大的特点,维数约减十分必要.基于主成分分析(principal component analysis,PCA)和线性判别分析(linear discriminant analysis,LDA)方法,有效解决了基因表达谱数据分类问题,并提高了识别率.方法 分别引入PCA和LDA方法对基因表达谱数据进行降维,然后用K近邻(K-nearest neighbor,KNN)作为分类器对数据进行分类,并分别在乳腺癌和卵巢癌质谱数据上.结果 在两类癌症质谱数据上应用PCA和LDA方法能够有效提取分类特征信息,并在保持较高分类正确率的前提下大幅度降低医学数据的维数.结论 利用维数约减的方法对癌症基因表达谱数据进行分类,可辅助临床医生发现新的疾病特征,提高疾病诊断的正确率.
目的 基因芯片技術對醫學臨床診斷、治療、藥物開髮和篩選等技術的髮展具有革命性的影響.針對高維醫學數據降維睏難及基因錶達譜樣本數據少、維度高、譟聲大的特點,維數約減十分必要.基于主成分分析(principal component analysis,PCA)和線性判彆分析(linear discriminant analysis,LDA)方法,有效解決瞭基因錶達譜數據分類問題,併提高瞭識彆率.方法 分彆引入PCA和LDA方法對基因錶達譜數據進行降維,然後用K近鄰(K-nearest neighbor,KNN)作為分類器對數據進行分類,併分彆在乳腺癌和卵巢癌質譜數據上.結果 在兩類癌癥質譜數據上應用PCA和LDA方法能夠有效提取分類特徵信息,併在保持較高分類正確率的前提下大幅度降低醫學數據的維數.結論 利用維數約減的方法對癌癥基因錶達譜數據進行分類,可輔助臨床醫生髮現新的疾病特徵,提高疾病診斷的正確率.
목적 기인심편기술대의학림상진단、치료、약물개발화사선등기술적발전구유혁명성적영향.침대고유의학수거강유곤난급기인표체보양본수거소、유도고、조성대적특점,유수약감십분필요.기우주성분분석(principal component analysis,PCA)화선성판별분석(linear discriminant analysis,LDA)방법,유효해결료기인표체보수거분류문제,병제고료식별솔.방법 분별인입PCA화LDA방법대기인표체보수거진행강유,연후용K근린(K-nearest neighbor,KNN)작위분류기대수거진행분류,병분별재유선암화란소암질보수거상.결과 재량유암증질보수거상응용PCA화LDA방법능구유효제취분류특정신식,병재보지교고분류정학솔적전제하대폭도강저의학수거적유수.결론 이용유수약감적방법대암증기인표체보수거진행분류,가보조림상의생발현신적질병특정,제고질병진단적정학솔.